cda

數字化人才認證

首頁 > 行業圖譜 >

基于樹的建模-完整教程(R & Python)

基于樹的建模-完整教程(R & Python)
2016-05-06
基于樹的建模-完整教程(R & Python) 基于樹的學習算法被認為是最好的方法之一,主要用于監測學習方法?;跇涞姆椒ㄖС志哂懈呔?、高穩定性和易用性解釋的預測模型。不同于線性模型,它們映射非線性關 ...

機器學習算法需要注意的一些問題

機器學習算法需要注意的一些問題
2016-05-05
機器學習算法需要注意的一些問題 對于機器學習的實際運用,光停留在知道了解的層面還不夠,我們需要對實際中容易遇到的一些問題進行深入的挖掘理解。我打算將一些瑣碎的知識點做一個整理。 1 數據不平衡問 ...

隨機森林(RF, RandomForest)介紹

隨機森林(RF, RandomForest)介紹
2016-05-04
隨機森林(RF, RandomForest)介紹 隨機森林(RF, RandomForest)包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數而定。通過自助法(boot-strap)重采樣技術,不斷生成訓練樣本和測試樣本 ...
機器學習中的隨機森林模型
2016-04-21
機器學習中的隨機森林模型 01 樹與森林 在構建決策樹的時候,可以讓樹進行完全生長,也可以通過參數控制樹的深度或者葉子節點的數量,通常完全生長的樹會帶來過擬合問題。過擬合一般由數據中的噪聲和離群點 ...

機器學習—海量數據挖掘解決方案

機器學習—海量數據挖掘解決方案
2016-04-12
機器學習—海量數據挖掘解決方案 大數據時代里,互聯網用戶每天都會直接或間接使用到大數據技術的成果,直接面向用戶的比如搜索引擎的排序結果,間接影響用戶的比如網絡游戲的流失用戶預測、支付平臺的欺 ...

大數據挖掘技術之DM經典模型(下)

大數據挖掘技術之DM經典模型(下)
2016-04-07
大數據挖掘技術之DM經典模型(下) 接著上篇大數據挖掘技術之DM經典模型(上)文章,接下來我們將探討樸素貝葉斯模型、線性回歸、多元回歸、邏輯回歸分析等模型。 4、樸素貝葉斯模型 表查詢模型簡單有效 ...

R語言與機器學習(分類算法)支持向量機

R語言與機器學習(分類算法)支持向量機
2016-03-26
R語言與機器學習(分類算法)支持向量機 說到支持向量機,必須要提到july大神的《支持向量機通俗導論》,個人感覺再怎么寫也不可能寫得比他更好的了。這也正如青蓮居士見到崔顥的黃鶴樓后也只能嘆“此處有景道 ...
實現大數據,從小樣本中篩選海量樣本
2016-01-21
實現大數據,從小樣本中篩選海量樣本 從小樣本到大數據:概念與誤區 最近兩年產生并記錄的數據,總量占到人類文明以來所有數據總和的90%。我們源源不斷記錄著一切有價值的信息,世界和萬物的變化數據變成一 ...

大數據精準營銷中的個性化推薦與應用

大數據精準營銷中的個性化推薦與應用
2015-12-24
大數據精準營銷中的個性化推薦與應用 亞馬遜通過個性化推薦所獲取的交易額占總交易額的20%;雙十一期間,天貓和淘寶通過對數據的挖掘,使用了“千人千面”的個性化推薦;阿里CEO張勇在之后的媒體溝通會上肯 ...

欠擬合產生的原因有哪些?應該如何解決?

欠擬合產生的原因有哪些?應該如何解決?
2020-07-23
對于機器學習或者是深度學習模型來說,我們既希望這個模型能在訓練數據中表現良好(訓練誤差),又希望這個模型在測試集中也能有良好的表現(泛化誤差)。而過擬合和欠擬合就是用來描述泛化誤差的。欠擬合問題與過擬合 ...

正則化---提高深度學習模型的泛化能力

正則化---提高深度學習模型的泛化能力
2020-07-23
前面文章小編簡單給大家介紹了泛化能力的一些基礎知識,今天給大家帶來的是提高模型泛化能力的方法--正則化。 一、首先來回顧一下什么是泛化能力 泛化能力(generalization ability),百科給出的定義是:機器 ...

機器學習中的偏差和方差是什么?有哪些區別?

機器學習中的偏差和方差是什么?有哪些區別?
2020-07-20
偏差與方差是我們在機器學習中經常遇到的兩個概念,而且在有關機器學習的面試中,偏差與方差也經常拿來考驗面試者的機器學習的基礎知識。偏差與方差這兩者看似簡單,但要真正弄清楚兩者之間的聯系與區別,必須要下 ...

決策樹剪枝,常用這2種方法

決策樹剪枝,常用這2種方法
2020-07-09
前面我們了解了決策樹的概念,現在來了解一下決策樹剪枝??赡軙腥藛枺簽槭裁匆糁?答案是:如果一棵決策樹完全生長,那么這棵決策樹所對應的每一個葉節點中只會包含一個樣本,就很有可能面臨過擬合問題,因此 ...
XGBoost算法的這3類參數,你知道嗎?
2020-07-09
XGBoost是誕生于2014年2月的一種專攻梯度提升算法的機器學習函數庫,它有很好的學習效果,速度也非???,與梯度提升算法在另一個常用機器學習庫scikit-learn中的實現相比,XGBoost的性能可以提升10倍以上。還有,X ...

隨機森林(Random Forest)算法的優點和缺點都有哪些?

隨機森林(Random Forest)算法的優點和缺點都有哪些?
2022-12-23
隨機森林(Random Forests)現在機器學習中比較火的一個算法,是一種基于Bagging的集成學習方法,能夠很好地處理分類和回歸的問題。下面小編整理了隨機森林的優點和缺點,希望對大家有所幫助。 隨機森林有許多優 ...

3種常見集成算法模型的詳細理解

3種常見集成算法模型的詳細理解
2020-07-08
集成算法(Emseble Learning)是構建多個學習器,然后通過一定策略將這些學習器組合起來,讓它們來完成學習任務的,通??梢垣@得比單一學習顯著優越的學習器。 常見的集成算法模型有:Bagging、Boosting、Stack ...

對于KNN算法概念以及原理的簡單理解

對于KNN算法概念以及原理的簡單理解
2020-07-09
KNN的全稱是K-Nearest Neighbors,具體意思為K個最近的鄰居。KNN算法可以說是機器學習算法中最簡單、最基礎的算法了。既能用于分類,也能用于回歸。是通過測量不同特征值之間的距離來進行分類。 KNN的基本思路 ...

如何理解欠擬合?常用的處理方法有哪些?

如何理解欠擬合?常用的處理方法有哪些?
2020-07-08
一、欠擬合概念及理解 機器學習中欠擬合是一個常見的問題,簡單來說就是模型在訓練和預測時表現都欠佳的情況。一個欠擬合的機器學習模型不是一個良好的模型并且在訓練數據上表現不好這是顯而易見的。 圖 ...

最大后驗估計MAP是什么?它是怎么推導出來的?

最大后驗估計MAP是什么?它是怎么推導出來的?
2020-07-08
最大后驗估計(maximum a posteriori probability estimate), 簡稱為MAP。在貝葉斯統計學中,最大后驗估計是通過利用經驗數據獲得對未觀測量的點態估計。 與極大似然估計類似,不同的是,在似然函數后面多乘了一 ...
特征工程是什么?常用的方法有哪些?
2020-07-07
“數據決定了機器學習的上限,而算法只是盡可能逼近這個上限”,這里的數據指的就是經過特征工程得到的數據。特征工程指的是把原始數據轉變為模型的訓練數據的過程,它的目的就是獲取更好的訓練數據特征,使得機器 ...

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码