熱線電話:13121318867

登錄
首頁精彩閱讀機器學習中的基礎知識(二)
機器學習中的基礎知識(二)
2019-02-19
收藏


在上一篇文章中我們給大家介紹了很多的機器學習中的基礎知識,機器學習的基礎知識是比較零碎的,但卻是十分重要的,所以我們要重視這些內容。在這篇文章中我們會繼續為大家介紹機器學習涉及到的基礎概念,希望大家能夠重視起來。


(1)候選采樣是一種優化訓練時間的方式,使用 Softmax 等算法計算所有正標簽的概率,同時只計算一些隨機取樣的負標簽的概率。這個想法的思路是,負類別可以通過頻率更低的負強化進行學習,而正類別經常能得到適當的正強化,實際觀察確實如此。候選取樣的動力是計算有效性從所有負類別的非計算預測的得益。

(2)標定層是一種調整后期預測的結構,通常用于解釋預測偏差。調整后的預期和概率必須匹配一個觀察標簽集的分布。

(3)分類模型是機器學習模型的一種,將數據分離為兩個或多個離散類別。分類模型與回歸模型成對比。

(4)類別是所有同類屬性的目標值作為一個標簽。

(5)類別不平衡數據集是一個二元分類問題,其中兩個類別的標簽的分布頻率有很大的差異。

(6)收斂就是訓練過程達到的某種狀態,其中訓練損失和驗證損失在經過了確定的迭代次數后,在每一次迭代中,改變很小或完全不變。換句話說就是,當對當前數據繼續訓練而無法再提升模型的表現水平的時候,就稱模型已經收斂。在深度學習中,損失值下降之前,有時候經過多次迭代仍保持常量或者接近常量,會造成模型已經收斂的錯覺。

(7)混淆矩陣就是總結分類模型的預測結果的表現水平的 N×N 表格。混淆矩陣的一個軸列出模型預測的標簽,另一個軸列出實際的標簽。N 表示類別的數量。在一個二元分類模型中,N=2。多類別分類的混淆矩陣可以幫助發現錯誤出現的模式。混淆矩陣包含了足夠多的信息可以計算很多的模型表現度量,比如精度和召回率。

(8)連續特征擁有無限個取值點的浮點特征。和離散特征相反。


通過上面對機器學習概念的描述,相信大家對于機器學習的知識有了一定的了解了吧?大家在進行學習機器學習的時候一定要重視這些知識,這樣才能夠做好機器學習知識的儲備。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢