熱線電話:13121318867

登錄
首頁精彩閱讀機器學習中的基礎知識(四)
機器學習中的基礎知識(四)
2019-02-19
收藏


在前面的文章中我們給大家介紹了很多有關機器學習的知識,這些知識都是十分有用的,掌握了這些知識我們才能夠做好機器學習知識的儲備。下面我們就給大家介紹一下機器學習中的基礎知識的其他部分,希望大家都好好學起來吧。


(1)假負類就是被模型錯誤的預測為負類的樣本。

(2)假正類就是被模型錯誤的預測為正類的樣本。

(3)假正類率的概念就是在ROC 曲線(ROC curve)中的 x 軸。FP 率的定義是:假正率=假正類數/(假正類數+真負類數)

(4)特征就是輸入變量,用于做出預測。

(5)特征列就是具有相關性的特征的集合,一個樣本的一個特征列中可能會有一個或者多個特征。特征的數據類型;一個特征是固定長度的或應該轉換為嵌入。一個特征列可以僅包含一個特征。

(6)特征交叉就是將特征進行交叉(乘積或者笛卡爾乘積)運算后得到的合成特征。特征交叉有助于表示非線性關系。

(7)特征工程就是在訓練模型的時候,決定哪些特征是有用的,然后將記錄文件和其它來源的原始數據轉換成上述特征的過程。

(8)特征集就是機器學習模型訓練的時候使用的特征群。

(9)特征定義就是描述所需的信息從 tf.Example 協議緩存中提取特征數據。因為 tf.Example 協議緩存只是數據的容器,必須明確以下信息:

(10)嵌入就是連續值特征的明確的特征。嵌入通常指將高維向量轉換到低維空間中。

在 TensorFlow 中,嵌入是通過反向傳播損失訓練的,正如神經網絡的其它參量一樣。

(11)經驗風險最小化就是選擇能最小化訓練數據的損失的模型函數的過程。和結構風險最小化(structual risk minimization)對照。

(12)集成就是多個模型預測的綜合考慮??梢酝ㄟ^以下一種或幾種方法創建一個集成方法,這些方法分別是設置不同的初始化、設置不同的超參量。設置不同的總體結構。而深度和廣度模型是一種集成。

(13)樣本就是一個數據集的一行內容。一個樣本包含了一個或多個特征,也可能是一個標簽。樣本有標注樣本和無標注樣本。


在這篇文章中我們給大家介紹了很多的知識,比如假正類、假負類、集成、特征集等知識,這些知識都能夠幫助我們深入地了解人工智能,希望這篇文章能夠給大家帶來幫助。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢