機器學習中的概率問題-CDA數據分析師官網

熱線電話：13121318867

登錄

首頁精彩閱讀機器學習中的概率問題

機器學習中的概率問題

2018-03-13

收藏

機器學習中的概率問題

機器學習的過程可以理解為計算機通過分析大量的數據獲得模型，并通過獲得的模型進行預測的過程。機器學習的模型可以有多種表示，例如線性回歸模型，SVM模型，決策樹模型，貝葉斯模型。

概率類型

在理解概率模型之前，首先要理解的各種概率類型所表示的確切含義。

某事件發生的概率。

在某種條件下，事件A發生的概率，可以是基于歷史數據的統計，可以由背景常識得出，也可以是人的主觀觀點給出。一般都是單獨事件概率，如P(x),P(y)。

3.后驗概率

條件概率的一種特殊情況，它限定了事件為隱變量取值(不可觀測)，而條件為觀測結果。

表示多個事件同時發生的概率。

5.似然概率

條件概率的一種，針對參數而言，意思是某參數(某事件發生的概率)取得某一值得概率。

正向過程（普通概率）：給定參數后，預測即將發生的事件的可能性，以投擲硬幣為例，已知一枚均勻硬幣，投擲出正反面的概率均為0.5(給出的參數)，求投擲兩次硬幣都朝上的概率。

逆向過程（似然概率）：給定事件發生的可能性，求解參數為某一值得可能性，以投擲硬幣為例，已知一枚均勻硬幣，投擲兩次都是正面朝上(條件)，求正面朝上的概率為0.5的可能性是多少。

求正面朝上概率為x的似然：

通過計算不同的正面朝上的概率的可能性，可以得到一條似然函數曲線：

似然函數曲線

最大似然概率，最大似然概率，在已知觀測數據的條件下，找到使似然概率最大的參數值作為真實的參數估計。例如從似然函數曲線中可以得知，當PH=1時，似然函數取得最大值。

預測模型的概率表示

在這里我們假設已有的數據為X，可能出現的結果為Y，每一個可能的結果Y都對應一個給出數據X下的條件概率。

機器學習最終得到的結果是實現該條件的概率的最大化。

決策函數和條件概率

決策函數都是很熟悉了，在線性回歸，SVM，神經網絡中使用的都是決策函數Y=f(X)，在貝葉斯分類中使用的是條件概率分布P(Y|X)。

條件概率分布模型可表示成決策函數

決策函數中隱含著條件概率

例如在線性回歸模型中，通過不斷訓練是誤差平方最小化，而誤差平方最小化是根據極大似然假設推導而出的。

所以依據決策函數得到的結果滿足極大似然概率，同時滿足最大條件概率。

判別式模型和生成式模型

實現上述過程，基于是否對P(x|y)直接操作來區分有兩種策略：

判別式模型：由數據直接對P(x|y)或決策函數f(x)進行建模，例如線性回歸模型，SVM，決策樹等，這些模型都預先制定了模型的格式，所需要的就是通過最優化的方法學到最優參數Θ即可。

生成式模型:這種策略并不直接對P(Y|X)進行建模，而是先對聯合概率分布P(X,Y)進行建模，然后依據貝葉斯公式P(Y|X)=P(X,Y)P(X)間接的得到我們所期望的模型P(Y|X)，這種策略最常見的算法就是我們接下來要介紹的貝葉斯分類器算法

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

條件概率線性回歸機器學習 SVM 概率分布決策樹聯合概率先驗概率

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇回歸系列（一）| 怎樣正確地理解線性回歸

下一篇2020美國總統競選大戲開鑼，川普當選的奇跡會再發生嗎？

數據分析師考試動態

考試介紹
考試大綱
考試內容
考試地點

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

更多

Copyright © 2015-2021, www.ruiqisteel.com All Rights Reserved. CDA數據分析師(北京國富如荷網絡科技有限公司) 版權所有京ICP備11001960號-9

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

OK

免費資料
免費試聽
訂制課程
職業規劃
認證考試

客服在線

日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊