熱線電話:13121318867

登錄
首頁大數據時代帶你弄清楚到底什么是合頁損失函數(hinge loss function)?
帶你弄清楚到底什么是合頁損失函數(hinge loss function)?
2020-07-30
收藏

損失函數,loss function的定義為:將隨機事件或其有關隨機變量的取值映射為非負實數以表示該隨機事件的“風險”或“損失”的函數。在機器學習中,損失函數經常被當作學習準則與優化問題相聯系,也就是通過最小化損失函數求解和評估模型。合頁損失函數就是常見的損失函數之一,今天小編就給大家分享什么是合頁損失函數。

一、合頁損失函數簡介

目標函數第一項為經驗損失或經驗風險,

就是合頁損失函數hinge loss function,其中下標“+”表示以下取正值。

我們將括號中的部分用z代替:

這也就代表著,如果樣本點:能夠被正確分類,并且函數間隔(也就是確信度):大于1時,那么損失就是0.否則損失就是:目標函數的第二項是系數為λ的w的L2范數,也就是是正則化項。

二、合頁損失函數圖像

根據上圖可以看書,合頁損失函數的形狀就像一個合頁,這也是合頁損失函數名字的由來。

其中橫軸表示的是函數間隔,下面我們來具體解釋一下函數間隔:

1.正負

樣本在被正確分類的情況下,y(wx+b)>0;

樣本在被錯誤分類的情況下,y(wx+b)<0y。

2.大小

y(wx+b)的絕對值代表著樣本距離決策邊界的遠近程度。y(wx+b)的絕對值越大,那也就代表著樣本距離決策邊界越遠。

由此,我們能夠得出:

如果y(wx+b)>0.那么y(wx+b)的絕對值越大,就代表著決策邊界對樣本的區分度越好

如果y(wx+b)<0時,那么y(wx+b)的絕對值越大,就表示決策邊界對樣本的區分度越差

從上圖中我們可以看出,

1)0-1損失

在樣本被正確分類的情況下,損失為0;在樣本被錯誤分類的情況下,損失為1.

2)感知機損失函數

如果樣本被正確分類,那么損失為0;如果樣本被錯誤分類,那么損失就為-y(wx+b)。

3)合頁損失函數

在樣本被正確分類同時函數間隔大于1時,合頁損失才會是0.否則損失就是1-y(wx+b)。

三、SVM損失函數

合頁損失函數又被稱為max-margin objective,它最主要的應用就是作為SVM的目標函數。

SVM支持向量機中,構造目標函數時,我們通常會選擇合頁損失函數作為損失函數。這也就意味著,合頁損失函數不僅需要分類正確,并且確信度足夠高時損失才是0.換句話說,合頁損失函數對學習有更高的要求。

SVM損失函數公式

其實,SVM損失函數就是合頁損失函數加上正則化項:

線性支持向量機原始最優化問題

等價于最優化問題

第二個約束條件成立

第一個約束條件成立。

兩個約束條件都成立,那么最優化問題


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢