熱線電話:13121318867

登錄
首頁精彩閱讀CDA LEVEL 1 考試,知識點匯總《回歸分析》
CDA LEVEL 1 考試,知識點匯總《回歸分析》
2021-02-24
收藏

一、基本概念

1.線性回歸的出現

當被解釋變量和解釋變量都為連續型,且存在線性關系時,可以采用線性回歸對被解釋變量進行預測。

多元線性回歸的出現是非常自然的,由于在一元線性回歸中,因變量只能依賴一個自變量來解釋,換一句話說,就是我們 只能在一維空間中來解釋世界,這是十分糟糕的,畢竟事物之間的關聯是非常復雜的,只用其中一個變量來解釋,總是顯 得那么蒼白和無力。

下面我們就來以“房價”和“客戶價值”為因變量,探索一下影響他們的自變量。首先,影響房價的因素有哪些呢?

CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》
CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》

因此,我們不難發現,在用更多變量來解釋因變量,顯然會更加全面、豐富、合理和科學。與一元線性回歸類似,一個含

有k個自變量的多元線性回歸模型可以表示為:

y= Bo+Bixl+B2x2++bx+8

,β,B1,B,,為模型參數,E為誤差項,來解釋不能被自變量線性關系解釋的部分。

二、基本假設

多元線性回歸的基本假設

CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》

三、檢驗方法

1.線性關系假設——線性關系檢驗

CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》

2.線性關系檢驗——回歸系數檢驗

CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》

3.期望為0的假設

(1)假設檢驗方法:(圖形法)可以直接繪制散點圖,查看殘差是否對稱分布在0的兩側;(統計檢驗)可以用假設檢驗 中的t檢驗方法,其原假設為H0:E=0,具體操作將在案例中展示。

(2)假設失效的影響:如果殘差的期望不等于0,而等于其他的某個常數,那么這個常數就應該出現在多元線性回歸的常 數項內。

(3)假設失效解決方法:如果失效,考慮是否強制將常數項設置為,或考慮異常值問題。

4.同方差假設

假設檢驗方法:(圖形法)對殘差以及因變量的擬合值作圖。

如果沒有異方差,那么殘差和因變量擬合值構成的散點應該是完全 隨機的,其趨勢線應該是幾乎是水平的。上圖中間的趨勢線存在彎 曲,即存在一定的異方差。

CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》

除了作圖,我們也可以選擇Breusch-Pagan檢驗,注意該檢驗的原假設是同方差,備擇假設是異方差,這 樣讀者根據輸出的P值就可以直觀判斷了。

假設失效的影響:如果誤差是異方差的,那么OLS估計的標準誤差將不可靠。

假設失效解決方法:克服異方差性的影響,我們可以嘗試對因變量做一些非線性變換,如等等。

5.正態性假設

假設檢驗方法:(圖形法)做QQ圖。

QQ圖的解讀十分簡單,如果散點在直線上或者直線附近,那么我 們就可以認為數據是正態分布的,否則就任務不是正態分布。 對于正態分布的統計檢驗,我們可以選擇KS檢驗(Kolmogorov– Smirnov test),其原假設:數據是正態分布的。這樣讀者可以直 接根據輸出的P值來對檢驗結果進行分析。

CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》

假設失效的影響:如果誤差項不是正態分布的,則OLS估計的標準誤差將不可靠。然而對于正態性假設對于線性回歸的 重要性,目前各方還有一些有價值的觀點。

假設失效解決方法:關注樣本中兩端的異常值是否合理,如異常值不合理,可以考慮刪除異常值。也可以嘗試對變量做 非線性變換。

CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》

6.橫截面和時間序列數據在回歸建模上的差異

橫截面是指在同一時間平面上的數據,例如2013年各個上市公司的財報數據,如果研究其不同變量之間的線性關系,可 以用多元線性回歸模型。但是如果數據包含時間趨勢,例如2001-2018年全國各個省市的宏觀經濟指標數據,如果要研 究不同宏觀指標之間的線性影響,就要用面板回歸模型了(計量模型的一種)。

四、參數估計

1.多元線性回歸的參數估計

CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》

五、判定系數

CDA LEVEL 1 考試,知識點匯總《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回歸分析</a>》

六、例題精講

1. 工人月工資(元)依勞動生產率(千元)變化的回歸直線方程為y=60+90x,下列判斷正確的是( )?

A. 勞動生產率為1000元時,工資為50元

B. 勞動生產率提高1000元時,工資提高150元

C. 勞動生產率提高1000元時,工資提高90元

D. 勞動生產率為1000元時,工資為90元

答案:C 解析:根據回歸直線方程 y=60+90x 得到,勞動生產率為1千元時,工人月工資=60+90*1=150元,勞動生產率提高1千元 時,工資提高90元。

2. 以下哪個假設不是線性回歸分析的前提假設? A. 解釋變量之間必須嚴格獨立

B. 解釋變量之間不能強線性相關

C. 擾動項獨立同分布

D. 擾動項服從正態分布

答案:A 解析:回歸分析的前提假設中,包含解釋變量之間非線性相關、擾動項獨立同分布,擾動項服從正態分布。


更多考試介紹及備考福利請點擊:CDA 認證考試中心官網



數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢