面板數據中基本效應的處理方法-CDA數據分析師官網

熱線電話：13121318867

登錄

首頁精彩閱讀面板數據中基本效應的處理方法

面板數據中基本效應的處理方法

2014-07-22

收藏

面板數據中基本效應的處理方法

面板數據（panel data）分析是實證金融領域研究者經常用到的方法。在很多面板數據中，殘差（residual）往往會和時間序列或企業相關，從而導致了普通最小二乘估計（OLS）中標準誤（standard errors）的偏誤。，美國西北大學金融學教授Dr. Mitchell Peterson于2009年在Review of Finance Studies發表了”Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches”的文章，在學術界頗有影響。其在文章中比較了不同標準誤的算法對于處理面板數據回歸分析中不同類別的估計偏誤的效果，并對各種類型的偏誤提出了指導性的建議。筆者在學習之余，基于個人的理解，試圖精簡、通俗地歸納Peterson文章的要義。

眾所周知，在進行標準二乘線性無偏估計的時候，我們假設殘差項是獨立同分布的（independent and identically distributed, i.i.d.）。而一旦此假設在實際數據中被打破，則估計就會出現偏誤（ bias ）。Peterson指出，在過去的很多實證金融文獻中，很多研究者實際上并沒有正確地選擇合適的方法，根據殘差項與時間或者企業的相關性來修正標準誤，或者它們只是盲目地跟從在他們之前其他文獻中的方法來修正偏誤，而事實上這可能完全是互相誤導。錯誤的標準誤會導致在判斷變量顯著性的時候給出不可靠甚至錯誤的結論，從而使得研究的可信度大打折扣。Peterson在文章當中對不同的面板數據結構所應采用的標準誤估計方法做出了考察和比較。

1. 只具有“企業固定效應”（firm fixed effect）的面板數據

首先我們明確什么叫企業固定效應。面板數據一般是二維的，具有時間和對象兩種要素。對象可以是個人、企業、國家等等。為了簡化文義，我們將對象改稱為企業，因為這也是金融實證數據中最為常見的對象。企業固定效應指的是，在面板數據的時間維度上，每一個個體企業都具有一個特有的特征能影響被解釋變量，而且這個特征會在整個時間維度上伴隨著這個企業，并且獨立于其他企業，換言之，不受其他企業影響。比如某個企業的管理能力是伴隨著這個企業的一個特征，它不受其他企業影響，并且在有限的時間維度內可以假設不變。

Peterson指出，在這種情況下，OLS的標準誤會被低估，因為每一個額外觀測值所能提供的真實信息量要小于OLS模型所假設具有的信息量。在這種情況下，研究者應采用群集標準誤（clustered standard errors），并且根據企業來群集。簡單地講，企業群集標準誤把同一個企業的變量在不同的時間點可能存在的相關性考慮進去了，從而提供一個修正了的標準誤。Peterson的論證指出，企業群集標準誤在處理具有企業固定效應的面板數據中的有效性是突出且可靠的。

除此之外，采用其他方法來估計標準誤可能會有潛在的問題產生。比如，OLS估計的標準誤會是有偏的，至于偏誤多少，則取決于殘差和變量存在多大的相關性。又如，用Fama-MacBeth兩階段回歸的方法也會產生偏誤（標準誤被低估），而且因為F-M方法的計算手段的關系，F-M會比OLS具有更大的偏誤。F-M的方法是被設計用于考慮橫截面相關的（在同一時點上不同觀測對象之間的相關性），而非序列相關（同一觀測對象在不同時點上的相關性），因此用在這里不合適。再如，用Newey-West的方法也會造成標準誤的低估。Newey-West的方法在于只考慮在同一群集內滯后期的殘差之間的相關性，而最大的滯后期是比面板數據所提供的時間維度小1。Peterson的實驗發現，隨著滯后期的上升，Newey-West的偏誤會逐漸減小，但因為最大滯后期的限制，其永遠無法消除估計上的偏誤。

2. 只具有“時間效應”（time effect）的面板數據

同樣的，先明確什么是時間效應。簡而言之，指的是在同一時點上的不同企業的變量之間存在著相關性。這可能由比如宏觀經濟狀況等某種外部因素所導致的，而這種因素會影響同一時點上的所有企業，但在跨時期中會出現獨立變化。

Peterson發現，當面板數據存在時間效應時，普通最小二乘估計依然會低估標準誤。而根據時間來群集的群集標準誤則可以提供相對準確的估計，但這只局限于當時間維度（即面板數據可提供的時點數）很大的時候。比如，當數據中只有很少的幾個年份的時候，群集標準誤也顯得不夠準確。

Peterson指出，在這種僅有時間效應的情況下，最理想的方法應當是采用Fama-MacBeth兩階段回歸法來估計標準誤。簡而言之，先對每一個企業的時間序列進行回歸，得到beta系數后，再將beta系數作為已知變量再進行橫截面數據的回歸。這種方法的要義在于，通過第一步來得到每個企業受各個變量影響而導致的超額收益，而其中還有一部分沒有觀測到的影響因素則受時間變化而變化，因此在第二步的回歸中，對同一時點上的所有企業做橫截面數據回歸，從而找出這些因素的影響，而這就是時間效應之所在。

3. 同時具有“企業效應”和“時間效應”的面板數據

根據前文所述，如果研究者有足夠的把握選取某一種方法（群集標準誤或者F-M法）來估計標準誤，她必須要保證面板數據只存在企業效應或者時間效應，而非同時存在兩種效應。但往往這是一種太過于理想化的假設。

Peterson指出，一種最通常的方法是：對某一個維度使用虛擬變量（dummy variable），然后使用另一維度的群集標準誤。一般在研究中比較常見的是，對時間取虛擬變量，然后做企業的群集標準誤，因為一般的面板數據都具有許多個企業，但未必有足夠多的時間點用來做時間群集標準誤。

再者，也可以在兩個維度上做群集，只要每個維度的數量足夠多。在這種方法上，Thompson（2006）提出了一種簡便的算法，即：

V_{firmtime}=V_{firm}+V_{time}-V_{white}

二維標準誤 = 企業群集標準誤 + 時間群集標準誤 – 穩健標準誤

其中穩健標準誤即為懷特標準誤（White standard errors），也是在處理異方差時最常用的穩健標準誤。

4. 結語

以上是面板數據中最基本的幾種效應的處理方法，但在實證中，有些情況會比較復雜。比如Peterson提到，有些時候企業效應是暫時性的，即隨著時間的推延，某些影響因素會漸漸消退。廣義線性估計（GLS）可以比較有效地估計隨機效應模型，但是如果殘差間的相關性隨著時間變化而消退，那么GLS的估計可能也是有偏的。對此，Peterson提出使用調整了的F-M方法來進行處理，但前提是殘差間相關性的消退應比較迅速，并且面板數據的時間維度要足夠充足。數據分析師培訓

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

特征最小二乘數據分析

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇隨機森林 vs XGBoost vs 決策樹：算法選擇中的

下一篇圖論在大數據分析中的作用！

數據分析師考試動態

考試介紹
考試大綱
考試內容
考試地點

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

更多

Copyright © 2015-2021, www.ruiqisteel.com All Rights Reserved. CDA數據分析師(北京國富如荷網絡科技有限公司) 版權所有京ICP備11001960號-9

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

OK

免費資料
免費試聽
訂制課程
職業規劃
認證考試

客服在線

日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊