
每每談起主成分和因子有啥區別,樓主總是有種心里大概明白,但就是說不清的感覺,終于看到一篇帖子,從十個方面闡述了兩者的區別,留作紀念,同時也發給大家做個參考:
主成分分析(Principal components analysis,PCA)基本原理:利用降維(線性變換)的思想,在損失很少信息的前提下把多個指標轉化為幾個不相關的綜合指標(主成分),即每個主成分都是原始變量的線性組合,且各個主成分之間互不相關,使得主成分比原始變量具有某些更優越的性能(主成分必須保留原始變量90%以上的信息),從而達到簡化系統結構,抓住問題實質的目的。
因子分析(Factor Analysis,FA)基本原理:利用降維的思想,由研究原始變量相關矩陣內部的依賴關系出發,把一些具有錯綜復雜關系的變量表示成少數的公共因子和僅對某一個變量有作用的特殊因子線性組合而成。就是要從數據中提取對變量起解釋作用的少數公共因子(因子分析是主成分的推廣,相對于主成分分析,更傾向于描述原始變量之間的相關關系)。
因子分析是把變量表示成各公因子的線性組合;主成分分析中則是把主成分表示成各變量的線性組合。
主成分分析:不需要有假設(assumptions);
因子分析:需要一些假設。因子分析的假設包括:各個共同因子之間不相關,特殊因子(specificfactor)之間也不相關,共同因子和特殊因子之間也不相關。
(1)求解主成分的方法:
從協方差陣出發(協方差陣已知),從相關陣出發(相關陣R已知),采用的方法只有主成分法。(實際研究中,總體協方差陣與相關陣是未知的,必須通過樣本數據來估計);
注意事項:由協方差陣出發與由相關陣出發求解主成分所得結果不一致時,要恰當的選取某一種方法;
一般當變量單位相同或者變量在同一數量等級的情況下,可以直接采用協方差陣進行計算;對于度量單位不同的指標或是取值范圍彼此差異非常大的指標,應考慮將數據標準化,再由協方差陣求主成分。
實際應用中應該盡可能的避免標準化,因為在標準化的過程中會抹殺一部分原本刻畫變量之間離散程度差異的信息。此外,最理想的情況是主成分分析前的變量之間相關性高,且變量之間不存在多重共線性問題(會出現最小特征根接近0的情況);
(2)求解因子載荷的方法:
主成分法,主軸因子法,極大似然法,最小二乘法,a因子提取法。
主成分分析:當給定的協方差矩陣或者相關矩陣的特征值唯一時,主成分一般是固定的獨特的;
因子分析:因子不是固定的,可以旋轉得到不同的因子。
主成分分析:主成分的數量是一定的,一般有幾個變量就有幾個主成分(只是主成分所解釋的信息量不等),實際應用時會根據碎石圖提取前幾個主要的主成分。
因子分析:因子個數需要分析者指定(SPSS和SAS根據一定的條件自動設定,只要是特征值大于1的因子主可進入分析),指定的因子數量不同而結果也不同;
主成分分析:重點在于解釋個變量的總方差;因子分析:則把重點放在解釋各變量之間的協方差。
主成分分析:協方差矩陣的對角元素是變量的方差;
因子分析:所采用的協方差矩陣的對角元素不在是變量的方差,而是和變量對應的共同度(變量方差中被各因子所解釋的部分)。
(1)因子分析:
對于因子分析,可以使用旋轉技術,使得因子更好的得到解釋,因此在解釋主成分方面因子分析更占優勢;其次因子分析不是對原有變量的取舍,而是根據原始變量的信息進行重新組合,找出影響變量的共同因子,化簡數據;
(2)主成分分析:
第一:如果僅僅想把現有的變量變成少數幾個新的變量(新的變量幾乎帶有原來所有變量的信息)來進入后續的分析,則可以使用主成分分析,不過一般情況下也可以使用因子分析;
第二:通過計算綜合主成分函數得分,對客觀經濟現象進行科學評價;
第三:它在應用上側重于信息貢獻影響力綜合評價;
第四:應用范圍廣,主成分分析不要求數據來自正態分布總體,其技術來源是矩陣運算的技術以及矩陣對角化和矩陣的譜分解技術,因而凡是涉及多維度問題,都可以應用主成分降維。
(1)主成分分析:
可以用于系統運營狀態做出評估,一般是將多個指標綜合成一個變量,即將多維問題降維至一維,這樣才能方便排序評估;此外還可以應用于經濟效益、經濟發展水平、經濟發展競爭力、生活水平、生活質量的評價研究上;主成分還可以用于和回歸分析相結合,進行主成分回歸分析,甚至可以利用主成分分析進行挑選變量,選擇少數變量再進行進一步的研究。一般情況下主成分用于探索性分析,很少單獨使用,用主成分來分析數據,可以讓我們對數據有一個大致的了解。
幾個常用組合:
主成分分析+判別分析,適用于變量多而記錄數不多的情況;
主成分分析+多元回歸分析,主成分分析可以幫助判斷是否存在共線性,并用于處理共線性問題;
主成分分析+聚類分析,不過這種組合因子分析可以更好的發揮優勢;
(2)因子分析:
首先,因子分析+多元回歸分析,可以利用因子分析解決共線性問題;其次,可以利用因子分析,尋找變量之間的潛在結構;再次,因子分析+聚類分析,可以通過因子分析尋找聚類變量,從而簡化聚類變量;此外,因子分析還可以用于內在結構證實。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《劉靜:10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda ...
2025-04-23