熱線電話:13121318867

登錄
2020-03-28 閱讀量: 1690
如何利用SPSS進行主成分分析?

主成分分析(principal component analysis)

  將多個變量通過線性變換以選出較少個數重要變量的一種多元統計分析方法。又稱主分量分析。在實際課題中,為了全面分析問題,往往提出很多與此有關的變量(或因素),因為每個變量都在不同程度上反映這個課題的某些信息。但是,在用統計分析方法研究這個多變量的課題時,變量個數太多就會增加課題的復雜性。人們自然希望變量個數較少而得到的信息較多。在很多情形,變量之間是有一定的相關關系的,當兩個變量之間有一定相關關系時,可以解釋為這兩個變量反映此課題的信息有一定的重疊。主成分分析是對于原先提出的所有變量,建立盡可能少的新變量,使得這些新變量是兩兩不相關的,而且這些新變量在反映課題的信息方面盡可能保持原有的信息。主成分分析首先是由K.皮爾森對非隨機變量引入的,爾后H.霍特林將此方法推廣到隨機向量的情形。信息的大小通常用離差平方和或方差來衡量。

 ?。?)主成分分析的原理及基本思想。

  原理:設法將原來變量重新組合成一組新的互相無關的幾個綜合變量,同時根據實際需要從中可以取出幾個較少的總和變量盡可能多地反映原來變量的信息的統計方法叫做主成分分析或稱主分量分析,也是數學上處理降維的一種方法。

  基本思想:主成分分析是設法將原來眾多具有一定相關性(比如P個指標),重新組合成一組新的互相無關的綜合指標來代替原來的指標。通常數學上的處理就是將原來P個指標作線性組合,作為新的綜合指標。最經典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來P個指標的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F1已有的信息就不需要再出現再F2中,用數學語言表達就是要求Cov(F1, F2)=0,則稱F2為第二主成分,依此類推可以構造出第三、第四,……,第P個主成分。

 ?。?)步驟

  Fp=a1mZX1+a2mZX2+……+apmZXp

  其中a1i, a2i, ……,api(i=1,……,m)為X的協方差陣Σ的特征值多對應的特征向量,ZX1, ZX2, ……, ZXp是原始變量經過標準化處理的值,因為在實際應用中,往往存在指標的量綱不同,所以在計算之前須先消除量綱的影響,而將原始數據標準化,本文所采用的數據就存在量綱影響[注:本文指的數據標準化是指Z標準化]。

  A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R為相關系數矩陣,λi、ai是相應的特征值和單位特征向量,λ1≥λ2≥…≥λp≥0 。

  進行主成分分析主要步驟如下:

  1. 指標數據標準化(SPSS軟件自動執行);

  2. 指標之間的相關性判定;

  3. 確定主成分個數m;

  4. 主成分Fi表達式;

5. 主成分Fi命名;

0.0000
3
關注作者
收藏
評論(0)

發表評論

暫無數據
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码