熱線電話:13121318867

登錄
首頁精彩閱讀非常簡單而又非常完整的R語言主成分分析實例
非常簡單而又非常完整的R語言主成分分析實例
2018-03-04
收藏
非常簡單而又非常完整的R語言主成分分析實例
本篇文章不講有關主成分分析的理論知識,只講實際操作。
實例:(中學生身體四項指標的主成分分析)
在某中學隨機抽取某年級30名學生,測量其身高(X1)、體重(X2)、胸圍(X3)和坐高(X4),數據如下。試對這30名中學生身體四項指標數據做主成分分析

這些數據保存保存在students_data.csv中,該文件中的部分數據截圖如下:

現在開始做主成分分析
第一步:將students_data.csv中的數據讀入到程序中
data <- read.csv('D:/students_data.csv', header = T)   
注:header = T表示將students_data.csv中的第一行數據設置為列名,這種情況下,
students_data.csv中的第二行到最后一行數據作為data中的有效數據。header = F
表示不將students_data.csv中的第一行數據設置為列名,這種情況下,students_data.csv
中的第一行到最后一行數據作為data中的有效數據。
第二步:進行主成分分析
student.pr <- princomp(data, cor = T)
注:cor = T的意思是用相關系數進行主成分分析。
第三步:觀察主成分分析的詳細情況
summary(student.pr, loadings = T)
執行完這一步的具體結果如下:

說明:結果中的Comp.1、Comp.2、Comp.3和Comp.4是計算出來的主成分,Standard deviation代
表每個主成分的標準差,Proportion of Variance代表每個主成分的貢獻率,Cumulative
Proportion代表各個主成分的累積貢獻率。每個主成分都不屬于X1、X2、X3和X4中的任何一個。
第一主成分、第二主成分、第三主成分和第四主成分都是X1、X2、X3和X4的線性組合,也就是說最原始
數據的成分經過線性變換得到了各個主成分。然而并不是每個主成分的作用都非常關鍵,因此,我們只選
擇作用比較關鍵的幾個,一般地,選擇累積貢獻率達到八成的前幾個主成分即可(這個實例中我們選擇前
兩個,畢竟第二主成分的貢獻率也比較大)。
    接下來,在得到主成分的基礎上進行回歸也好進行聚類也好,就不再使用原始的X1、X2、X3和X4
了,而是使用主成分的數據。但現在還沒有各個樣本的主成分的數據,所以,最后一步就是得到各個樣本主成分的數據。
第四步:計算得到各個樣本主成分的數據
pca_data <- predict(student.pr)
得出的結果如下:

我們只保留Comp.1和Comp.2的數據即可。
結束:到此,大功告成,接下來可以做自己想做的事情了。



數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢