
SPSS最優尺度:分類主成分分析
一、分類主成分分析(分析-降維-最優尺度)
1、概念:此過程在減少數據維數的同時量化分類變量。分類主成份分析也表示為縮寫詞CATPCA(代表categorical principal components analysis)。主成份分析的目標是將初始變量集縮減為表示初始變量中發現的大部分信息的較小不相關主成份集合。當大量變量妨礙有效解釋對象(主體和單元)間關系時,該方法最為有用。通過減少維數,您只需解釋少量主成份,而不是大量變量。
標準主成份分析假設數值變量間為線性關系。另一方面,通過最優尺度方法,可以將變量調整為不同級別。分類變量在指定維數內得到最優量化。因此,可以為變量間的非線性關系建模。
2、示例。分類主成份分析可用于以圖形方式顯示工作類別、工作部門、地區、旅行量(高、中、低)和工作滿意度之間的關系。您可能會發現兩個維占據了大量方差。第一維可能將工作類別與地區分開,而第二維可能將工作部門與旅行量分開。您可能還會發現較高的工作滿意度與中等旅行量相關。
3、統計量和圖。頻率;缺失值;最佳度量水平;眾數;按質心坐標、矢量坐標、每變量和每維總計解釋的方差;矢量量化變量的成份載荷;類別量化和坐標;迭代歷史記錄;轉換后變量和相關矩陣特征值的相關性;初始變量與相關矩陣特征值的相關性;對象得分;類別圖;聯合類別圖;轉換圖;殘差圖;投影質心圖;對象圖;雙標圖;三標圖和成份載荷圖。
4、數據。字符串變量值總是按升序字母數值順序轉換為正整數。用戶定義的缺失值、系統缺失值以及小于1的值都視為缺失值;可重新編碼值小于1的變量,或者給值小于1的變量加上一個常數,以使其成為非缺失值。
5、假設。數據必須至少包含三個有效個案。該分析基于正整數數據。離散化選項通過將其值分組成具有接近正態分布的類別,將自動分類小數值變量,并且將自動把字符串變量的值轉換為正整數??芍付ㄆ渌x散化方案。
6、相關過程。將所有變量調整為數值級別對應于標準主成份分析。在標準線性主成份分析中使用轉換后的變量可獲得交替繪圖功能。如果所有變量都有多名義尺度級別,則分類主成份分析等同于多重對應分析。如果需要處理的是變量集,則應使用分類(非線性)典型相關性分析。
二、選項(分析-降維-最優尺度-分類主要成分-選項)
1、附加對象。指定要其成為附加對象的對象的個案編號,或者對象范圍的第一個和最后一個個案編號,然后單擊添加。繼續操作,直到指定完所有附加對象。如果將某個對象指定為附加對象,則對于該對象將忽略個案權重。
2、正態化方法??梢灾付ㄓ糜跇藴驶瘜ο蟮梅趾妥兞康奈鍌€選項之一。給定分析中只能使用一種正態化方法。
2.1、主要變量。此選項可優化變量之間的關聯。對象空間中的變量坐標是成份載入(與主成分的相關性,如維和對象得分)。如果您主要對變量之間的相關性感興趣,這將非常有用。
2.2、主要對象。此選項可優化對象間的距離。如果您主要對對象之間的區別或相似性感興趣,這將非常有用。
2.3、對稱。如果主要對對象和變量之間的關系感興趣,則使用此標準化選項。
2.4、獨立。如果您想單獨檢查對象之間的距離和變量之間的相關性,請使用此標準化選項。
2.5、定制??芍付ǚ忾]區間[–1, 1]中的任何實數值。值為1等同于“主要對象”方法;值為0等同于“對稱”方法;值為–1等同于“主要變量”方法。通過指定大于–1小于1的值,可在對象和變量上分布特征值。此方法對于制作合適的雙標圖或三標圖很有用。
3、標準??梢灾付ㄔ撨^程可在其計算中執行的最大迭代次數。還可以選擇收斂標準值。如果上兩次迭代之間的總擬合之差小于收斂值,或者達到了最大迭代次數,則算法停止迭代。
4、標注圖??捎糜谥付ㄔ趫D中將使用變量和值標簽還是變量名稱和值。還可指定標簽的最大長度。
5、圖維數??捎靡钥刂圃谳敵鲋酗@示的維數。
5.1、顯示解中的所有維數。解中的所有維數都顯示在散點圖矩陣中。
5.2、限制維數。顯示的維數限制為繪制的對。如果限制維數,則必須選擇要繪制的最低和最高維數。最低維數的范圍可從1到解中的維數減1,并且針對較高維數繪制。最高維數值的范圍可從2到解中的維數,表示要在繪制維數對時使用的最高維數。此指定項適用于所有請求的多維圖。
6、配置??蓮陌渲玫淖鴺说奈募凶x取數據。文件中的第一個變量應包含第一維的坐標,第二個變量應包含第二維的坐標,依此類推。
6.1、初始。指定的文件中的配置將用作分析起點。
6.2、固定。指定的文件中的配置將用于擬合變量。擬合的變量必須選擇作為分析變量,但是因為配置是固定的,所以它們視為補充變量(因此不需要選擇它們作為補充變量)。
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《劉靜:10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda ...
2025-04-23