
多變量分析:綜合排名方法
綜合排名問題是一個多變量分析技術!
近一時期排名非常時髦,形成了排名經濟,比如:胡潤富人排行榜,財富500強,慈善排名,城市競爭力排行,MBA商學院排名,大學排行榜等等!最近剛剛完成廣播電視節目綜合評估體系客體評估項目,其中也涉及到電視節目的綜合評估問題,特別是綜合排名問題。大部分情況下綜合評價問題都會涉及到排名,多指標排名問題。
記?。菏袌鲅芯炕蜃餮芯康娜藦膩聿慌琶?,只是做研究往往需要排名!
綜合排名是一項系統綜合評估研究方法,焦點是如何科學、客觀地將一個多維度、多評價指標問題綜合成為一個單指標形式,利用產生的綜合評價指數進行排名和評價。
綜合排名的的形成需要研究人員對評價對象進行大量基礎性數據分析基礎上,并依據專業知識和評價方法的認識,確定評估指標體系,對每個評價指標在綜合評價體系中的重要程度進行測算。研究人員需根據各指標的重要性確定了權重,據此對每項不同測量尺度指標進行修正后加權并標準化無量綱,最終采用多元統計分析方法對評價指標進行了系統最佳綜合,形成最終綜合評價。
主要包括以下幾個方面:
評估對象確定
評估范圍
評估分類
評估指標體系
評估權重
評估指標標準化
綜合方法
評估周期
評估發布
綜合評估問題涉及面比較廣,下面我們僅僅就綜合排名問題講講,我們采用大學研究生排行榜的數據進行綜合排名!我收集了某年的大學研究生排行榜,因為顯示的問題我僅僅截取了前20名,人民大學提到了前面進入第20名?。〝祿匆呀浻洸磺宄鎏幜耍?/span>
從上面我們可以看到:20家大學研究生院的綜合排名情況,最左邊一列是最初的排名,這個排名名次是按照六個指標得到了,六個指標分別是:
我這里并不關心這六個指標如何獲得,和數據準確性問題,我們只關心應該如何在現有指標下進行綜合排名問題!
當然,大家要關注這六個指標的測量尺度,取值范圍,量綱的大小等,你將來總不希望把噸和克進行相加吧!
方法一:等權重求和法 T1
我們先來看看,把現在六個指標求和,得到T1=P1+P2+P3+P4+P5+P6,然后按T1降序排名;
看到了嗎?該排行榜的發布就是用的加法,最簡單的方法!
從數據看以看出,指標P6與其它指標單位差異較大,簡單相加有缺陷,但是這種方法是大家最常用的,比如:高考錄取分數就是各門考試成績加總,得到總成績(高考成績),根據錄取人數取得分位點,然后確定錄取分數線,并排名從高到底錄??;當然碩士研究生錄取也是這種方法!
為什么要用這種方法呢?如果用復雜多變量方法,得到總指標排名,估計家長們或學生都要瘋了,都不知道自己如何能夠被錄取,算法不懂,怎么被錄??!顯然,其它方法是不能采用的,這是最好的可執行方案!
方法二:主觀加權求和法 T2
但是,錄取單位總是想能不能把偏科的人錄取,比如我看重數學、物理,這兩個指標應該權重更大些,比如我們假設考了6門課,我們根據經驗、主觀判斷、領導指示或專家評估最終確定:30:25:20:15:10:5的權重!
再次計算;T2=p1 * 0.30 + p2 * 0.25 + p3 * 0.20 + p4 * 0.15 + p5 * 0.10 + p6 * 0.05
我們按照T2降序排列,看一下排名,基本次序是一致的,只是在15名附近發生一點改變!
如果按照這種方式排名,首先所有指標應該在同一個量綱上,經常是在指標都是在100分制下,并且權重最好合計為1,最終得到的排名總分也是同樣量綱和尺度!
這種情況最適合綜合評價方式,加權平均啦!當然如何確定權重就成為關注的要點,科學性、合理性都需要明確!大部分綜合評估方法在最后都是采用這種排名方法!
方法三:秩綜合排名法 T3
什么是秩,秩序就是求次序!所有我們可以計算每個指標的秩,然后根據秩的大小進行求和!
從SPSS軟件可以選擇個案排秩,指定最大值=1,我們可以得到六個指標的秩指標次序!我們采用簡單加法求和和排名,看看結果如何?
計算 T3=Rp1 + Rp2 + Rp3 + Rp4 + Rp5 + Rp6,按照T3升序排列!
從T3升序排列看,這時候大致排名與原始沒有發生顛覆性變化,只是在前后名次上有了一定改變!
這種方法也是一種排名方法,經常用在比如世界杯最佳陣容或最佳球隊評選上,假如有六個記者或專家給所有球隊或球員選出最佳陣容或球隊時,往往比較可操作的方法是讓所有評價者給評價對象打分或者排名,排名更好操作,然后求和!
注意:往往評價者只會評出他最熟悉的,可能會產生缺省值問題,所以要根據每個評價者的情況和缺失情況進行缺省值處理!然后進行求和!
方法四:主成分排名法 T4
這種方法就是多變量分析技術了,主成分分析方法經常用來進行綜合評估和排名!有關主成分分析技術的相關內容我將在主成分分析專題講,這里還是關注如何進行排名!
主成分分析是根據指標和數據得到第一主成分,并根據第一主成分得分進行排名的方法!因為,第一主成分往往是凝聚了所有變量的最大變差,也就是解釋了6個指標的最大差異(解釋度),或者說最大綜合成分,排名就是找差異嗎?據此排名!
SPSS軟件沒有專門命名主成分分析,是與因子分析整合的,在選擇因子分析后,只要不進行旋轉,就可以得到主成分分析結果,記住把得分保存下來,我們可以要求保存所有主成分,六個指標得到六個主成分,但我們只要保存前兩個就可以了!
從主成分可以看出:第一主成分解釋了6個指標變差的72.409%,把保存的第一主成分按降序排列,我們看一下排名情況;
從排名順序我們看到,這種方法與方法二加權排名幾乎一樣,當然與簡單求和也基本一致!這說明,這種方法是能夠得到理想的綜合排名的?。ɡ碚撋险f,如果排名對象差異很大,不同方法得當的結果基本一致?。?/span>
同時,你可以看到,成分得分系數矩陣的第一主成分列,實際上就是基于數據驅動的權重啦,所以這種方法不需要事先得到主觀權重,完全數據驅動!但是,得到的只是排名,具體的排名得分沒有實際意義了,如果你希望得到排名的得分具有實際意義,顯然該方法會把人搞糊涂!但是我們也可以把主成分得分進行數值變化或映射,得到指數或什么規范得分!
說明:你也可以按照第二主成分進行排名,但這個時候完全不同了!
這里我們可以得到另外一種收獲,就是可以按照第一主成分和第二主成分進行散點圖分析,得到直觀分析!
你會看這種圖嗎?
方法五:主成分綜合加權法 T5
我們從上面一種排名方法看到,雖然按照第一主成分進行了排名,但第二主成分也解釋了21.894%,如果綜合將可以解釋數據的94.303%;(學術研究有時候更追求高解釋度),好了,現在我們可以按照主成分的解釋度作為權重,把兩個主成分進行加權求和!
計算:T5=FAC1_1 * 72.409 + FAC2_1 * 21.894
我們看看排名情況:
對照著第一列的原始排名,這時候排名結果發生了改變,特別是人民大學前進了幾名!
這時候,我們要看看排名的指標對排名的意義和影響了,我們可以分析看出,6個評價排名指標實際上主要是兩個維度,簡單說就是自然科學和社會科學維度,前面四種排名方法基本上權重都在自然科學維度上,第五種方法考慮了社會科學維度!
我們看一下因子分析結果,采用最大方差旋轉!
顯然,第一因子我們命名為:自然科學,第二因子命名:社會科學
所以,我說我們學??偸遣荒苓M入排行榜呢?原來所謂的排行榜就是看自然科學(工科類)的排名??!哈哈!
針對我們文科和藝術類學校,只能墊底啦!下次我要是排名,一定想法用復雜的排名技術,把我們學校排進去,相信我能做到這一點!或者咱們來個分類排名,反正咱有技術!開玩笑啦!
記住一點:方法五在采用的時候一定格外小心,因為主成分是正交的,不同方向能否綜合要記住,也就是數值越大越表示好,也就是兩個指標具有數值同向,才有可能滿足線性可加性!不行還是方法四比較妥當!
方法六:其它方法
你還可以采用因子得分進行排名,因子得分加權排名,所以主成分或因子加權排名等等!
排名方法大致就介紹到這里了,我的工作也就完成了!
至于排行榜的發布,可不是我的事了,這里的秘密可多了,商業的、行政的、領導的、媒體的、企業的各種因素都會最終影響排名和結果的發布~!到底最后怎么發布也有學問,大家好好學吧!
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
2025 年,數據如同數字時代的 DNA,編碼著人類社會的未來圖景,驅動著商業時代的運轉。從全球互聯網用戶每天產生的2.5億TB數據, ...
2025-05-27CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25