熱線電話:13121318867

登錄
首頁精彩閱讀數據分析也要講究打組合拳
數據分析也要講究打組合拳
2016-08-09
收藏

數據分析也要講究打組合拳

組合拳是拳擊拳法的一種,在進攻當中利用各種單一拳法的組合連續攻擊,使對手顧此失彼,達到擊中對手的目的。聯系到數據分析過程中,引申為采取一連套的方法實現一定的目標,而每一拳就是一種分析方法。

【我們遇到這樣一個問題】

美國洛杉磯 12 個地區的 5 個經濟指標調查數據(總人口、學校校齡、總雇員、專業服務、中等房價),為對這 12 個地區進行綜合評價, 請你出出主意,我們希望看到這12個地區中的某幾個區屬于同一類型,從而分而治之,有針對性的做出有意義的措施。


每個地區都有5個評價指標,不同地區的同一指標分布不同,一個地區的五個指標大小有別,差異顯著,現在要對著12個地區進行評價,這是一個十分苦惱的事情。

【單拳出擊:聚類分析——山重水復疑無路,柳暗花明又一村】

多個評價指標,希望分而治之,聚類分析無疑是非常棒的選擇,分類變量為總人口、學校校齡、總雇員、專業服務、中等房價:執行SPSS聚類過程:



12個地區最終分為幾類?每個類別又有哪些特征呢?這是聚類分析需要解決的細節。我們以分為3類來說明現在遇到的新問題,樹形圖讓我們十分清晰的看到每一次聚類的細節,哪些地區最先被歸并為一類,因為他們最相似,但是,我們對著樹形圖又能下什么結論呢,望洋興嘆吧,樹形圖就是大忽悠。

不妨看看每一類別下5個評價指標的均值比較吧,這似乎有所幫助,雖然還是一片混亂,但最少我們很容易發現,第二類在每一個指標中的均值都是糟糕的,急需政府加大管理、投資的力度,第一類的地區人口不算多,但各項指標的均值都是組內最高的,可以說第一類的1、4、5、10四個地區是不用美國政府操心了,但結論是我們依然沒有非常清晰的描述評價結果。

問題出在哪里?或許是用來評價地區經濟情況的指標過于多了吧!

【組合拳:左手因子分析,右手聚類分析,組合拳更具挖潛力】

我們已經意識到一直困擾我們的其實是評價指標過多,這就需要降維,因子分析算是不錯的選擇,嘗試是突破瓶頸的最好實踐辦法。接下來,我們試圖將總人口、學校校齡、總雇員、專業服務、中等房價這5個指標進行降維處理,不是直接踢出,而是尋找隱匿其中潛在的因素。

因子分析 是基于相關關系而進行的數據分析技術,是一種建立在眾多的觀測數據的基礎上的降維處理方法。其主要目的是探索隱藏在大量觀測數據背后的某種結構,尋找一組變量變化的“共同因子”。

提取前兩個因子,可以解釋5個指標的93.4%,在沒有損失太多信息的同時,獲得相對良好的解釋能力,這是一個穩賺不賠的賣賣。

旋轉之后的載荷結果令我們十分的滿意,因子1與“校齡、服務、房價”三個指標相關性極強,而這三項總是居民樂開花,地區教育水平高,多項服務,房價且不高,這是理想的居住場所,可以命名為“福利因子”,在看因子2,與“總人口、總雇員”極相關,這是“人口因子”。

5個評價指標,現在可以用2個因子來代替,此時來描述每個地區的經濟情況就非常的方便了,在此基礎上再“打一拳”,會有什么樣的驚喜?現在,聚類分析的步驟不變,參與聚類的變量為:福利因子和人口因子。

什么?你沒看錯,分類的結果和直接用聚類分析的結果是一致的,打組合拳和一拳的結果相同,覺得很遺憾是么?不,我們的最終分析目的是12地區的綜合評價,現在來看:

第一類地區,首先這些地區的福利因子較好,校齡、服務項目兩基礎設施方面都非常完善,但是享受好福利的同時,需要更多的錢購買房子,這是富人區吧。第二類地區,人口因子、福利因子都比較差,應當受到更多關注和支持。第三類,很明顯是人口眾多地區,但這里的居民未公平享受到各項福利,唯一心里安慰的是房價不高吧。

到此,我們可以看出,組合拳的結果更加豐富,在不真實反映地區經濟分類后,還挖潛出影響各地區排名的潛在因素,讓市政決策者能夠更加清晰的綜合評價各地區優缺點,有的放矢。

在確定分析目標之后,數據分析過程中不妨打出組合拳,將獲得更多收獲,找到更本質的解決方案。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢