
數據分析也要講究打組合拳
組合拳是拳擊拳法的一種,在進攻當中利用各種單一拳法的組合連續攻擊,使對手顧此失彼,達到擊中對手的目的。聯系到數據分析過程中,引申為采取一連套的方法實現一定的目標,而每一拳就是一種分析方法。
【我們遇到這樣一個問題】
美國洛杉磯 12 個地區的 5 個經濟指標調查數據(總人口、學校校齡、總雇員、專業服務、中等房價),為對這 12 個地區進行綜合評價, 請你出出主意,我們希望看到這12個地區中的某幾個區屬于同一類型,從而分而治之,有針對性的做出有意義的措施。
每個地區都有5個評價指標,不同地區的同一指標分布不同,一個地區的五個指標大小有別,差異顯著,現在要對著12個地區進行評價,這是一個十分苦惱的事情。
多個評價指標,希望分而治之,聚類分析無疑是非常棒的選擇,分類變量為總人口、學校校齡、總雇員、專業服務、中等房價:執行SPSS聚類過程:
12個地區最終分為幾類?每個類別又有哪些特征呢?這是聚類分析需要解決的細節。我們以分為3類來說明現在遇到的新問題,樹形圖讓我們十分清晰的看到每一次聚類的細節,哪些地區最先被歸并為一類,因為他們最相似,但是,我們對著樹形圖又能下什么結論呢,望洋興嘆吧,樹形圖就是大忽悠。
不妨看看每一類別下5個評價指標的均值比較吧,這似乎有所幫助,雖然還是一片混亂,但最少我們很容易發現,第二類在每一個指標中的均值都是糟糕的,急需政府加大管理、投資的力度,第一類的地區人口不算多,但各項指標的均值都是組內最高的,可以說第一類的1、4、5、10四個地區是不用美國政府操心了,但結論是我們依然沒有非常清晰的描述評價結果。
問題出在哪里?或許是用來評價地區經濟情況的指標過于多了吧!
我們已經意識到一直困擾我們的其實是評價指標過多,這就需要降維,因子分析算是不錯的選擇,嘗試是突破瓶頸的最好實踐辦法。接下來,我們試圖將總人口、學校校齡、總雇員、專業服務、中等房價這5個指標進行降維處理,不是直接踢出,而是尋找隱匿其中潛在的因素。
因子分析 是基于相關關系而進行的數據分析技術,是一種建立在眾多的觀測數據的基礎上的降維處理方法。其主要目的是探索隱藏在大量觀測數據背后的某種結構,尋找一組變量變化的“共同因子”。
提取前兩個因子,可以解釋5個指標的93.4%,在沒有損失太多信息的同時,獲得相對良好的解釋能力,這是一個穩賺不賠的賣賣。
旋轉之后的載荷結果令我們十分的滿意,因子1與“校齡、服務、房價”三個指標相關性極強,而這三項總是居民樂開花,地區教育水平高,多項服務,房價且不高,這是理想的居住場所,可以命名為“福利因子”,在看因子2,與“總人口、總雇員”極相關,這是“人口因子”。
5個評價指標,現在可以用2個因子來代替,此時來描述每個地區的經濟情況就非常的方便了,在此基礎上再“打一拳”,會有什么樣的驚喜?現在,聚類分析的步驟不變,參與聚類的變量為:福利因子和人口因子。
第一類地區,首先這些地區的福利因子較好,校齡、服務項目兩基礎設施方面都非常完善,但是享受好福利的同時,需要更多的錢購買房子,這是富人區吧。第二類地區,人口因子、福利因子都比較差,應當受到更多關注和支持。第三類,很明顯是人口眾多地區,但這里的居民未公平享受到各項福利,唯一心里安慰的是房價不高吧。
到此,我們可以看出,組合拳的結果更加豐富,在不真實反映地區經濟分類后,還挖潛出影響各地區排名的潛在因素,讓市政決策者能夠更加清晰的綜合評價各地區優缺點,有的放矢。
在確定分析目標之后,數據分析過程中不妨打出組合拳,將獲得更多收獲,找到更本質的解決方案。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《劉靜:10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda ...
2025-04-23