
失業率(UnemploymentRate)是指失業人口占勞動人口的比率(一定時期全部就業人口中有工作意愿而仍未有工作的勞動力數字),旨在衡量閑置中的勞動產能,是反映一個國家或地區失業狀況的主要指標。通過對歷年各國和地區的失業率數據 行分析,我們可以對全世界在這幾十年的經濟波動情況有個大致的了解,同時我們對世界幾個大國的失業情況進行了模型擬合,最后我們還探究了中國從改革開放到2010年這30年的失業率的波動與通脹率的關系。
PART ONE——聚類分析
代碼如下:
libname ep ‘e:\saslx’;
proc import out=ep.saswork
datafile=”e:\saslx\saswork.xls”
dbms=excel replace;
sheet=”sheet1$”;
getnames=yes;
run;
proc print;
id country;
run;
data s1;
input coun$1-10 year91 year92 year93 year94 year95 year96 year97 year98 year99 year00 year01 year02 year03 year04 year05 year06 year07 year08 year09 year10 ;
datalines;
中國 2.3 2.3 2.6 2.8 2.9 3 3.1 3.1 3.1 3.1 3.6 4 4.3 4.2 4.2 4.1 4.0 4.2 4.3 4.1
中國香港 1.8 2 2 1.9 3.2 2.8 2.2 4.7 6.2 4.9 5.1 7.3 7.9 6.8 5.6 4.8 4.0 3.6 5.2 4.3
中國澳門 3 2.2 2.1 2.5 3.6 4.3 3.2 4.6 6.3 6.8 6.4 6.3 6 4.9 4.1 3.8 3.1 3.0 3.6 2.8
澳大利亞 9.6 10.5 10.7 9.5 8.4 8.3 8.4 7.8 7 6.4 6.8 6.4 5.9 5.5 5 4.8 4.4 4.2 5.6 5.2
奧地利 3.5 3.7 4.3 3.6 3.7 4.1 4.2 4.2 3.8 3.6 3.6 4 4.3 4.9 5.2 4.7 4.4 3.8 4.8 4.4
保加利亞 11.1 15.3 21.4 20 15.7 13.5 13.7 12.2 14.1 16.3 19.4 17.6 13.7 12 10.1 9 6.9 5.6 6.8 10.2
加拿大 10.4 11.3 11.2 10.4 9.5 9.6 9.1 8.3 7.6 6.8 7.2 7.7 7.6 7.2 6.8 6.3 6.0 6.1 8.3 8.0
捷克 4.1 2.6 4.3 4.3 4 3.9 4.8 6.5 8.7 8.8 8.1 7.3 7.8 8.3 7.9 7.1 5.3 4.4 6.7 7.3
丹麥 10.6 11.3 12.4 8 7 6.9 6.1 5.5 5.5 4.6 4.8 4.7 5.5 5.6 5 4.1 4.0 3.4 6.0 7.4
芬蘭 6.6 11.6 16.2 16.4 15.2 14.4 12.5 11.3 10.1 9.7 9.1 9.1 9 8.8 8.3 7.7 6.8 6.4 8.2 8.4
法國 9 10 11.1 12.3 11.6 12.1 12.3 11.8 10 8.5 7.8 7.9 8.5 8.9 8.9 8.8 8.0 7.4 9.1 9.3
德國 6.6 7.9 9.5 10.3 10.1 8.8 9.8 9.7 8.8 7.9 7.9 8.7 10 11 11.1 10.3 8.6 7.5 7.7 7.1
希臘 7.7 8.7 9.7 9.6 10 10.3 10.3 10.8 11.9 11.2 10.4 9.9 9.3 10.2 9.6 8.8 8.1 7.2 9.5 12.5
匈牙利 8.5 9.8 11.9 10.7 10.2 9.9 8.7 7.8 7 6.4 5.7 5.8 5.7 6.1 7.2 7.5 7.4 7.8 10.0 11.2
冰島 2.5 4.3 5.3 5.3 4.9 3.7 3.9 2.7 2 2.3 2.3 3.3 3.4 3.1 2.6 2.9 2.3 3.0 7.2 7.6
愛爾蘭 14.7 15.1 15.7 14.7 12.2 11.9 10.3 7.8 5.7 4.3 3.7 4.2 4.4 4.4 4.3 4 4.0 5.2 11.7 13.5
以色列 10.6 11.2 10 7.8 6.9 6.7 7.7 8.5 8.9 8.8 9.4 10.3 10.7 10.4 9 8.4 7.3 6.1 7.6 6.6
意大利 10.9 11.4 9.8 10.7 11.3 11.4 11.5 11.7 11.4 10.5 9.5 9 8.7 8 7.7 6.8 6.1 6.7 7.8 8.4
日本 2.1 2.2 2.5 2.9 3.2 3.4 3.4 4.1 4.7 4.7 5 5.4 5.3 4.7 4.4 4.1 3.9 4.0 5.0 5.1
韓國 2.3 2.4 2.8 2.4 2 2 2.6 6.8 6.3 4.4 4 3.3 3.6 3.7 3.7 3.5 3.2 3.2 3.6 3.7
荷蘭 7 5.5 6.2 6.8 7.1 6.6 5.5 4.3 3.6 3.1 2.5 3.1 4 5 5.1 4.2 3.5 3.0 3.4 4.5
新西蘭 10.3 10.3 9.5 8.1 6.3 6.1 6.6 7.5 7 6.1 5.4 5.3 4.8 4 3.8 3.8 3.7 4.2 6.1 6.5
挪威 5.5 5.9 6 5.4 4.9 4.8 4 3.2 3.2 3.4 3.6 3.9 4.5 4.5 4.6 3.4 2.5 2.6 3.1 3.5
菲律賓 9 8.6 8.9 8.4 8.4 7.4 7.9 9.8 9.8 11.2 11.1 11.4 11.4 11.8 7.8 8 7.3 7.4 7.5 7.3
波蘭 11.8 13.6 14 14.4 13.3 12.3 11.2 10.5 13.9 16.1 18.2 19.9 19.6 19 17.7 13.8 9.6 7.1 8.2 9.6
葡萄牙 4.1 4.1 5.4 6.7 7.1 7.2 6.7 4.9 4.4 3.9 4 5 6.3 6.7 7.6 7.7 8.0 7.6 9.5 10.8
羅馬尼亞 3 8.2 10.4 8.2 8 6.7 6 6.3 6.8 7.1 6.6 8.4 7 8 7.2 7.3 6.4 5.8 6.9 7.3
俄羅斯聯邦 0.1 5.2 5.9 8.1 9.5 9.7 11.8 13.3 12.6 9.8 8.9 7.9 8 7.8 7.2 7.2 6.1 6.3 8.4 7.5
西班牙 16.4 18.4 22.6 24.1 22.9 22.1 20.6 18.6 15.6 13.9 10.6 11.5 11.5 11 9.2 8.5 8.3 11.3 18.0 20.1
土耳其 8.1 8.3 8.8 8.4 7.5 6.5 6.7 6.8 7.7 6.5 8.4 10.3 10.5 10.3 10.3 9.9 10.3 11.0 14.0 11.9
瑞典 3 5.2 8.2 8 7.7 8 8 6.5 5.6 4.7 4 4 4.9 5.5 6 5.4 6.1 6.2 8.3 8.4
泰國 2.7 1.4 1.5 1.3 1.1 1.1 0.9 3.4 3 2.4 2.6 1.8 1.5 1.5 1.4 1.2 1.2 1.2 1.5 1.0
英國 8.4 9.7 10.3 9.6 8.6 8.2 7.1 6.1 6 5.4 4.9 5 4.8 4.7 4.6 5.4 5.3 5.3 7.5 7.8
美國 6.8 7.5 6.9 6.1 5.6 5.4 4.9 4.5 4.2 4 4.8 5.8 6 5.5 5.1 4.6 4.6 5.8 9.3 9.6
委內瑞拉 9.5 7.7 6.7 8.7 10.3 11.8 11.4 11.2 14.5 13.2 12.8 16.2 16.8 13.9 11.4 9.3 7.5 6.9 7.9 8.5
run;
proc cluster data =s1 method=average pseudo;
id coun;
proc tree;
run;
PST2偽t2值,在G=3和G=1處有峰值,由于最佳分類為它上面一種,故表明它支持4分類和2分類。PSF偽F值,在G=2和G=4處較大,也支持前面的結論。
倘若分為4類,則有
第一類:中國、日本、奧地利、韓國、中國香港、中國澳門、冰島、荷蘭、挪威、泰國、捷克
第二類:澳大利亞、英國、丹麥、新西蘭、加拿大、匈牙利、葡萄牙、瑞典、美國、羅馬尼亞、芬蘭、法國、意大利、希臘、德國、以色列、菲律賓、土耳其、俄羅斯聯邦、愛爾蘭
第三類:保加利亞、波蘭、委內瑞拉
第四類:西班牙
失業率數字被視為一個反映整體經濟狀況的指標,而它又是每個月最先發表的經濟數據,所以失業率指標被稱為所有經濟指標的“皇冠上的明珠”,它是市場上最為敏感的月度經濟指標。
從第一類分析出有許多亞洲國家都分為一類,可見地域差異對于失業率還是有影響,也可以推測同一地域的經濟狀況相似,因此失業率也比較相近;第一類也參雜了少量歐洲國家。
第二類中全是發達國家,各自的所在大洲也不一樣,但是,從失業率也可以反映他們的國家經濟情況變化在20年來應該是相近的。
第三類是第二類中未提及的歐洲發達國家與南美洲的一個國家合為一類,這一點上是有些奇怪的。
第四類西班牙獨自為一類,觀察數據發現,它的失業率一直以來居高不下,推測它可能一直都保持著這種水平,即經濟也似乎是不會變動太大的。
proc fastclus data =s1 maxclusters=4 out=fcl;
id coun;
proc sort data=fcl out = sortfcl;
by cluster;
proc print data=sortfcl;
run;
用快速聚類法也得到了同樣的分類結果,推測針對這些國家,分為4類確實比較適合。
PART TWO——模型擬合
我們想研究各國的失業率符合什么樣的模型,從而根據這個模型可以對失業率進行分析和預測,最后,如果幾乎所有的國家的失業率都屬于同一種模型,那我們就可以推斷這是失業率隨著年份的一般發展規律。由于國家眾多,所以選取我們感興趣的一些國家來做。
選取中國作為研究對象。
先通過畫圖看應該用哪種模型來擬合比較好。為了畫圖方便,把1991年看作是第一年,1992年看作是第二年,依次類推,2010年看作是第二十年。
從圖中可以發現圖形大致為S型。采用 logistic模型 。
由圖中的結果可以看出,模型擬合的很好,可以大致認為中國的失業率符合logistic模型??赡茉蚴请S著90年年以后教育力度的加強,高素質人才愈來愈多,導致失業率不斷上升,但是可能某一段時間的退休人數增加,加上國家的行業變得多樣化,企業數量增多,對人才的需求大,阻止了失業率的增長速度,但是還不足以抵消。
下面研究澳大利亞的失業率。
很顯然,logistic模型不再滿足澳大利亞的失業率變化,試用指數模型擬合一
發現結果還比較讓人滿意。由于對澳大利亞的國情不是很了解,不知道為什么他們的失業率會逐年下降,不過可以肯定的是,他們的政府起了很大作用。
再分析一下日本
Logistic模型和指數模型多不再滿足,用三角函數來擬合
模型的擬合結果還讓人滿意。據我所知,日本在六七十年代經歷了經濟的極端繁榮之后就開始走下坡,特別是到了九十年代末二十一世紀初的時候,各行各業失業的情況十分嚴重,可能這后經過一系列的經濟調整,情況有所轉變,但是到了08年,受到全球經濟危機的沖擊,失業率又上升了。
從以上三個實例可以看出,失業率沒有符合某一具體模型,而是根據不同國家的不同情況而有所變化。
PART THREE——中國失業率曲線分析
data china;
input y1980-y2010;
datalines;
4.9 3.8 3.2 2.3 1.9 1.8 2 2 2 2.6 2.5 2.3 2.3 2.6 2.8 2.9 3 3.1 3.1 3.1 3.1 3.6 4 4.3 4.2 4.2 4.1 4.0 4.2 4.3 4.1;
proc transpose out=china(rename=(_name_=year col1=rate));
run;
proc gplot;
plot rate*year;
run;
上圖所示為中國從改革開放至今(1980年-2010年)各年的失業率。
單從上圖曲線來看,可看出1980年的失業率較高,為4.9%,從1980年到1984年,失業率逐年降低,下降的速率也很快;1984年到1988年失業率呈現平穩波動;1988年到1989年間失業率陡增;1990年到2000年失業率呈現平緩上升的趨勢,2000年到2003年,失業率上升的速度加快;2003年到2010年失業率保持平穩波動。
一般情況下,失業率下降,代表整體經濟健康發展,利于貨幣升值;失業率上升,便代表經濟發展放緩衰退,不利于貨幣升值。若將失業率配以同期的通脹指標來分析,則可知當時經濟發展是否過熱,會否構成加息的壓力,或是否需要通過減息以刺激經濟的發展。
通貨膨脹(Inflation)指在紙幣流通條件下,因貨幣供給大于貨幣實際需求,也即現實購買力大于產出供給,導致貨幣貶值,而引起的一段時間內物價持續而普遍地上漲現象。
libname mywork ‘e:\sas\sas作業’;
proc import out=rate
datafile=’e:\SAS\通脹率.xls’
dbms=excel replace;
sheet=’sheet1$’;
getnames=yes;
run;
proc gplot;
plot _col1*_col0;
run;
上圖所示為改革開放近30年來的通脹率曲線。
下面我們對通脹率和失業率兩個圖進行對比分析:
1984年以前失業率的降低與通脹率似乎沒有多大關系,我認為這主要是改革開放的新政策極大促進了就業。特殊政策的影響太大了。從1984年以后來分析失業率與通脹率的關系比較合理。
從1984年到2000年,通脹率波動很大,失業率也處于一種波動狀態,通脹率開始上升的一年內,失業率有略微下降。通貨膨脹對刺激就業的作用是短期的,長期來說這種關系并不成立。而從兩個圖的對比中,我們也會發現,持續的通貨膨脹反而導致失業率上升。在經濟學中,有這樣一個基本原理:社會面臨通貨膨脹與失業的短期權衡取舍。大多數經濟學家認為在貨幣注入的短期效應會降低失業率。我們結合2000年到2009年這10年的數據來看,可看出政府在權衡取舍中,并沒有選擇通過發行過多貨幣來刺激就業,而是選擇了維持較低的通脹率,但這同時這就意味著失業情況無法從貨幣刺激這個方面得到改善。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25