
如何做商品信息數據分析和展現?
商品價格和人們生活息息相關,比如農產品價格波動不僅會對農民收入和農民生產積極性產生直接影響,更關乎百姓的日常生活和切身利益。經??葱侣効吹睫r民辛苦了一個季度的農作物全都爛在地里,因為價格太低廉,或者沒有銷路。雖然說物價波動是一種正常的經濟現象,但是在一定程度上物價穩,人心才穩,社會才穩。為保持經濟平穩健康發展、保障群眾生活,穩定物價,信息公開顯得尤為重要。價格監測和預測是維持物價穩定的一個重要環節。而對于商品價格、產量、以及銷路、銷量等數據公開,建立產品價格分析、監測、預測平臺可以為相關政府管理部門提供生產調控、決策分析的依據,成為農門種植的依據,避免盲目種植。國家也有譬如南菜北運、西果東送等等政策但是數據實時公開,友好的向全國人民展示我認為還有很大的提升空間。
實現過程:
針對從價格信息網抓取來的數據利用eclipse工作平臺開發出了商品信息數據分析及展現系統,實現了價格展示、價格分析、價格預測、居民消費指數分析、商品流通情況以及作物主要產地及產量的展示。價格分析包括價格走勢、價格對比(市場之間對比)、價格展示(各省對比)。價格預測最后采用基于時間序列的神經網絡算法做了初步短期價格預測。居民消費指數CPI作為反映消費者支付商品和勞務的價格變化情況,也是一種度量通貨膨脹水平的工具,主要包括同比環比及其漲跌情況、CPI構成比例以及各省月度CPI展示等。
分析結果以帶有時間軸的折線圖、柱狀圖、地圖熱力圖、餅狀圖形式展示,界面美觀,和用戶交互性強,簡單易懂。
一、數據獲取
獲取方式:
針對數據來源網站信息大多有規律的更新,但網頁數據結構保持不變,使用的方式有兩種:
1.使用Excel工具抓取
1)通過Excel從網頁導入數據,選中自己要導入的數據。
2)新建宏,重復上步操作
3)觀察數據發布的網頁地址規律,修改宏代碼
(使用該方法的好處是可用Excel對獲取來的數據進行數據處理)
2.使用RCurl爬蟲
(方便對抓回來的數據用R直接對數據進行相關分析計算)
數據處理:
因為各種原因,價格信息網提供的商品價格信息有數據單位不統一、商品名稱不規范、市場名稱前后不一、缺失值等等問題。經過對這些數據的分析和總結,對數據進行了統一商品名稱格式、規范市場名稱、規范數據單位、去重和缺失值5方面的處理。
存儲方式:
二、數據展現
展現方式:使用Echarts在網頁顯示。
展現內容:
1. 價格分析
① 價格走勢:
這里主要展示的是將爬取來的每日商品價格數據按商品類型取平均值(右側圖例選擇要查看的商品類型),做曲線圖。通過下面時間軸拖動、拉長查看某一范圍內的價格走勢;也可通過區域縮放按鈕查看某一段曲線的詳細走勢。
② 價格對比:
針對從濰坊物價信息網獲取來的數據,根據價格采集地點進行價格對比。大體分為兩類:超市價格和集市價格。以柱狀圖的方式可直觀的看出某天某種商品在不同地點的價格高低情況。如要查看2014-08-01的價格對比情況。
效果展示如下:
鼠標移動切換標簽展示集市商品價格對比。
③ 全國商品價格
在地圖上,以熱力圖的形式展現全國各省某種商品價格的高低。鼠標懸停顯示具體價格信息。
此外,可以具體到某省下的各市價格展示:
繼續往下深入,具體到某市下各區、鎮價格展示(以濰坊市為例):
2.居民消費指數
CPI (Consumer price index) 居民消費指數,反應通貨膨脹或者緊縮的程度,一般來講,物價全面的持續的上漲就會被認為發生的通貨膨脹。
① 同比環比(數據來自濰坊物價信息網)
可選擇查看整體CPI漲跌情況,或者影響CPI八大類中某一類CPI漲跌情況。
如選擇食品類,還可繼續查看食品類下的具體漲跌情況
效果展示如下:下方為時間軸,可以選擇相關年份查看
② CPI比例
用餅狀圖的方式可直觀展現八大類及其分類對整體CPI的構成影響。下方為時間軸,展現不同時間段的構成比例。
③ 各省月度CPI(下方為時間軸,可以選擇年月份查看)
3.商品流通情況
國家有南菜北運、西果東送的政策,友好的相關信息展示,為合理分配資源開辟市場提供相關決策依據。
效果展示如下:
4.各農作物主要產地
鼠標懸停顯示產地產量信息。
效果展示如下:
5.價格預測
主要包含兩部分:1 .價格預警 2.商品價格預測
價格預警:采用Ajax技術每隔一小時自動刷新屬于,紅色為預警標識。
計算上一周價格移動平均值,和當前價格做差,漲跌絕對值大于0.5紅色箭頭標識預警。
效果展示如下:
商品價格預測(以大白菜價格為例):
虛線為預測價格,實線為實際價格
三、數據預測
預測工具:rapidminer
數據來源:濰坊物價信息網
實現算法:基于時間序列神經網絡的短期價格預測
實現過程:
(以大白菜價格為例)
訓練集:選取2013-2014內大白菜的價格。
測試集:抽取1/3作為測試集。
預測模型:方案有兩種一是采用支持向量機SVM,二是采用神經網絡,下面對兩種模型進行評估。
指數平滑和移動平均
模型如下:
首先使用支持向量機進行移動平均和指數平滑的計算(這里窗口大小設為5,alpha設為0.8)
部分結果如下:
折線圖如下:
可以看出移動平均線和本期實際價格有一定誤差,而指數平滑出來的價格exponential_smoothing(本期價格)和本期價格基本重合,而趨勢線(trend藍線)效果不是很好。
再使用神經網絡進行移動平均和指數平滑的計算(參數設置如上)
部分結果如下:
折線圖如下:
可以看出時間序列幾何平均法(average)和本期價格誤差不大,而指數平滑exponential_smoothing基本和本期價格一致。趨勢線基本符合價格漲跌情況,在14年4月出現了大幅度上升,這樣就能發現價格異常的產品,從而對其價格預警。
為了評估模型預測的精度,加入時間序列包中Validation 操作符,并設定好相關參數。
Validation 操作符內部需要放置某種算法,這里采用支持向量機 SVM:
預測精度:
下面再采用神經網絡Neural Net 比較一下預測精度:
預測精度:
可以看出采用神經網絡預測精度高一些,所以下面采用神經網絡算法進行模型訓練及預測。
這里窗口大小設為5
模型如下:
預測結果如下:
紅色線為實際價格 ,藍色線為預測價格。
從圖中可以看出,預測價格基本還行。
不足與展望:
因為時間和能力有限,作品本身還有很大的提升空間。比如數據抓取和處理沒有實現完全自動化。數據預測因素單一,需要收集更多的數據來進一步產品價格預測精度,及時發現價格異常的農產品。商品價格波動的主導因素很復雜,像供需關系、生產成本、自然條件、科技發展、運輸存儲、國家政策、自然災害等都是造成價格波動的主導因素。這也為提高商品價格預測的精度帶來了很多困難。如何有效、準確的預測商品價格還需要繼續學習和研究。
自己對物價這方面的研究很有興趣,因為它和人們的生活息息相關,一方面對農民收入和農民積極性產生直接影響,另一方面又關乎我們每一個人的日常生活和切身利益。物價過高,漲速過快,就會造成百姓生活壓力過大、心里不安影響人們的幸福度。所以,促公開,推進信息價格透明化是一項很有意義的工作。穩定高效的商品智能分析系統可以增強相關部門決策的科學性、針對性和及時性,希望自己能夠通過進一步的努力更加完善。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25