
2018-12-28
2018年12月21-25日,CDA數據分析研究院在金拱門(中國)有限公司進行了一場以“數據科學應用”為主題的內訓。上??偛扛鞑块T報名人數超出預期,共有50名員工參加了培訓。老師和數據分析部門的相關同事進行積極地交流,本次內訓取得圓滿成功。
內訓大綱:
第一階段:Python編程和數據整理精要
1.數據結構(list, dictionary,tuple等)
2.循環結構(對文本的遍歷)、使用函數
3.數組、numpy和pandas等
案例:
顧客就餐優惠券收集問題、顧客自回避隨機行走問題、顧客的正態分布函數問題
統計外賣訂單的字符個數、租房價格的分類匯總、足球運動員的數據清洗和整理等
第二階段:抽樣分布、假設檢驗和Logistic回歸模型
1.抽樣分布、隨機過程和隨機模擬,均值比例的參數統計和假設檢驗
2.分類變量的處理、模型的參數估計(掌握極大似然估計)
3.系數和結果的解釋、擬合優度、預測等
案例:
顧客排隊系統的泊松流分析、產品質量的假設檢驗等
不同年齡、性別的顧客購買意向分析、食品飲料機發生故障的次數分析等
第三階段:主成份分析和時間序列模型
1.主成份分析的原理、降維、綜合評價方法
2.時間序列數據的預處理、平穩時間序列的檢驗方法、差分
3.自相關與偏自相關系數、模型識別、參數估計
4.模型檢驗、模型優化、模型預測和分析等
案例:
某零售商為了研究其某款產品的銷售情況,收集了銷售額月度數據,根據此數據作時間序列分析和預測
完 謝謝觀看