
2018-06-08
2018年5月23-25日,CDA數據分析研究院在中國電信股份有限公司北京研究院進行了一場以“人工智能之Python應用”為主題的內訓。中心各部門員工報名積極,共有70名員工參加了集中培訓。老師和數據分析部門的相關同事進行積極地交流,本次內訓取得圓滿成功。
內訓內容簡介
第一天: Python 編程基礎(均通過實際案例講解)
1. 語法初步
2. 數據結構(列表、字符串、元組、集合、字典和字符串)
3. 條件選擇結構和循環結構(隨機模擬)
4. 若干重要內置函數應用
5. 函數、模塊及其應用
6. 數組的使用
7. 文件的操作
8. 排序和查找、遞歸算法
9. 正則表達式簡介
10. 面向對象編程簡介
第二天:使用numpy、pandas等進行數據清洗和整理,統計分析
1. 整理數據(切片、產生隨機數、復制、廣播、排序等)
2. 數據索引和選擇的各種方法
3. 數據的分組、分割、合并、變形
4. 文本數據的處理技巧
5. 抽樣分布和假設檢驗(含非參數假設檢驗)
6. 線性模型的構建和預測(含回歸分析、離散因變量模型)
7. 主成份分析和因子分析
8. 列聯表和對應分析
9. 時間序列數據處理、建模和預測(ARIMA)
第三天:Python機器學習算法和數據挖掘案例實戰
1. 概率、逼近和EM算法原理和實例
2. 最近鄰k-NN算法及應用實例(客戶細分、數碼圖像識別)
3. 樸素貝葉斯(Naive Bayes)算法
4. 使用scikit-learn模塊進行機器學習的若干案例(含回歸、決策樹、支持向量機、梯度下降、集成學習、隨機森林等多種算法模型)
5. k-means聚類(無監督學習、如何確定最佳聚類數)
6. 特征工程及變量的選擇
7. 使用XGBoost 進行預測的經典案例(交叉驗證、格點搜索、參數尋優)
8. 再談Logistic回歸和案例分析
9. 文本挖掘原理和案例(分詞、TF-IDF準則、文本分類、非結構化數據分析)
10. 深度學習原理及其若干應用案例
參訓員工心得與評價
本次培訓內容豐富,基本涵蓋機器學習常用算法和技能,正是項目應用需要的。知識點比較多,拓展了自己的數據思維,對數據方法更深入了解,并且提升了動手實踐能力。先消化一段時間,希望后期與CDA數據分析研究院在專題類課程有更多交流和學習。
完 謝謝觀看