
以 CDA 認證的 LEVEL II 和 LEVEL III 大綱為核心,目標培養同時具有策略優化和數據挖掘能力的全棧數據挖掘人才,而非只懂“調算法包,跑代碼”的單一技能程序員。
課程內容兼顧培養每位學員的雙向技能,既有解決數據挖掘流程問題的橫向能力,又有解決數據挖掘算法問題的縱向能力。
數據挖掘流程問題的橫向能力要求學備從數據治理根源出發的思維,通過數字化工作方法來探查業務問題,通過近因分析工具、宏觀根因分析等手段,再選擇業務流程優化工具還是算法工具,而非“遇到問題調算法包”。
數據挖掘算法縱向能力要求學生在使用算法解決微觀根因分析、預測分析的問題上,根據業務場景來綜合判斷,洞察數據規律,使用正確的數據清洗與特征工程方法,綜合使用統計分析方法、統計模型、運籌學、機器學習、深度學習、文本挖掘算法,而非單一的機器學習算法。
數據挖掘算法方向,是目前IT互聯網行業熱門的職業方向,國內數據挖掘人才的招聘市場,不管是現階段還是未來的至少五年到十年內,都持續保持供不應求的狀態。
數據挖掘工程師專注于用數據挖掘算法為企業挖掘數據中的金礦,為決策分析和預測分析提供強有力的支持,是提升企業核心競爭力的關鍵人才。
數據挖掘工程師遍布互聯網、電商、搜索、社交等眾多熱門行業,未來的人工智能、自動駕駛領域也將是數據挖掘工程師的舞臺,學會數據挖掘的你,也將是優秀企業最需要的數字化人才。
數據治理驅動因素、數據治理域、數據管理域、數據應用域、如何開展數據治理
解決企業數據治理問題,理清企業數據邏輯,提高企業數據質量與價值
領會數據分類中的主數據、交易數據和元數據概念;理解數據庫建模中概念、邏輯、物理模型之間的關系;掌握數據治理方法與方向
EDIT數字化模型簡介、業務探查(E)、問題診斷(D)、業務策略優化和指導(I)、算法工具介紹(T)
解決企業數據采集,數據模型構建,搭建數據之間的邏輯
領會數據分類中的主數據、交易數據和元數據概念;理解數據庫建模中概念、邏輯、物理模型之間的關系;領會數據庫范式的概念、數據倉庫和數據集市、ETL過程;掌握關系模型與維度模型的使用場景
數據采集方法、數據模型管理
解決企業數據采集,數據模型構建,搭建數據之間的邏輯
領會數據分類中的主數據、交易數據和元數據概念;理解數據庫建模中概念、邏輯、物理模型之間的關系;掌握關系模型與維度模型的使用場景
Python標準數據類型、控制流語句、自定義函數、異常和錯誤、類與面向對象編程、Python連接數據庫操作、Python編程面試題集訓
解決使用商業智能報表分析業務、監控業務的問題
具備Python代碼編寫閱讀能力; 掌握基本的Python語法;熟悉面向對象的原理;掌握Python數據庫編程;
Numpy數組基礎操作、Pandas數據表的基本操作、Pandas數據探索、Pandas數據可視化、Python數據可視化包-Matplotlib介紹、Python數據可視化包-Seaborn介紹與圖形繪制
完成企業實際工作中的數據清洗、轉換等數據加工及可視化任務,為后續機器學習打下基礎
掌握數據清洗的方法與技巧;掌握數據常用可視化的方法與技巧
實戰案例:斯德哥爾摩氣候可視化分析、餐飲訂單數據清洗與分析、文本數據分析之QQ聊天記錄可視化分析
實際項目檢驗學習成果,學以致用,更加貼近實戰項目,達到學習價值
掌握Python綜合使用技能,掌握numpy與pandas的用法
先導課:抽樣方法、統計量及抽樣分布、參數估計與假設檢驗、統計分析與Python實戰、線性規劃與二次優化; 實戰案例:關于飲料消費的統計學分析、快遞公司的路線策略優化
使用統計分析和運籌學的基礎知識來解決與企業策略優化相關的問題,比如快遞路線優化問題、商品價格定價策略問題等等。
熟悉常見統計分布的特點與應用;熟悉假設檢驗的基本概念與方法;掌握T檢驗、方差分析的方法步驟;掌握線性規劃與二次優化
數據分析方法論介紹、方差分析、回歸分析、分類數據分析、邏輯回歸、數據降維、時間序列分析、實戰案例:金融客戶行為特征分解與營銷策略優化、汽車行業銷售預測與經營戰略優化、基于廣義線性模型的汽車保險分類定價策略的優化、收益率的系列預測、基于時間序列的機
可完成電商、金融、互聯網等行業的用戶行為分析與預測,商業策略分析等工作。
熟悉數據分析方法與步驟;掌握方差分析與應用,回歸分析與應用,分類數據分析方法,時序數據的分析預測方法
用戶標簽體系設計原理、用戶標簽的制作方法、標簽體系的用戶畫像應用、實戰案例:用戶行為在營銷活動的價值分析、自動預警指標推送功能框架的搭建、app靜默用戶觸動分析
可完成電商、金融、互聯網等行業的標簽體系的設計與應用任務。如構建業務指標體系、構建用戶畫像等高價值工作。
掌握用戶標簽體系設計原、熟悉用戶標簽的制作方法、熟悉用戶畫像的應用
數據挖掘概要、數據挖掘方法論、基礎數據挖掘技術、進階數據挖掘技術
理解和辨別數據挖掘算法在企業不同的工作場景中的應用,
熟悉數據挖掘的基本理論與技術
特征工程概要、特征建構、特征選擇、特征轉換、特征學習
正確理解特征工程,為提高模型效果,正確使用特征工程方法做準備
熟悉特征工程概念與原理;掌握特征工的構建,特征工的選擇、轉換
KNN-最近鄰分類算法:原理、實現、決策樹(分類樹及回歸樹)、聚類分析
本階段課程學習基礎機器學習算法,有分類算法與聚類算法。這些算法可應用在大部分的商業問題中:如信用評分、客戶畫像等。
掌握KNN算法原理與基于Python的應用;掌握決策樹算法原理、scikit-learn應用以及算法優化技巧;掌握K-means聚類算法原理及應用;熟悉保險行業客戶分群意義;掌握決策樹算法在客戶分群中的實際運用;
樸素貝葉斯、神經網絡與深度學習、支持向量機、集成方法 實戰案例:航空客戶價值分析綜合案例、基于集成算法的乳腺癌疾病預測、基于神經網絡的汽車燃油率預測
本階段課程學習高階機器學習算法與集成算法,這些算法在企業內的應用也比較多,如客戶流失預警、動態定價、客戶細分、欺詐檢測、垃圾郵件檢測、圖像分類與識別等。
掌握樸素貝葉斯算法原理與應用;掌握常見神經網絡算法的原理與應用;掌握SVM算法原理與應用,常見集成算法的原理;熟悉xgboost 、LightGBM算法原理;通過案例熟悉相關行業背景知識,并熟練運用算法;
關聯規則、序列模式、模型評估、實戰項目:推薦系統實戰
掌握推薦系統主要的算法,并能依據模型結果提供實際營銷建議。
掌握關聯規則的核心原理與應用;掌握序列算法的原理及應用; 熟悉模型評估算法;掌握模型評估算法原理及應用
實戰案例:以自動機器學習技術開發銀行業信用風險評分模型并進行最佳模型調參、以類別不平衡處理技術開發銀行業中小企業信貸營銷模型并進行最佳模型調參、以半監督式學習技術開發電信業客戶流失模型并進行最佳模型調參
可完成電商、金融、互聯網等行業中的分類、預測問題,如用戶購買預測、垃圾郵件檢測、商品精準推薦等等。
掌握自動機器學習原理;熟悉類別不平衡問題的解決方法;掌握半監督學習算法原理與應用,模型優化技巧
自然語言處理概要、分詞與詞性標注、文本挖掘概要、關鍵詞提取
可解決工作中自然語言處理相關問題,如輿情監控、用戶情感分析、語義分析、KOL畫像等工作。
熟悉自然語言處理的基本概念;掌握分詞以及詞性標注技術,文本挖掘技術流程方法,信息檢索技術
實戰案例:金融信用評分卡風控建模綜合項目實戰、以特征工程技術開發文本情感分析模型、以深度學習技術開發銀行業信用卡盜刷偵測模型、以圖像處理技術、深度學習及遷移學習技術,開發人臉口罩偵測模型
通過課程的學習,能完成評分卡建模、情感分析模型構建、信用卡盜刷偵測相關工作能力 。
綜合使用機器學習、深度學習、自然語言處理算法來解決金融、銀行、AI科技等行業的場景應用。
職業規劃、職場溝通力、團隊協作力培養
了解職業現狀和前景,解決職業溝通和團隊協作問題
專職職業導師培養職業規劃、職場溝通、以及團隊協作能力。
1V1面試技巧指導、簡歷修改
解決面試技巧不足、簡歷書寫不專業問題
專職就業老師1V1面試技巧輔導與簡歷修改指導。
何為數據產品經理?Python爬蟲、Python辦公自動化、數據挖掘項目選修項目
解決學員在不同數據崗位方向和行業方向的業務經驗和項目經驗不足的問題。
根據學員面試方向、就業方向來選擇合適的選修課程來進一步進修。
對口專業,高校數據科學、
統計相關專業在校生
職場晉升,從事數據相關崗位,
遇到職場晉升瓶頸
計算機相關
專業轉行人群
喜歡鉆研
數據科學的人群
涵蓋行業中的各個場景,運用自動機器學習技術、類別不平衡處理技術、半監督式學習技術、特征工程技術、深度學習技術、圖像處理技術、
深度學習及遷移學習技術等前沿挖掘模型,處理風控、信貸、客戶流失、情感分析、人臉偵測等廣泛的行業應用.
以自動機器學習技術開發銀行業信用風險評分模型并進行最佳模型調參案例本項目將介紹如何將機器學習中的數據預處理、特征選擇、算法選擇、模型優化等步驟,將其放在一個“黑箱”里,通過黑箱,我們只需要輸入數據,就可以得到我們想要的模型預測結果。學習并掌握自動機器學習的模型建構方法,并以銀行業信用風險評分為例,進行信用風險評分模型的自動化。
以類別不平衡處理技術開發銀行業中小企業信貸營銷模型并進行最佳模型調參案例本項目將介紹多個類別不平衡的處理方法,以有效地對少數類別做正確的預測,幫助組織制定適當的決策,并節省許多成本與損失。學習并掌握多個目標類別分布不平衡的處理方法,并以銀行業中小企業信貸營銷為例,進行信貸營銷模型的開發。
以半監督式學習技術開發電信業客戶流失模型并進行最佳模型調參案例,本項目將介紹多個半監督式學習的方法,從未標記目標字段的數據中,找出一些模型比較有把握的預測結果當作目標字段的標記,以提升整體分類模型的預測效能。
本項目將介紹多個特征工程的技術,從原始數據中,構建、提取、并選擇好的特征,并建置一個文本情感分析預測模型。學習并掌握多個特征工程的技術,并以文本情感分析預測為例,進行情感分析預測模型的開發。
本項目將通過利用信用卡的歷史交易數據,進行機器學習,構建信用卡反欺詐預測模型,提前發現客戶信用卡被盜刷的事件。學習并掌握常見信用卡盜刷的種類及信用卡盜刷的偵測的方法。學習信用卡盜刷的業務邏輯,發現關鍵業務結點,并掌握深度學習的建模能力。
本項目將以圖像處理技術并結合深度學習及遷移學習,開發人臉口罩偵測模型。學習并掌握圖像處理、深度學習及遷移學習的技術,并以人臉口罩偵測為例,進行人臉口罩偵測模型的開發。
解析數據分析業務全流程 厘清數字化人才技能需求
課程講師均為國內數據挖掘領域、人工智能領域、咨詢領域一線專家,具備深厚的學術背景與行業經驗。
同時他們也都具備豐富的講課經驗,累計講課經驗時長超過10000小時,授課能力得到長期實踐與驗證。
課程依據大量不同行業、不同崗位的企業內訓需求,結合主流的數據體系進行課程研發,課程內容更符合市場需求
課程的底蘊來自企業的信賴,上百家企業需求提煉,課程更貼合企業訴求。
自2015年以來,我們已為超過百家企業提供了內訓服務,見證了企業從數據分析中實現真正價值的全過程,越來越多的企業要求全員掌握數據化思維,對數據人才需求十分迫切。
課程大綱依據 CDA 的 「EDIT數字化人才模型」設計研發。CDA是數據人才認證標準,在國內由中成協大數據專業委員會監管
并是經國標委發布認定的數據分析師人才標準
該模型體現層次和縱深兩個方面
層次方面:強調戰略、管理、操作三個層級的業務部門人員均借助數據支持創造性的優化業務流程。 縱深方面:以數據使用區分企業的前、中、后臺,數據用戶即業務人員,數據加工者即技術人員。
專業度
師資
授課形式
講師經驗
課程內容
課程體系
內容覆蓋理論
內容覆蓋行業
項目課
課程迭代
學習效果
IT培訓機構臨時開設課程
本科IT程序員為主
視頻自學,有惑難解
以軟件開發經驗為主,與數據科學相關性不大
無授課經驗或IT開發授課經驗為主
工具堆砌
課程內容東拼西湊不成體系
機器學習為主
互聯網企業為主
視頻自學與視頻直播為主
無
視頻自學一年,不敢面對崗位
學員綜合素質測評
定制專屬職業路徑規劃
發放預習視頻
課前預習督導
學情回訪督學
班組長會議
關懷學員會議
班級會議
建立學員成長日記
意見收集反饋
1v1答疑
階段測試
共性問題串講
面試中技術支持
CDA 數據人脈圈
獵頭內推服務
免費CDA活動
免費資料
項目眾包
簡歷優化
面試教練
職業咨詢
面試邀約
市場趨勢分析
簡歷指導
數據分析業務流
面試技巧
萬人報名
千人參加
行業大咖
盡情交流
專屬實名制社群
線上線下不定期分享
分享適合你的
數據分析報告
領域研習交流
行業大牛講座
技術大牛分享
緊跟科技前沿
上百家企業
獵頭對接
助力職場晉升
突破職業瓶頸