熱線電話:13121318867

登錄
首頁CDA發布好課推薦丨CDA建模分析師-R語言
好課推薦丨CDA建模分析師-R語言
2017-07-13
收藏
“雖然是本科畢業,但是在看數據挖掘方面的算法理論時經常感覺一些公式的推導過程如天書一般,例如看svm的數學證明,EM算法,凸優化… 感覺知識跳躍比較大, 是我微積分學的不好還是中間有什么好的教材補充一下,數據挖掘系統的學習過程是怎么樣的,應該看那些書(中文最好)?“

——以上是一位咨詢的學員像我們提出的疑問。和這位同學相似,很多同學在入門數據挖掘領域遭到了極大的阻力,也喪失了繼續學習的興趣。那么,正確入門數據挖掘領域的姿勢是什么呢?

這是一個不太好回答的問題,管中窺豹,建議大家看一下以下的一些見解。
一、在學習數據挖掘之前你需要明了的幾點:
1. 數據挖掘目前在中國的尚未流行開,猶如屠龍之技;
2. 據挖掘本身融合了統計學、數據庫、機器學習、模式識別、知識發現等學科,并不是新的技術。
3. 數據挖掘之所以能夠應用不是因為算法,算法是以前就有的。數據挖掘應用的原因是大數據和云計算。比如阿法狗的后臺有上千臺計算機同時運行神經網絡算法;
4. 數據初期的準備工作,也稱Data Warehousing。通常占整個數據挖掘項目工作量的70%左右。在前期你需要做大量的數據清洗字段擴充的工作。數據挖掘和報告展現只占30%左右;
5. 數據挖掘技術更適合業務人員學習(相比技術人員學習業務來的更高效)

二、目前國內的數據挖掘人員工作領域大致可分為三類。
1)數據分析師:在擁有行業數據的電商、金融、電信、咨詢等行業里做業務咨詢,商務智能,出分析報告;
2)數據挖掘工程師:在多媒體、電商、搜索、社交等大數據相關行業里做機器學習算法實現和分析;
3)科學研究方向:在高校、科研單位、企業研究院等高大上科研機構研究新算法效率改進及未來應用。

三、你自己的定位與學習。
基于以上一點的介紹,你大概可以明確你需要努力的方向。如果你不是致力于科研方向,那么你需要掌握如下的技能:

1.需要理解主流機器學習算法的原理和應用。按照需要解決的問題,主要分為三大類,見下圖:



2.需要熟悉至少一門編程語言。如R,Python,SPSS Modeler,SAS,WEKA等。
關于軟件,有三個原則:只要能達到目標的軟件就是好軟件;你研究的領域啥軟件好用就用啥軟件;不要妄想用一個軟件解決所有問題。
3.需要理解數據庫基本原理,能夠熟練操作至少一種數據庫,如Mysql,OracelDB2等。

4.熟悉數據挖掘常見的運用場景。如客戶生命周期管理、客戶畫像和客戶分群、客戶價值預測模型構建、推薦系統設計等。這些需要依托于不同行業。下圖位CRM管理運用場景示例:



5. 經典圖書推薦
數據挖掘:概念與技術》、《數據挖掘導論》、《機器學習實戰》、《數據庫系統概論》、《R語言實戰》

當然,如果你能夠接觸到真實的數據挖掘項目和實戰,你的提升將會非???。CDA數據分析研究院開設的R語言數據挖掘課程,將世界客戶關系管理方面的領導者美庫爾公司(Merkle Inc)在專業管理咨詢方面的幾十年的經驗積累與CDA數據分析研究院的教學理念與方法相結合,歸納了在商業智能系統設計、客戶畫像、精準營銷、生命周期價值管理等主題的課程,結合R語言進行項目實操。感興趣的小伙伴們快來學習吧!

【課程信息】
北京&遠程:7月22-23,29-30,8月05-06日(6天)
授課安排:現場班5900元,遠程班4400元
(1) 授課方式:面授直播兩種形式,中文多媒體互動式授課方式
(2) 授課時間:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑) 
(3) 學習期限:現場與視頻結合,長期學習加練習答疑。

【報名流程】
1.在線填寫報名信息
官網端:
微信端:
2. 給予反饋,確認報名信息
3. 網上繳費
4. 開課前一周發送電子版課件和教室路線圖

【課程大綱】
第一階段:數據挖掘前沿與R語言
1.商業數據分析的本質
2.商業數據分析的階段與行業運用
3.商業數據挖掘通用方法論
4.R語言基礎
5.數據清洗方法
6.錯誤值、缺失值及噪聲值處理
7.變量壓縮
a.案例:貸款數據的數據清洗

第二階段:回歸建模分析方法
1.線性回歸建模與檢驗
2.回歸模型的模型評估
3.正則化方法
4.邏輯回歸介紹
5.分類模型的模型評估
6.極大似然法估計
7.模型評估方法
a.案例:信用卡客戶價值預測模型
b.案例:汽車貸款初始評分模型

第三階段:決策樹神經網絡建模
1.使用決策樹進行流失預警模型
2.決策樹建模方法
3.決策樹模型修剪
4.使用神經網絡進行營銷響應預測
5.感知器與BP神經網絡
6.徑向基神經網絡
7.深度學習及常用框架(Caffe、Tensorflow)
a.案例:電子產品客戶購買決策模型
b.案例:信貸產品行為評分模型

第四階段:分類器與組合模型
1.KNN最近領域建模
2.貝葉斯網絡
3.高級分類器:支持向量機( SVM)
4.封裝與提升
5.隨機森林與梯度樹
a.案例:婚戀網站客戶成功約會預測
b.案例:網站虛假注冊客戶識別
c.案例:客戶精準營銷案例

第五階段:客戶與市場分析方法
1.理解客戶畫像和客戶分群
2.客戶特征提取與FRM方法
3.層次聚類(Ward、Birch)
4.基于劃分的聚類(K-means)
5.譜聚類方法
6.基于密度的聚類(DBSCAN)
a.案例:某人壽保險公司客戶分群
b.案例:郵輪公司客戶分群

第六階段:推薦算法提升客戶價值
1.Apriori算法、FP-growth算法
2.順貫模型
3.推薦系統設計
4.模型生命周期
5.數據挖掘體系建設
a.案例:電商交叉銷售案例
b.案例:金融機構交叉銷售案例

【課程優惠】
1.全日制學生及CDA LEVEL Ⅰ老學員8折優惠;
2.三人及以上報名9折優惠,五人及以上8折優惠;
3.CDA LEVEL Ⅰ等級資格證書持有者立省1000元;
4.同時報名參加LEVELⅠ和LEVEL Ⅱ享受8折優惠。

聯系我們
電話:010-68411404
手機:18511302788(王老師)QQ:28819897102881989710  
      18500368335(孫老師)QQ:595302342
郵箱:wangzhenda@pinggu.org
      sunjing@cda.cn
—— Join Learn!







數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢