熱線電話:13121318867

登錄
首頁CDA發布站在巨人的肩膀上做數據挖掘與機器學習—R幫你實現
站在巨人的肩膀上做數據挖掘與機器學習—R幫你實現
2018-01-03
收藏

R語言由新西蘭奧克蘭大學Ross和Robert開發。

R語言是自由軟件,可以放心大膽地使用,且具有非常強大的統計分析和作圖功能,而且更重要的是R軟件具有非常豐富的網上資源,目前R軟件有3000多種貢獻包,幾乎可以實現所有的統計方法,目前大部分的頂級統計學家和計量經濟學家都使用R語言,而且越來越多的數據分析實務人員也開始使用R語言。

R語言具有簡單易學,功能強大,體積?。▋H40m左右),完全免費,可自由開發等特點,且R語言和S語言語法基本相同,絕大部分程序是互相兼容的。學習R軟件正成為一種趨勢。

R軟件最優美的地方是它能夠修改很多前人編寫的包的代碼做各種你所需的事情,實際你是站在巨人的肩膀上。——Google首席經濟學家Hal Varian


大數據時代數據分析的必備技能——R數據挖掘機器學習

時間2018年1月21-23日 (三天)初級;1月23-25日 (三天)高級

地點北京市海淀區首都體育學院

費用

初級:3300元 / 2800元 (僅限全日制本科生及碩士研究生優惠價)

高級:3600元 / 3100元 (僅限全日制本科生和碩士研究生優惠價)

全程:6000元 / 5400元 (僅限全日制本科生和碩士研究生優惠價)

(食宿自理)

安排上午9:00-12:00;下午2:00-5:00;答疑

初級班報名

高級班報名

全程班報名


講師介紹: 

      方匡南老師,統計學教授,博士生導師,耶魯大學博士后。主要研究:數據挖掘、應用統計。       2007年出版了國內第一本R語言中文教程《R語言統計分析軟件簡明教程》,并于2015年2月出版了《R數據分析:方法與案例詳解》,該書在同類書籍中銷售名列前茅,并被引入到臺灣地區出版。有10多年的R語言使用經驗和豐富的數據挖掘機器學習實戰經驗。曾先后在在 Journal of Multivariate Analysis、Scientific Reports(Nature子刊)、Computational Statistics and Data Analysis等國內外權威期刊發表論文70多篇。先后主持了國家自然科學基金、國家社科基金等多個項目。
       承擔了建行、華為等30個企業數據挖掘項目,有豐富的實戰經驗。有10年以上的數據挖掘培訓經驗,長期講授《數據挖掘》、《機器學習》等課程,講課生動活潑、深入淺出、以實際案例引出統計方法,再通過編程講解實際操作和結果分析,先后為50多家企業的技術人員做技術內心,為100多家企業的高管做大數據有關的理念培訓。

課程配套資料:
(1)提供一份精心準備的非常全面的R軟件入門和數據挖掘機器學習講義。
(2)提供課程源代碼1份和相應數據若干份。
特別贈送:方老師主講的R初級和高級視頻,價值1000元!



學員對象:

金融、醫療、通訊、咨詢、電子商務等領域的數據分析人員、數據挖掘工程師、數據科學家;

高校碩士生、博士生、青年教師等。


培訓目的和特色:

1. 讓學員快速入門并熟練掌握R語言,掌握如何利用R豐富的網上資料和幫助系統,學會基本的編程方法。

2. 以實際案例引入,深入淺出地講解如何使用R語言進行數據挖掘機器學習,讓學員不僅掌握R語言的使用,更重要的是學會數據挖掘機器學習的思想、原理和方法。
3. 學完本課程后,使學員基本上可以使用R語言進行實際的數據挖掘工作。尤其學會使用R語言對批量處理的實務數據分析,大大提高工作效率。


培訓內容目錄:
【初級班】

專題名稱

授課內容

第1講(3小時)

R語言入門


目標:掌握R語言的基本用法

1.R語言介紹

2.編輯軟件Rstudio使用

3.R程序包的載入與使用

4.數據對象及運算(向量、矩陣、數組、列表與數據框處理)


2(3小時)

數據讀寫

R基本編程


目標:掌握用R編寫函數和數據的讀寫

1. R數據讀入與讀出

    (讀入txt、xls、SPSS、SAS、stata以及數據庫文件)

2.R 函數編寫

3.R的條件與循環函數

4.高效編程技巧介紹


3(3小時)

數據預處理

探索性分析


目標:掌握數據預處理與探索性分析

1.數據預處理

2.缺失值處理

3.隨機數生成

4.常用統計方法的蒙特卡洛模擬

5.隨機抽樣

6.單變量數據分析與作圖

7.雙變量數據分析與作圖

8.多變量數據分析與作圖

案例1:統計作圖在調查數據中的應用

案例2:統計作圖在臨床醫學中的應用


43小時)

數據挖掘機器學習入門

線性回歸


目標:數據挖掘機器學習入門

1.何為數據挖掘機器學習

2.數據挖掘機器學習的主要研究內容

3.有監督學習與無監督學習區別

4.一元線性回歸

5.多元線性回歸

6.逐步回歸

案例1:廣告營銷計劃案例

案例2:信用卡債務預測案例

案例3:房價預測案例


5(3小時)

線性分類方法


目標:掌握經典線性分類方法及其應用

1.Logistic模型

2.LDA判別分類

3.QDA判別分類

案例1:信用卡違約預測案例

案例2:股價漲跌方向預測案例

第6講(3小時)

重抽樣方法

互動交流討論


目標:掌握經典重抽樣方法

1.驗證集方法

2.交叉驗證

3.Bootstrap方法

案例1:量化投資資產配置案例

案例2:汽車每加侖汽油里程數預測案例

互動交流討論


【高級班】

專題名稱

授課內容


1

線性分類方法


目標:掌握經典線性分類方法及其應用

1.Logistic模型

2.LDA判別分類

3.QDA判別分類

案例1:信用卡違約預測案例

案例2:股價漲跌方向預測案例


2(3小時)

重抽樣方法


目標:掌握經典重抽樣方法

1.驗證集方法

2.交叉驗證

3.Bootstrap方法

案例1:量化投資資產配置案例

案例2:汽車每加侖汽油里程數預測案例


3(3小時)

決策樹

組合預測


課程目標:掌握決策樹和組合預測方法及其實際應用。

1.CART決策樹

2.Bagging

3.隨機森林   

4.Boosting算法

案例1:棒球運動員薪水預測案例

案例2:心臟病預測案例

案例3:信用卡違約預測案例


4(3小時)

支持向量機


課程目標:掌握支持向量機分類方法

1.最大間隔分類器

2.支持向量分類器

3.支持向量機

案例1:基因表達數據案例

案例2:股票漲跌方向預測


5(3小時)

變量選擇與高維數據


目標:掌握數據挖掘中高維數據分析方法及其實際應用

1.LASSO

2.SCAD

3.MCP

4.Group  LASSO

案例1:基因篩選

案例2: 股票選股

6(3小時)

無監督學習

主成分分析

主成分回歸

聚類分析

目標:掌握無監督學習方法及其應用。

1.主成分分析

2.主成分回歸

3.Kmeans聚類分析

4.系統聚類分析

案例1:廣告支出主成分分析

案例2:犯罪率主成分分析

案例3:學生考試成績主成分分析

案例4:客戶細分聚類案例


優惠:

現場班老學員9折優惠;

同一單位三人以上同時報名9折優惠;

以上優惠不疊加。


報名流程:
1:點擊“初級班/高級班/全程班報名”,網上填寫信息提交;
2:給予反饋,確認報名信息;
3:網上訂單繳費(需要刷卡或對公轉賬的請報名后與我們聯系);
4:開課前一周發送課程電子版講義,軟件準備及交通住宿指南。

聯系方式:

魏老師
QQ:28819897142881989714  

Mail:vip@pinggu.org
Tel: 010-68478566

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢