熱線電話:13121318867

登錄
首頁精彩閱讀好課推薦丨CDA建模分析師-R語言
好課推薦丨CDA建模分析師-R語言
2017-05-05
收藏


數據科學家被認為是21世紀最性感也是最具發展前景的職業,目前有75%左右的數據科學家使用R語言,有35%左右的數據科學家將R語言作為首選統計分析工具。今天,我們來了解一下R語言的前世今生。

一、R的誕生

1992年,肉絲(Ross Ihaka)和蘿卜特(Robert Gentleman)兩個人在S語言(貝爾實驗室開發的一種統計用編程語言)的基礎上開始構思一種新的用于統計學分析的開源語言,直到1995年第一個版本正式發布。因為他們名字的第一個字母都是R,所以這門語言就被叫做R。這兩個人都是統計學教授出身,再加上R語言的生父S語言,所以R語言在統計學方面有著純正的血統!

如果你平時的工作會涉及到統計學,那么接觸R語言實在是太正常不過了。

二、R的發展

作為開源軟件的R能夠迅速發展,很大程度上取決于其活躍的社區。學習R,很大程度上也是學習各種R包的使用。截止目前(2017年3月,CRAN(Comprehensive R Archive Network)上已經有10762個可以獲取的R擴展包,內容涉及各行各業,可以適用于各種復雜的統計。各地的CRAN鏡像都是R網站的備份文件,內容完全一樣,你可以選擇離自己最近的去訪問。


三、R的特長

在R官網有這樣幾句介紹


丨R provides a wide variety of statistical (linear and nonlinear modelling, classical statistical tests, time-series analysis, classification, clustering, …) and graphical techniques, and is highly extensible.

丨One of R’s strengths is the ease with which well-designed publication-quality plots can be produced, including mathematical symbols and formulae where needed.


1.因為R語言本身為統計而生,所以你能想到的所有統計相關的工作,R都可以非常簡潔的用幾行命令(甚至1行命令)幫你完成。

2.R高度的可擴展性正是體現在它那1萬多個包上,你想做的幾乎所有事情都可以用現有的R包來輔助完成。

3.R另一個殺手锏就是其強大的繪圖功能,正如上面的英文介紹所言,R可以畫圖,畫各種各樣的圖,畫各種各樣高逼格的圖,畫各種各樣高逼格可以直接出版的圖。

4.完善的統計學功能再加上強大的繪圖功能,就是你學習的最大理由。

四、R應用示例


在這一部分,僅僅是給展示幾個用R可以輕松完成的相對有趣的工作。 安裝對應包后應該可以直接運行


示例1 ggplot2畫圖
效果展示:


 


示例2 詞頻分析及詞云
效果展示:

示例3 E-chart世界航空線路圖部分代碼(完整版在Echart官網)


效果展示:

五、如何嘗試入門R語言

① 大致了解一下R語言是什么,能干什么用

1.學習如何在R的官網下載R,如何在自己的電腦安裝R并成功運行。

2.學習如何安裝Rstudio,并且了解其基本的用法(這步可省略)。

3.學習如何查看R幫助文檔(這步很重要)。

4.學習如何將外部的數據(作業中通常是txt或者csv格式)正確地導入R。

5.學習R語言一些最基本的命令,如安裝包、調用包、讀入寫入文件、構造矩陣和基礎繪圖等。

6.了解R語言語法入門知識(數據類型、數據結構、函數與包)


② 了解R語言在商業數據分析領域的應用。
1.線性回歸分析方法;
2.使用決策樹進行流失預警模型;
3.使用神經網絡進行營銷響應預測;
4.分類器與組合模型;
5.理解客戶畫像和客戶分群;
6.推薦算法提升客戶價值;
7.客戶生命周期管理方法。

個人感覺,如果能完成上述幾條學習路線,那么R語言就算入門了。入門的標準是什么呢?我想是給你一份數據讓你處理,你腦子里的第一反應是可不可用R做;如果給你一個任務,你能上手嘗試用R去解決。

參考書籍


R語言編程藝術》

R語言實戰》

統計建模與R軟件》

《ggplot2:數據分析與圖形藝術》

CDA數據分析研究院結合市場需求開設R語言數據分析和數據挖掘兩個專題課程,從零開始,由淺入深,包括初級語法及統計入門、中級建模方法進階、高級案例應用三個階段。如果你對R語言有興趣,歡迎過來學習。

R語言最近開課: (CDA LEVEL II -R 建模分析)


一、課程信息

北京&遠程:2017年6月17日~7月02日(周末6天)

廣州:2017年7月08日~7月23日(周末6天)

授課安排:現場班6900元,遠程班4900元

(1) 授課方式:面授直播兩種形式,中文多媒體互動式授課方式

(2) 授課時間:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)

(3) 學習期限:現場與視頻結合,長期學習加練習答疑。

二、報名流程

1. 在線填寫報名信息

官網端:
微信端:

2. 給予反饋,確認報名信息

3. 網上繳費

4. 開課前一周發送電子版課件和教室路線圖

三、課程大綱
第一階段:[6.17]數據挖掘前沿與R語言
1.商業數據分析的本質
2.商業數據分析的階段與行業運用
3.商業數據挖掘通用方法論
4.R語言基礎
5.數據清洗方法
6.錯誤值、缺失值及噪聲值處理
7.變量壓縮
a.案例:貸款數據的數據清洗

第二階段:[6.18]回歸建模分析方法
1.線性回歸建模與檢驗
2.回歸模型的模型評估
3.正則化方法
4.邏輯回歸介紹
5.分類模型的模型評估
6.極大似然法估計
7.模型評估方法
a.案例:信用卡客戶價值預測模型b.案例:汽車貸款初始評分模型

第三階段:[6.24]決策樹神經網絡建模
1.使用決策樹進行流失預警模型
2.決策樹建模方法
3.決策樹模型修剪
4.使用神經網絡進行營銷響應預測
5.感知器與BP神經網絡
6.徑向基神經網絡
7.深度學習及常用框架(Caffe、Tensorflow)
a.案例:電子產品客戶購買決策模型b.案例:信貸產品行為評分模型

第四階段:[6.25]分類器與組合模型
1.KNN最近領域建模
2.貝葉斯網絡
3.高級分類器:支持向量機( SVM)
4.封裝與提升
5.隨機森林與梯度樹
a.案例:婚戀網站客戶成功約會預測b.案例:網站虛假注冊客戶識別c.案例:客戶精準營銷案例

第五階段:[7.01]客戶與市場分析方法
1.理解客戶畫像和客戶分群
2.客戶特征提取與FRM方法
3.層次聚類(Ward、Birch)
4.基于劃分的聚類(K-means)
5.譜聚類
6.基于密度的聚類(DBSCAN)
a.案例:某人壽保險公司客戶分群b.案例:郵輪公司客戶分群

第六階段:[7.02]推薦算法提升客戶價值
1.Apriori算法、FP-growth算法
2.順貫模型
3.推薦系統設計
4.模型生命周期
5.數據挖掘體系建設
a.案例:電商交叉銷售案例b.案例:金融機構交叉銷售案例

四、課程講師


 

常國珍

CDA數據分析師講師/北京大學商學博士

曾就職于亞信科技商業運營咨詢部(BOC)、方正國際金融事業部、德勤管理咨詢信息技術系統咨詢部,多家金融信息部門和金融高科技公司數據分析顧問。主要從事征信數據集市與信用風險建模、客戶價值提升等項目。擅長將基于個體行為分析的微觀經濟學研究范式與量化模型向結合的客戶終身價值建模。
曾珂


CDA數據分析研究院講師/管理科學工程碩士

從事數據分析與數據挖掘的研究與教學,研究方向為互聯網、電子商務數據分析與挖掘,擅長基于客戶關系管理數據挖掘、數據可視化、文本挖掘。

聯系我們

電話:010-68411404

手機: 18511302788(王老師)QQ:28819897102881989710  

         18811331062(田老師)QQ:28819897092881989709  

郵箱:  wzd@cda.cn

          tyx@cda.cn

—— Join Learn!






數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢