熱線電話:13121318867

登錄
首頁備考教材CDA LEVEL II
CDA LEVEL II
2023-10-11
收藏

一、總體目標

CDA(Certified Data Analyst),即“CDA數據分析師”,是在數字經濟大背景和人工智能時代趨勢下,面向全行業的資格認證,旨在提升用戶數字技能,助力企業數字化轉型,推動行業數字化發展?!窩DA人才考核標準」是面向全行業數據相關崗位的一套科學化、專業化、國際化的人才技能準則,CDA考試大綱規定并明確了數據分析師認證考試的具體范圍、內容和知識點,考生可按照大綱要求進行相關知識的學習,獲取技能,成為專業人才。

二、考試形式與試卷結構

考試方式:線下考試,上機答題

考試題型:客觀選擇題(單選100題+多選20題+內容相關15題+案例分析15題)

考試時間:150分鐘

考試成績:分為A、B、C、D四個層次,A、B、C為通過考試,D為不通過

考試要求:閉卷上機答題,無需攜帶計算器及其他考試無關用品

三、知識要求

針對不同知識,掌握程度的要求分為【領會】、【熟知】、【應用】三個級別,考生應按照不同知識要求進行學習。

1.領會:考生能夠了解規定的知識點,并能夠了解規定知識點的內涵與外延,了解其內容要點之間的區別與聯系,并能做出正確的闡述、解釋和說明。

2.熟知:考生須掌握知識的要點,并能夠正確理解和記憶相關理論方法,能夠根據不同要求,做出邏輯嚴密的解釋、說明和闡述。此部分為考試的重點部分。

3.應用:考生須學會將知識點落地實踐,并能夠結合相關工具進行商業應用,能夠根據具體要求,給出問題的具體實施流程和策略。

四、考試科目

PART 1 數據采集與處理(占比12%)

a.數據采集方法(占比2%)

b.市場調研和數據錄入
   市場調研流程(占比1%)
   樣本選?。ㄕ急?%)
   問卷設計及錄入(占比2%)

c.數據探索與可視化(占比2%)

d.數據預處理方法(占比3%)

PART 2 數據模型管理(占比3%)

a.數據分類(占比1%)

b.關系模型(占比1%)

c.數據倉庫體系和ETL(占比1%)

PART 3標簽體系與用戶畫像(占比5%)

a.標簽體系設計原理(占比3%)

b.標簽的加工方式(占比1%)

c.用戶畫像(占比1%)

PART 4 統計分析(占比25%)

a.抽樣估計(占比5%)

b.假設檢驗(占比5%)

c.方差分析(占比5%)

d.一元線性回歸分析(占比10%)

PART 5 數據分析模型(占比40%)

a.主成分分析法(占比6%)、因子分析法(占比4%)

b.多元回歸分析
   多元線性回歸(占比10%)
   邏輯回歸(占比10%)

c.聚類分析法
   系統聚類法(占比3%)
   K-Means聚類法(占比2%)

d.時間序列(占比5%)

PART 6 數字化工作方法(占比15%)

a.業務探查與問題定位(占比3%)

b.問題診斷
   近因分析(占比5%)
   根本原因分析(占比2%)

c.業務策略優化和指導
   業務目標設定原則(占比1%)
   知識庫,策略庫,流程分析(占比2%)
   線性和整數規劃(占比1%)
   二次優化(占比1%)

五、科目內容

1、數據采集方法
【領會】
一手數據與二手數據來源渠道
優劣勢分析
使用注意事項
【熟知】
一手數據采集中的概率抽樣與非概率抽樣的區別與優缺點
【運用】
概率抽樣方法,包括簡單隨機抽樣、分層抽樣、系統抽樣、分段抽樣 明確每種抽樣的優缺點
根據給定條件選擇最可行的抽樣方式
計算簡單隨機抽樣所需的樣本量
2、市場調研和數據錄入
【熟知】
市場調研的基本步驟(提出問題、理論推演、收集材料、構建模型、歸因分析)
樣本選取方式的適應性及優缺點
問卷設計原理,問卷題型設置以及每類題型的數據編碼及錄入
3、數據探索與可視化
【領會】
數據探索的目的與意義
常用數據可視化工具軟件(EXCEL BI、SPSS、PYTHON等)
【熟知】
數據探索數據預處理之間的關系
數據探索常用數據描述方法:集中趨勢分析、離中趨勢分析、數據分布關系、圖分析
數據探索常用數理統計方法:假設檢驗、方差檢驗、相關分析、回歸分析、因子分析
【應用】
能夠通過使用數據可視化工具(EXCEL BI、SPSS、PYTHON等)來完成相關數據分析項目的數據探索任務。(說明:考試中不會考核該部分工具和軟件的使用方法)。
4、數據預處理方法
【熟知】
數據預處理的基本步驟,包括數據集成(不同數據源的整合)、數據探索、數據變換(標準化)、數據歸約(維度歸約技術、數值歸約技術),這部分內容不涉及計算,只需要根據需求明確可選的處理技術即可。
【應用】
數據清洗,包括填補遺漏的數據值(根據業務場景使用常數、中位數、眾數等方法,不涉及多重查補的方法)、平滑有噪聲數據(移動平均)、識別或除去異常值(單變量根據中心標準化值,多變量使用快速聚類),以及解決不一致問題(熟知概念即可),查重(只考核SQL的語句,不涉及其它語言)。
【領會】
數據和信息的概念;數據分類中的主數據、交易數據和元數據概念
數據庫建模中概念、邏輯、物理模型之間的關系
數據庫范式的概念、數據倉庫數據集市、ETL過程
【熟知】
關系模型與維度模型的使用場景
1、標簽體系設計原理
【領會】
區分標簽和指標的概念
精準營銷與量化風控的概念
消費者決策進程
客戶、產品、渠道標簽的核心內容
【熟知】
分層標簽和分群標簽
馬斯洛需求層次理論與精準營銷的關系
2、標簽的加工方式
【領會】
基礎、統計、模型標簽
【熟知】
3、用戶畫像
【領會】
用戶旅程分析
標準用戶分析與偏離度分析
【熟知】
用戶畫像技術在營銷獲客、風險防控中的應用
1、抽樣估計
【領會】
隨機試驗、隨機事件、隨機變量的概念
總體與樣本的概念
抽樣估計的理論基礎
正態分布及三大分布的函數形式和圖像形式
抽樣的多種組織形式
確定必要樣本容量的原因
大數定律與中心極限定理的意義與應用
【熟知】
隨機事件的概率
抽樣平均誤差的概念與數學性質
點估計與區間估計方法的特點與優缺點
全體總體與樣本總體
參數和統計量
重復抽樣與不重復抽樣
抽樣誤差的概念對總體平均數、總體成數和總體方差的區間估計方法
必要樣本容量的影響因素
【應用】
隨機變量及其概率分布
全部可能的樣本單位數目的概念及其在不同抽樣方法下的確定
抽樣平均誤差在實際數據分析中的計算方法
2、假設檢驗
【領會】
假設檢驗的基本概念
其基本思想在數據分析中的作用
假設檢驗的基本步驟
假設檢驗與區間估計的聯系
假設檢驗中的兩類錯誤
【熟知】
檢驗統計量、顯著性水平及對應臨界值(Critical Value)的基本定義
P值的含義及計算
如何利用P值進行檢驗
z檢驗統計量
t檢驗統計量
F檢驗統計量
X2檢驗統計量的函數形式和檢驗步驟
【應用】
實現單樣本t檢驗
兩獨立樣本t檢驗的步驟和檢驗中使用的統計量與原假設
兩種檢驗應用的數據分析場景
3、方差分析
【領會】
方差分析的相關概念
單因素方差分析的原理
統計量構造過程
【熟知】
單因素方差分析的基本步驟
總離差平方和(SST)的含義及計算
組間離差平方和(SSA)的含義及計算
組內離差平方和(SSE)的含義及計算
單因素方差分析的原假設
【應用】
實現單因素方差分析的步驟
方差分析表的分析以及多重比較表的分析
4、一元線性回歸分析
【領會】
相關圖的繪制與作用
相關表的編制與作用
相關系數定義公式的字母含義
估計標準誤差與相關系數的關系
【熟知】
相關關系的概念與特點
相關關系與函數關系的區別與聯系
相關關系的種類
相關系數的意義以及利用相關系數的具體數值對現象相關等級的劃分
回歸分析的概念
回歸分析的主要內容和特點
建立一元線性回歸方程的條件
一元線性回歸系數的最小二乘估計
應用回歸分析應注意的問題
估計標準誤差的意義及計算
【應用】
運用簡捷法公式計算相關系數與回歸系數
相關分析分析中應注意的問題
回歸分析相關分析的區別與聯系
總體要求
領會模型基本原理,數值模型操作流程,懂得模型應用場景,能夠完成數據建模分析報告。
1、主成分分析
【領會】
主成分分析的計算步驟
主成分分析中對變量自身分布和多變量之間關系的假設以及模型設置
【熟知】
適用于主成分分析的變量度量類型。通過分析結果,選取合適的保留主成分的個數,注意區分兩種不同的分析目的(盡量壓縮變量、避免共線性情況下保留更多信息)保留主成分個數的評判標準的差異。
【應用】
在深入理解主成分的意義的基礎之上,在遇到業務問題時,有能力決定是否使用主成分分析方法;有能力決定何時采用相關系數計算方法和協方差矩陣計算方法;有能力解釋主成分得分的結果;根據變量分布情況進行函數轉換。
2、因子分析
【領會】
了解因子分析模型設置,只需要關注主成分法的計算步驟
【熟知】
適用于因子分析的變量度量類型,通過分析結果,選取合適的因子個數。
常用因子旋轉的方法
【應用】
在遇到業務問題時,有能力決定是否使用因子分析,還是使用主成分分析方法就可以了;有能力根據原始變量在各因子上的權重明確每個因子的意義;有能力對大量變量進行維度分析,分維度打分,并比較與專家打分(德爾菲法)的區別;在聚類前對數據進行描述,發現理想的聚類方式和數量。
3、回歸分析
【領會】
線性回歸的綜合應用
【熟知】
明確線性回歸的6個經典假設(線性模型、不存在共線性、殘差期望為0(無內生性)、同方差、正態性、隨機抽樣)
獨立同分布的概念
明確違反上述假設后出現的問題
模型是否違反經典假設的檢驗方法與模型糾正的方法
變量篩選方法
離群值、指標計算方法
明晰橫截面和時間序列數據在回歸建模上的差異
【應用】
結合業務構建回歸模型并且解釋回歸系數
根據業務場景與變量分布情況進行函數轉換
解釋變量為分類變量時的處理方法
區分預測性建模與解釋性建模的關系
使用結果進行新樣本預測
進行客戶價值分析的基本步驟與注意事項
4、分類分析
【領會】
卡方檢驗計算公式
二分類邏輯回歸的計算公式
【熟知】
分類變量是否存在相關關系的描述方法和檢驗方法,涉及列聯表分析、卡方檢驗
似然比與Logit轉換
二分類邏輯回歸模型構建與變量篩選
模型評估的方法,涉及混淆矩陣、ROC曲線
【應用】
結合業務構建回歸模型并且解釋回歸系數
根據業務場景與變量分布情況進行函數轉換
使用結果進行新樣本預測
邏輯回歸與多元線性回歸模型的結合應用
進行客戶流失預測、信用評級、精準營銷等模型的基本步驟與注意事項
5、聚類分析
【領會】
多種聚類算法的特點
迭代的概念與實現
【熟知】
聚類方法的基本邏輯
距離的計算
系統聚類和K-Means聚類的基本算法和優缺點
系統聚類的計算步驟,包括兩點距離、兩類合并的計算方法
系統聚類法中選擇最優聚類數量的方法
K-Means聚類的基本算法
聚類分析變量標準化的原因和計算方法
變量需要進行主成分分析的原因
變量進行函數轉化的原因和計算方法
【應用】
結合客戶畫像、客戶細分、商品聚類、離群值檢驗(欺詐、反洗錢)等業務運用場景,選取合適的聚類方法與步驟。
聚類事后分析,根據聚類后變量分布情況獲取每類的特征。
6、時間序列
【領會】
明確趨勢分解法、ARIMA方法、時間序列回歸方法的差異和適用場景
明確ARIMA方法的計算方法
【熟知】
趨勢分解法,涉及乘法模型、加法模型
ARIMA方法的具體步驟;時間序列回歸的方法
【應用】
結合業務(業績預測、預警),選取合適的分析方法
進行業務時間序列預測等模型的基本步驟與注意事項
1、業務探查與問題定位
【領會】
異常事件嚴重度評估準則。
業務流程等事件還原工具。
【熟知】
業務流程圖的繪制。
2、問題診斷
【領會】
近因分析的頭腦風暴法與量化分析分析工具的選取。
根本原因分析中的5WHY分析法,原因型和對策型因果圖。
【熟知】
通過帕累托分析識別要點。
通過散點圖、關聯圖、親和圖進行關聯分析。
通過漏斗分析、用戶畫像、留存分析、跟蹤數字足跡進行探查。
繪制原因型因果圖。
3、業務策略優化和指導
【領會】
業務目標設定原則
線性規劃的組成部分、標準形式。
整數規劃與去尾法線性規劃的差異性。
二次規劃的組成部分、標準形式。
知識庫的類型和組成部分。
策略庫的類型和組成部分。
【熟知】
線性規劃的建模步驟。
二次規劃的建模步驟。
流程優化的分析方法和工具。
【應用】
根據題目要求給出目標函數和約束條件。

六、推薦學習書目

說明:推薦學習書目中,部分書籍結合軟件,但考試中不考查軟件操作使用,考生可根據自身需求選擇性學習。參考書目不需全部學完,根據考綱知識點進行針對性學習即可。

[1] 常國珍等.商業策略數據分析.電子工業出版社,2023.(必讀)
[2] 趙仁乾,常國珍等.金融商業算法建模:基于python和SAS[M].機械工業出版社,2021.(必讀)
[3] 比約恩等.根原因分析-簡化的工具和技術(第2版)[M].中國人民大學出版社,2011.(必讀)
[4] 常國珍等.Python數據科學:技術詳解與商業實踐 [M].機械工業出版社,2018.(必讀)
[5] 賈俊平,何曉群,金勇進.統計學(第8版)[M].中國人民大學出版社,2021.(選讀)
[6] 金勇進,杜子芳等.抽樣技術(第5版).中國人民大學出版社,2021.(選讀)
[7] 數據管理協會(DAMA國際).DAMA數據管理知識體系指南(原書第2版)[M].機械工業出版社,2020.(選讀)
[8] 韓伯棠,管理運籌學(第5版)[M].高等教育出版社,2020.(選讀)
[9] 任寅姿,季樂樂等.標簽類目體系[M].機械工業出版社,2021.(選讀)


登錄后下載大綱PDF

推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~

免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

上一篇CDA LEVEL I
下一篇CDA LEVEL III
數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢