熱線電話:13121318867

登錄
首頁大數據時代CDA數據分析練習題3
CDA數據分析練習題3
2024-09-12
收藏


CDA考試教材 https://www.cdaglobal.com/article/475.html 

CDA模擬題庫 https://www.cdaglobal.com/article/473.html



76.下表是一個購物籃,假定支持度閾值為40%,其中__(A D)__是頻繁閉項集。

 

TID 項

1 abc

2 abcd

3 bce

4 acde

5 de

 

A、abc

B、ad

C、cd

D、de

 

77.Apriori算法的計算復雜度受__(ABCD)__影響。

A、支持度閥值

B、項數(維度)

C、事務數

D、事務平均寬度

 

78. 我們可以用哪種方式來避免決策樹過度擬合 (Overfitting)的問題? (AB)

A、利用修剪法來限制樹的深度

B、利用盆栽法規定每個節點下的最小的記錄數目

C、利用逐步回歸法來刪除部分數據

D、目前并無適合的方法來處理這問題

 

79.以下屬于分類器評價或比較尺度的有: (ACD)

A、預測準確度

B、召回率

C、模型描述的簡潔度

D、計算復雜度

 

80.在評價不平衡類問題分類的度量方法有如下幾種:(ABCD)

A、F1度量

B、召回率(recall)

C、精度(precision)

D、真正率(ture positive rate,TPR)

 

81.貝葉斯信念網絡(BBN)有如下哪些特點:(AB)

A、構造網絡費時費力

B、對模型的過分問題非常魯棒

C、貝葉斯網絡不適合處理不完整的數據

D、網絡結構確定后,添加變量相當麻煩

 

82.如下哪些不是最近鄰分類器的特點: (C)

A、它使用具體的訓練實例進行預測,不必維護源自數據的模型

B、分類一個測試樣例開銷很大

C、最近鄰分類器基于全局信息進行預測

D、可以生產任意形狀的決策邊界

 

83.如下那些不是基于規則分類器的特點:(AC)

A、規則集的表達能力遠不如決策樹

B、基于規則的分類器都對屬性空間進行直線劃分,并將類指派到每個劃分

C、無法被用來產生更易于解釋的描述性模型

D、非常適合處理類分布不平衡的數據集

 

84.以下屬于聚類算法的是( ABD )。

A、K均值

B、DBSCAN

C、Apriori

D、Jarvis-Patrick(JP)

 

85.( CD )都屬于簇有效性的監督度量。

A、輪廓系數

B、共性分類相關系數

C、熵

D、F度量

 

86. 下列對ID3算法的描述,何者為真?(A, B, D)

A、每個節點的分支度都不相同

B、使用Information Gain作為節點分割的依據

C、可以處理數值型態的字段

D、無法處理空值的字段

 

87.( ABCD )這些數據特性都是對聚類分析具有很強影響的。

A、高維性

B、規模

C、稀疏性

D、噪聲和離群點

 

88.在聚類分析當中,( AD )等技術可以處理任意形狀的簇。

A、MIN(單鏈)

B、MAX(全鏈)

C、組平均

D、Chameleon

 

89.( AB )都屬于分裂的層次聚類算法。

A、二分K均值

B、MST

C、Chameleon

D、組平均

 

90.下列哪種算法可同時用來做分類以及預測數值?(A, B)

A、Neural Network

B、Decision Tree

C、Logistic Regression

D、Linear Regression

 

三、內容相關題

 

(一)、根據相同的背景材料回答若干道題目,每道題的答案個數不固定。下列各題A)、B)、C)、D)四個選項中,每題至少有一個選項是正確的,多選或少選,均不能得分。

I、下圖為類神經元的示意圖,請回答1至3題:

 

1、【答案(A)】

請問虛線的部分為?

A、類神經元 

B、 鍵結值(Weight) 

C、閥值(Bias) 

D、激發函數(Activation Function)

 

2、【答案(D)】

請問請問( )為?

A、類神經元 

B、鍵結值(Weight) 

C、閥值(Bias) 

D、激發函數(Activation Function)

 

3、【答案(B)】

請問W1, W2, …, Wm為?

A、類神經元 

B、鍵結值(Weight) 

C、閥值(Bias) 

D、激發函數(Activation Function)

 

II、根據下表的混亂矩陣(Confusion Matrix),回答4至5題:

4、【答案(A)】

對于屬性值YES的響應率(Precision)應如何計算? 

A.  B.   C.   D. 

 

5、【答案(B)】

對于屬性值YES的捕捉率(Recall)應如何計算?

A.  B.   C.   D. 

 

(二)、6-10題略

 

四、案例操作題

 

帶數據,數據請見***

 

(一)、根據相同的背景材料和數據回答若干道題目,每道題的答案個數不固定。在做題過程中需要使用統計軟件進行相應的操作。提供SAS、SPSS和CSV三種格式的數據,統計軟件不受限制。下列各題A)、B)、C)、D)四個選項中,每題至少有一個選項是正確的,多選或少選,均不能得分。

I、一家銀行希望使用自有業務數據和外部征信局數據來構造信用評分模型。該數據保存在Credit這張表中。其變量描述如下:

 

分析過程需要使用軟件進行,可以使用任何軟件完成以下題目:

1、 (AB)

以下哪個變量是分類變量

A. TARGET

B. BanruptcyInd

C. InqFinanceCnt24

D. TLBadDerogCnt

 

2、 (B)

這些變量中,有多少個變量具有缺失值

A. 7

B. 11

C. 12

D. 27

 

3、(B)

InqCnt06的中位數是

A.0

B.2

C.40

D.3.11

 

4、(AC)

以下四個變量中,哪兩個右偏嚴重

A. TLCnt24

B. TlOpenPct

C. TLSatCnt

D. TLSatPct

 

5、(B)

將數據按7:3的比例分為訓練集和驗證集,對有缺失值的變量使用中位數進行填補后,使用逐步回歸法以Target為被解釋變量構造邏輯回歸,以下哪些變量的解釋力度最強

A.TLBadCnt24

B.TLBalHCPct

C.TLCnt03

D.TLDel60Cnt24

 

6-10略

 

(二)、11-20題略



立刻掃碼

看更多數據分析師認證試題



——學數據分析技能一定要了解的大廠入門券,CDA數據分析師認證證書!



CDA(數據分析師認證),與CFA相似,由國際范圍內數據科學領域行業專家、學者及知名企業共同制定并修訂更新,迅速發展成行業內長期而穩定的全球大數據及數據分析人才標準,具有專業化、科學化、國際化、系統化等特性。


同時,CDA全??荚嚥季趾驼J證體系已得到教育部直屬中國成人教育協會及大數據專業委員會認可,并由為IBM、華為等提供全球認證服務的Pearson VUE面向全球提供靈活的考試服務。


報名方式

登錄CDA認證考試官網注冊報名>>點擊報名


報名費用

Level Ⅰ:1200 RMB

Level Ⅱ:1700 RMB

Level Ⅲ:2000 RMB


考試地點

Level Ⅰ + 中國區30+省市,70+城市,250+考場,考生可就近考場預約考試 >看看我所在的地哪里報名<

Level Ⅲ:中國區30所城市,北京/上海/天津/重慶/成都/深圳/廣州/濟南/南京/杭州/蘇州/福州/太原/武漢/長沙/西安/貴陽/鄭州/南寧/昆明/烏魯木齊/沈陽/哈爾濱/合肥/石家莊/呼和浩特/南昌/長春/大連/蘭州>看看我所在的地哪里報名<


報考條件

CDA Level I >了解更多<

? 報考條件:無要求。

? 考試時間:隨報隨考。

CDA Level II >了解更多<

? 報考條件:獲得CDA Level Ⅰ認證證書;

? 考試時間:隨報隨考。



CDA Level III >了解更多<

? 報考條件:獲得CDA Level Ⅱ認證證書;

? 考試時間:

一年四屆 3月、6月、9月、12月的最后一個周六。

(備注:數據分析相關工作不限行業,可涉及統計,數據分析,數據挖掘,數據庫,數據管理,大數據架構等內容。)


——熱門課程推薦:

想學習PYTHON數據分析與金融數字化轉型精英訓練營,您可以點擊>>>“人才轉型”了解課程詳情;

想從事業務型數據分析師,您可以點擊>>>“數據分析師”了解課程詳情;

想從事大數據分析師,您可以點擊>>>“大數據就業”了解課程詳情;

想成為人工智能工程師,您可以點擊>>>“人工智能就業”了解課程詳情;

想了解Python數據分析,您可以點擊>>>“Python數據分析師”了解課程詳情;

想咨詢互聯網運營,你可以點擊>>>“互聯網運營就業班”了解課程詳情; 

想了解更多優質課程,請點擊>>>



數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢