熱線電話:13121318867

登錄
首頁大數據時代CDA數據分析練習題1
CDA數據分析練習題1
2024-09-12
收藏


《CDA數據分析認證考試模擬題庫》


一、單選題

1.統計圖中的散點圖主要用來( A   )。

A.觀察變量之間的相關關系        B.主要用來表示總體各部分所占的比例

C.主要用來表示次數分布          D.主要用來反映分類數據的頻數分布

 

2.抽樣誤差是指(   D  )

A.在調查過程中由于觀察、測量等差錯所引起的誤差  

B.人為原因所造成的誤差

C.在調查中違反隨機原則出現的系統誤差            

D.隨機抽樣而產生的代表性誤差

 

3.檢查異常值常用的統計圖形:( B )

A、條形圖

B、箱體圖

C、帕累托圖

D、線圖

 

4.線性回歸里的殘差分析不可能用于診斷( D )

A、殘差獨立性

B、變量分布

C、異常值偵察

D、最大迭代次數

 

5.擬合logistic回歸模型時有兩個分類變量,分別是Gender(水平為female和male),Class(水平為1 、2和3),下表為輸出結果,下面哪個選項的說法是正確的?(C)

 

A.變量Gender和Class采用效應編碼

B.變量Gender采用引用編碼,引用水平為female

C.變量Class采用引用編碼,引用水平為3

D.變量Gender和Class采用全量編碼

 

6.因子分析的主要作用:( A )

A、對變量進行降維

B、對變量進行判別

C、對變量進行聚類

D、以上都不對

 

7.關于K-means 聚類過程正確的是:( A )

A、使用的是迭代的方法

B、均適用于對變量和個案的聚類

C、對變量進行聚類

D、以上都不對

 

8.東北人養了一只雞和一頭豬。一天雞問豬:"主人呢?"豬說:"出去買蘑菇了。"雞聽了撒丫子就跑。豬說:"你跑什么?"雞叫道:“有本事主人買粉條的時候你小子別跑?。?nbsp;

以上對話體現了數據分析方法中的( A  )

A. 關聯           B. 聚類          C. 分類        D. 自然語言處理

 

9.已知甲班學生“統計學”的平均成績為86分,標準差是12.8分,乙班學生“統計學”的平均成績是90分,標準差是10.3分,下列表述正確的是( A  )

A. 乙班平均成績的代表性高于甲班

B. 甲班平均成績的代表性高于乙班

C. 甲、乙兩班平均成績的代表性相同

D. 甲、乙兩班平均成績的代表性無法比較

 

10.根據樣本資料估計得出人均消費支出Y對人均收入X的回歸模型,表明人均收入每增加1%,人均消費支出將增加( B  )

A. 0.2%               B. 0.75%            C. 2%               D. 7.5%

 

11.某企業根據對顧客隨機抽樣的信息得到對該企業產品表示滿意的顧客比率的95%置信度的置信區間是(56%,64%)。下列正確的表述是( A  )

A.總體比率的95%置信度的置信區間為(56%,64%)

B.總體真實比率有95%的可能落在(56%,64%)中

C.區間(56%,64%)有95%的概率包含了總體真實比率

D.由100次抽樣構造的100個置信區間中,約有95個覆蓋了總體真實比率

 

12.以下哪個語句可以將字符型數值date(示例:“2001-02-19”)轉換為數值類型? ( A  )

A、INPUT(date,YYMMDD10.)

B、PUT(date,YYMMDD10)

C、INPUT(date,YYMMDD10.)

D、PUT(date,YYMMDD10)       

 

13. ,取值范圍在[0,1],反映回歸曲線的擬合優度,當趨近于0,則回歸曲線擬合優度( B  )

A.越好       B. 越差       C. 適中       D. 以上都不對

 

14.分析購買不同產品的頻次時,使用以下哪個任務? ( D  )

A、列表數據

B、匯總表

C、匯總統計量

D、單因子頻數 

 

15.當你用跑步時間(RunTime)、年齡(Age)、跑步時脈搏(Run_Pulse)以及最高脈搏(Maximum_Pulse)作為預測變量來對耗氧量(Oxygen_Consumption )進行回歸時,年齡(Age)的參數估計是-2.78. 這意味著什么?( B  )

A、年齡每增加一歲,耗氧量就增大2.78.

B、年齡每增加一歲,耗氧量就降低2.78.

C、年齡每增加2.78歲,耗氧量就翻倍。

D、年齡每減少2.78歲,耗氧量就翻倍。

 

16.ROC曲線凸向哪個角,代表模型約理想?( A  )

A、左上角

B、左下角

C、右上角

D、右下角

 

17.在所有兩位數(10-99)中任取一兩位數,則此數能被2或3整除的概率為 (  B )

A. 6/5     B. 2/3    C.  83/100     D.均不對

 

18.對事件A和B,下列正確的命題是   ( D  )

A.如A,B互斥,則,也互斥      

B. 如A,B相容,則, 也相容

C. 如A,B互斥,且P(A)>0,P(B)>0,則A.B獨立   

D. 如A,B獨立,則,也獨立

 

19.擲二枚骰子,事件A為出現的點數之和等于3的概率為 ( B  )

A.1/11      B. 1/18      C. 1/6      D.  都不對

20.A和B兩事件,若 P(AUB)=0.8,P(A)=0.2,P()=0.4  則下列 (  B )成立。

A. P()=0.32       B. P()=0.2

C. P(AB)=0.4          D. P()=0.48

 

21.隨機地擲一骰子兩次,則兩次出現的點數之和等于8的概率為 (  C )

A. 3/36      B.  4/36     C.  5/36     D.  2/36

 

22.抽樣推斷中,可計算和控制的誤差是    (  D )

A.登記誤差              B.系統性誤差(偏差

C.抽樣實際誤差          D.抽樣平均誤差

 

23.假設檢驗中顯著性水平是  (  B )

A.推斷時犯取偽錯誤的概率      B.推斷時犯取偽棄真的概率

C.正確推斷的概率              D.推斷時視情況而定

 

24.抽樣調查中,無法消除的誤差是  ( A  )

A.隨機誤差    B.工作誤差    C.登記誤差     D.偏差

 

25.當時,兩個相關變量   ( C  )

A.低度相關              B.中度相關    

C.高度相關              D.不相關

 

26.描述一組對稱(或正態)分布資料的離散趨勢時,最適宜選擇的指標是(B)

A.極差        B.標準差        C.均數          D.變異系數   

 

27.以下指標中那一項可用來描述計量資料離散程度(D)

A.算術均數    B.幾何均數    C.中位數    D.極差 

 

28.偏態分布資料宜用下面那一項描述其分布的集中趨勢(C)

A.算術均數    B.標準差    C.中位數    D.四分位數間距 

 

29.下面那一項可用于比較身高和體重的變異度(C)

A.方差  B.標準差   C.變異系數   D.全距 

 

30.正態曲線下,橫軸上從均數到+∞的面積為(C)

A.97.5%    B.95%      C.50%    D.5%    

 

31.橫軸上,標準正態曲線下從0到1.96的面積為: (D)

A.95%    B.45%    C.97.5%    D.47.5%  

 

32.下面那一項分布的資料,均數等于中位數。(D)

A.對數正態     B.左偏態      C.右偏態      D.正態

 

33.K-均值類別偵測要求輸入的數據類型必須是( B )。

A整型       B數值型     C字符型      D邏輯型

 

34.某一特定的X水平上,總體Y分布的離散度越大,即σ2越大,則(  A    )。

A.預測區間越寬,精度越低          B.預測區間越寬,預測誤差越小

C 預測區間越窄,精度越高          D.預測區間越窄,預測誤差越大

 

35.如果X和Y在統計上獨立,則相關系數等于(   C   )。

A.1      B.-1       C.0       D.∞

 

36.根據決定系數R2與F統計量的關系可知,當R2=1時,有(   D   )。

A.F=1      B.F=-1         C.F=0         D.F=∞

 

37.假設兩變量線性相關,兩變量是等距或等比的數據,但不呈正態分布,計算它們的相關系數時應選用( B )。 

A. 積差相關        B.斯皮爾曼等級相關 

C.二列相關        D.點二列相關

 

38.回歸模型中,關于檢驗所用的統計量,下列說法正確的是( D )。

A.服從       B.服從           

C.服從       D.服從

 

39.下面有關HAVING子句描述錯誤的是(B)。

  A:HAVING子句必須與GROUP BY 子句同時使用,不能單獨使用

  B:使用HAVING子句的同時不能使用WHERE子句

  C:使用HAVING子句的同時可以使用WHERE子句

  D:使用HAVING子句的作用是限定分組的條件

 

40.  是( C  )分布的密度函數。

  A.指數 B.  二項 C.  均勻 D.  泊松

 

41.根據判定系數R2與F統計量的關系可知,當R2=1時有(   C   )。 

A.F=1          B.F=-1           C.F=∞         D.F=0 

 

42.在SQL查詢時,使用WHERE子句指出的是(C)。

  A:查詢目標

  B:查詢結果

  C:查詢條件

  D:查詢視圖

 

43.SQL查詢語句中HAVING子句的作用是(C)。

  A:指出分組查詢的范圍

  B:指出分組查詢的值  

  C:指出分組查詢的條件

  D:指出分組查詢的字段

 

44.SQL的數據操作語句不包括(D)。

  A:INSERT

  B:UPDATE

  C:DELETE

  D:CHANGE

 

45.SQL語句中查詢條件短語的關鍵字是(A)。

  A:WHERE

  B:FOR

  C:WHILE

  D:CONDITION

 

46.SQL語句中修改表結構的命令是(C)。

  A:MODIFY TABLE

  B:MODIFY STRUCTURE

  C:ALTER TABLE

  D:ALTER STRUCTURE

 

47.SQL語句中刪除表的命令是(A)。

  A:DROP TABLE

  B:DELETE TABLE

  C:ERASE TABLE

  D:DELETE DBF

 

二、多選題

48.相關有以下幾種(ABC)。 

A.正相關    B.負相關    C.零相關    D.常相關 

 

49.相關系數的取值可以是(ABC)。 

A. 0     B.-1     C. 1     D. 2 

 

50.某種產品的生產總費用2003年為50萬元,比2002年多2萬元,而單位產品成本2003年比2002年降低5%,則(   ACDE    )

 A、生產費用總指數為104.17%      B、生產費用指數為108.56%

 C、單位成本指數為95%            D、產量指數為109.65%

 E、由于成本降低而節約的生產費用為2.63萬元

 

51.三個地區同一種商品的價格報告期為基期的108%,這個指數是(  BE  )

 A、個體指數      B、總指數     C、綜合指數

 D、平均數指數    E、質量指標指數

 

52.有關數據庫的說法正確的是(ABCD)

A.元數據是描述數據的數據

B.使用索引可以快速訪問數據庫中的數據,所以可以在數據庫中盡量多的建立索引

C.數據庫中一行叫做記錄

D.數據庫中的每一個項目叫做字段

 

53.統計數據按來源分類,可以分為(BD)

A.類別數據    B.二手數據

C.序列數據    D.一手數據

E.數值數據

 

53.以下哪些變量代表RFM方法中的M:( AB )

A.最近3期境外消費金額

B.最近6期網銀平均消費金額

C.信用卡的消費額度

D.距最近一次逾期的月數

 

54.在作邏輯回歸時,如果區域這個變量,當Region=A時Y取值均為1,無法確定是否出現的是哪個問題?(ABD)

A. 共線性

B. 異常值

C. 擬完全分離(Quasi-complete separation)

D. 缺失值

 

55.下列Z值( BCD )可以被認為是異常值。

A、0     B、-3    C、6    D、10  

 

56.下列問題( ABC )使用參數檢驗分析方法。

A、評估燈泡使用壽命                         B、檢驗食品某種成分的含量

C、全國小學一年級學生一學期的平均課外作業時間  D、全國省市小康指數高低

 

57.兩獨立樣本t檢驗的前提( ABC )

A、樣本來自的總體服從或近似服從正態分布  B、兩樣本相互獨立  

C、兩樣本的數量可以不相等                D、兩樣本的數量相等

 

58.兩配對樣本t檢驗的前提( ABD )

A、樣本來自的總體服從或近似服從正態分布  B、兩樣本觀察值的先后順序一一對應  

C、兩樣本的數量可以不相等                D、兩樣本的數量相等

 

59.下面給出的t檢驗的結果,( CD )表明接受原假設,顯著性水平為0.05。

A、0.000      B、0.039     C、0.092     D、0.124

 

60.方差分析的基本假設前提包括( AC )

A、各總體服從正態分布  B、各總體相互獨立  

C、各總體的方差應相同  D、各總體的方差不同

 

61.下列( ABC )屬于多選項問題。

A、購買保險原因調查     B、高考志愿調查    

C、儲蓄原因調查         D、各省市現代化指數分析

 

62.層次聚類聚類方式分為兩種,分別是( AB )

A、凝聚方式聚類    B、分解方式聚類     C、Q型聚類      D、R型聚類



——學數據分析技能一定要了解的大廠入門券,CDA數據分析師認證證書!




CDA(數據分析師認證),與CFA相似,由國際范圍內數據科學領域行業專家、學者及知名企業共同制定并修訂更新,迅速發展成行業內長期而穩定的全球大數據及數據分析人才標準,具有專業化、科學化、國際化、系統化等特性。


同時,CDA全??荚嚥季趾驼J證體系已得社會認可,并由為IBM、華為等提供全球認證服務的Pearson VUE面向全球提供靈活的考試服務。


報名方式

登錄CDA認證考試官網注冊報名>>點擊報名


報名費用

Level Ⅰ:1200 RMB

Level Ⅱ:1700 RMB

Level Ⅲ:2000 RMB


考試地點

Level Ⅰ + Level Ⅱ中國區30+省市,70+城市,250+考場,考生可就近考場預約考試 >看看我所在的地哪里報名<

Level Ⅲ:中國區30所城市,北京/上海/天津/重慶/成都/深圳/廣州/濟南/南京/杭州/蘇州/福州/太原/武漢/長沙/西安/貴陽/鄭州/南寧/昆明/烏魯木齊/沈陽/哈爾濱/合肥/石家莊/呼和浩特/南昌/長春/大連/蘭州>看看我所在的地哪里報名<


報考條件


 CDA Level I >了解更多<

? 報考條件:無要求。

? 考試時間:隨報隨考。


 CDA Level II >了解更多<

? 報考條件:獲得CDA Level Ⅰ認證證書;

? 考試時間:隨報隨考。


 CDA Level III >了解更多<

? 報考條件:獲得CDA Level Ⅱ認證證書;

? 考試時間:一年四屆 3月、6月、9月、12月的最后一個周六。


更多考試介紹及備考福利請點擊:CDA 認證考試中心官網





推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~

免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢