
《數據分析專項練習題庫》
《CDA數據分析認證考試模擬題庫》
《企業數據分析面試題庫》
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
一、單選題
1.統計圖中的散點圖主要用來( A )。
A.觀察變量之間的相關關系 B.主要用來表示總體各部分所占的比例
C.主要用來表示次數分布 D.主要用來反映分類數據的頻數分布
2.抽樣誤差是指( D )
A.在調查過程中由于觀察、測量等差錯所引起的誤差
B.人為原因所造成的誤差
C.在調查中違反隨機原則出現的系統誤差
D.隨機抽樣而產生的代表性誤差
3.檢查異常值常用的統計圖形:( B )
A、條形圖
B、箱體圖
C、帕累托圖
D、線圖
4.線性回歸里的殘差分析不可能用于診斷( D )
A、殘差獨立性
B、變量分布
C、異常值偵察
D、最大迭代次數
5.擬合logistic回歸模型時有兩個分類變量,分別是Gender(水平為female和male),Class(水平為1 、2和3),下表為輸出結果,下面哪個選項的說法是正確的?(C)
A.變量Gender和Class采用效應編碼
B.變量Gender采用引用編碼,引用水平為female
C.變量Class采用引用編碼,引用水平為3
D.變量Gender和Class采用全量編碼
6.因子分析的主要作用:( A )
A、對變量進行降維
B、對變量進行判別
C、對變量進行聚類
D、以上都不對
7.關于K-means 聚類過程正確的是:( A )
A、使用的是迭代的方法
B、均適用于對變量和個案的聚類
C、對變量進行聚類
D、以上都不對
8.東北人養了一只雞和一頭豬。一天雞問豬:"主人呢?"豬說:"出去買蘑菇了。"雞聽了撒丫子就跑。豬說:"你跑什么?"雞叫道:“有本事主人買粉條的時候你小子別跑?。?nbsp;
以上對話體現了數據分析方法中的( A )
9.已知甲班學生“統計學”的平均成績為86分,標準差是12.8分,乙班學生“統計學”的平均成績是90分,標準差是10.3分,下列表述正確的是( A )
A. 乙班平均成績的代表性高于甲班
B. 甲班平均成績的代表性高于乙班
C. 甲、乙兩班平均成績的代表性相同
D. 甲、乙兩班平均成績的代表性無法比較
10.根據樣本資料估計得出人均消費支出Y對人均收入X的回歸模型,表明人均收入每增加1%,人均消費支出將增加( B )
A. 0.2% B. 0.75% C. 2% D. 7.5%
11.某企業根據對顧客隨機抽樣的信息得到對該企業產品表示滿意的顧客比率的95%置信度的置信區間是(56%,64%)。下列正確的表述是( A )
A.總體比率的95%置信度的置信區間為(56%,64%)
B.總體真實比率有95%的可能落在(56%,64%)中
C.區間(56%,64%)有95%的概率包含了總體真實比率
D.由100次抽樣構造的100個置信區間中,約有95個覆蓋了總體真實比率
12.以下哪個語句可以將字符型數值date(示例:“2001-02-19”)轉換為數值類型? ( A )
A、INPUT(date,YYMMDD10.)
B、PUT(date,YYMMDD10)
C、INPUT(date,YYMMDD10.)
D、PUT(date,YYMMDD10)
13. ,取值范圍在[0,1],反映回歸曲線的擬合優度,當
趨近于0,則回歸曲線擬合優度( B )
A.越好 B. 越差 C. 適中 D. 以上都不對
14.分析購買不同產品的頻次時,使用以下哪個任務? ( D )
A、列表數據
B、匯總表
C、匯總統計量
D、單因子頻數
15.當你用跑步時間(RunTime)、年齡(Age)、跑步時脈搏(Run_Pulse)以及最高脈搏(Maximum_Pulse)作為預測變量來對耗氧量(Oxygen_Consumption )進行回歸時,年齡(Age)的參數估計是-2.78. 這意味著什么?( B )
A、年齡每增加一歲,耗氧量就增大2.78.
B、年齡每增加一歲,耗氧量就降低2.78.
C、年齡每增加2.78歲,耗氧量就翻倍。
D、年齡每減少2.78歲,耗氧量就翻倍。
16.ROC曲線凸向哪個角,代表模型約理想?( A )
A、左上角
B、左下角
C、右上角
D、右下角
17.在所有兩位數(10-99)中任取一兩位數,則此數能被2或3整除的概率為 ( B )
A. 6/5 B. 2/3 C. 83/100 D.均不對
18.對事件A和B,下列正確的命題是 ( D )
A.如A,B互斥,則,
也互斥
B. 如A,B相容,則,
也相容
C. 如A,B互斥,且P(A)>0,P(B)>0,則A.B獨立
D. 如A,B獨立,則,
也獨立
19.擲二枚骰子,事件A為出現的點數之和等于3的概率為 ( B )
A.1/11 B. 1/18 C. 1/6 D. 都不對
20.A和B兩事件,若 P(AUB)=0.8,P(A)=0.2,P()=0.4 則下列 ( B )成立。
A. P()=0.32 B. P(
)=0.2
C. P(AB)=0.4 D. P()=0.48
21.隨機地擲一骰子兩次,則兩次出現的點數之和等于8的概率為 ( C )
A. 3/36 B. 4/36 C. 5/36 D. 2/36
22.抽樣推斷中,可計算和控制的誤差是 ( D )
A.登記誤差 B.系統性誤差(偏差)
C.抽樣實際誤差 D.抽樣平均誤差
23.假設檢驗中顯著性水平是 ( B )
A.推斷時犯取偽錯誤的概率 B.推斷時犯取偽棄真的概率
C.正確推斷的概率 D.推斷時視情況而定
24.抽樣調查中,無法消除的誤差是 ( A )
A.隨機誤差 B.工作誤差 C.登記誤差 D.偏差
25.當時,兩個相關變量 ( C )
A.低度相關 B.中度相關
C.高度相關 D.不相關
26.描述一組對稱(或正態)分布資料的離散趨勢時,最適宜選擇的指標是(B)
A.極差 B.標準差 C.均數 D.變異系數
27.以下指標中那一項可用來描述計量資料離散程度(D)
A.算術均數 B.幾何均數 C.中位數 D.極差
28.偏態分布資料宜用下面那一項描述其分布的集中趨勢(C)
A.算術均數 B.標準差 C.中位數 D.四分位數間距
29.下面那一項可用于比較身高和體重的變異度(C)
30.正態曲線下,橫軸上從均數到+∞的面積為(C)
A.97.5% B.95% C.50% D.5%
31.橫軸上,標準正態曲線下從0到1.96的面積為: (D)
A.95% B.45% C.97.5% D.47.5%
32.下面那一項分布的資料,均數等于中位數。(D)
A.對數正態 B.左偏態 C.右偏態 D.正態
33.K-均值類別偵測要求輸入的數據類型必須是( B )。
A整型 B數值型 C字符型 D邏輯型
34.某一特定的X水平上,總體Y分布的離散度越大,即σ2越大,則( A )。
A.預測區間越寬,精度越低 B.預測區間越寬,預測誤差越小
C 預測區間越窄,精度越高 D.預測區間越窄,預測誤差越大
35.如果X和Y在統計上獨立,則相關系數等于( C )。
A.1 B.-1 C.0 D.∞
36.根據決定系數R2與F統計量的關系可知,當R2=1時,有( D )。
A.F=1 B.F=-1 C.F=0 D.F=∞
37.假設兩變量線性相關,兩變量是等距或等比的數據,但不呈正態分布,計算它們的相關系數時應選用( B )。
A. 積差相關 B.斯皮爾曼等級相關
C.二列相關 D.點二列相關
38.回歸模型中,關于檢驗
所用的統計量
,下列說法正確的是( D )。
A.服從 B.服從
C.服從 D.服從
39.下面有關HAVING子句描述錯誤的是(B)。
A:HAVING子句必須與GROUP BY 子句同時使用,不能單獨使用
B:使用HAVING子句的同時不能使用WHERE子句
C:使用HAVING子句的同時可以使用WHERE子句
D:使用HAVING子句的作用是限定分組的條件
40. 是( C )分布的密度函數。
A.指數 B. 二項 C. 均勻 D. 泊松
41.根據判定系數R2與F統計量的關系可知,當R2=1時有( C )。
A.F=1 B.F=-1 C.F=∞ D.F=0
42.在SQL查詢時,使用WHERE子句指出的是(C)。
A:查詢目標
B:查詢結果
C:查詢條件
D:查詢視圖
43.SQL查詢語句中HAVING子句的作用是(C)。
A:指出分組查詢的范圍
B:指出分組查詢的值
C:指出分組查詢的條件
D:指出分組查詢的字段
44.SQL的數據操作語句不包括(D)。
A:INSERT
B:UPDATE
C:DELETE
D:CHANGE
45.SQL語句中查詢條件短語的關鍵字是(A)。
A:WHERE
B:FOR
C:WHILE
D:CONDITION
A:MODIFY TABLE
B:MODIFY STRUCTURE
C:ALTER TABLE
D:ALTER STRUCTURE
47.SQL語句中刪除表的命令是(A)。
A:DROP TABLE
B:DELETE TABLE
C:ERASE TABLE
D:DELETE DBF
二、多選題
48.相關有以下幾種(ABC)。
A.正相關 B.負相關 C.零相關 D.常相關
49.相關系數的取值可以是(ABC)。
A. 0 B.-1 C. 1 D. 2
50.某種產品的生產總費用2003年為50萬元,比2002年多2萬元,而單位產品成本2003年比2002年降低5%,則( ACDE )
A、生產費用總指數為104.17% B、生產費用指數為108.56%
C、單位成本指數為95% D、產量指數為109.65%
E、由于成本降低而節約的生產費用為2.63萬元
51.三個地區同一種商品的價格報告期為基期的108%,這個指數是( BE )
A、個體指數 B、總指數 C、綜合指數
D、平均數指數 E、質量指標指數
52.有關數據庫的說法正確的是(ABCD)
A.元數據是描述數據的數據
B.使用索引可以快速訪問數據庫中的數據,所以可以在數據庫中盡量多的建立索引
C.數據庫中一行叫做記錄
D.數據庫中的每一個項目叫做字段
53.統計數據按來源分類,可以分為(BD)
A.類別數據 B.二手數據
C.序列數據 D.一手數據
E.數值數據
53.以下哪些變量代表RFM方法中的M:( AB )
A.最近3期境外消費金額
B.最近6期網銀平均消費金額
C.信用卡的消費額度
D.距最近一次逾期的月數
54.在作邏輯回歸時,如果區域這個變量,當Region=A時Y取值均為1,無法確定是否出現的是哪個問題?(ABD)
A. 共線性
B. 異常值
C. 擬完全分離(Quasi-complete separation)
D. 缺失值
55.下列Z值( BCD )可以被認為是異常值。
A、0 B、-3 C、6 D、10
56.下列問題( ABC )使用參數檢驗分析方法。
A、評估燈泡使用壽命 B、檢驗食品某種成分的含量
C、全國小學一年級學生一學期的平均課外作業時間 D、全國省市小康指數高低
57.兩獨立樣本t檢驗的前提( ABC )
A、樣本來自的總體服從或近似服從正態分布 B、兩樣本相互獨立
C、兩樣本的數量可以不相等 D、兩樣本的數量相等
58.兩配對樣本t檢驗的前提( ABD )
A、樣本來自的總體服從或近似服從正態分布 B、兩樣本觀察值的先后順序一一對應
C、兩樣本的數量可以不相等 D、兩樣本的數量相等
59.下面給出的t檢驗的結果,( CD )表明接受原假設,顯著性水平為0.05。
A、0.000 B、0.039 C、0.092 D、0.124
60.方差分析的基本假設前提包括( AC )
A、各總體服從正態分布 B、各總體相互獨立
61.下列( ABC )屬于多選項問題。
A、購買保險原因調查 B、高考志愿調查
C、儲蓄原因調查 D、各省市現代化指數分析
A、凝聚方式聚類 B、分解方式聚類 C、Q型聚類 D、R型聚類
——學數據分析技能一定要了解的大廠入門券,CDA數據分析師認證證書!
CDA(數據分析師認證),與CFA相似,由國際范圍內數據科學領域行業專家、學者及知名企業共同制定并修訂更新,迅速發展成行業內長期而穩定的全球大數據及數據分析人才標準,具有專業化、科學化、國際化、系統化等特性。
“CDA數據分析師認證”是一套專業化,科學化,國際化,系統化的人才考核標準,分為CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ,涉及金融、電商、醫療、互聯網、電信等行業大數據及數據分析從業者所需要具備的技能,符合當今全球大數據及數據分析技術潮流,為各界企業、機構提供數據分析人才參照標準。
報名方式
登錄CDA認證考試官網注冊報名>>點擊報名
報名費用
Level Ⅰ:1200 RMB
Level Ⅱ:1700 RMB
Level Ⅲ:2000 RMB
考試地點
Level I+II:中國區30+省市,70+城市,250+考場,考生可就近考場預約考試 >看看我所在的地哪里報名<
Level III:中國區30所城市,北京/上海/天津/重慶/成都/深圳/廣州/濟南/南京/杭州/蘇州/福州/太原/武漢/長沙/西安/貴陽/鄭州/南寧/昆明/烏魯木齊/沈陽/哈爾濱/合肥/石家莊/呼和浩特/南昌/長春/大連/蘭州>看看我所在的地哪里報名<
報考條件
CDA Level I >了解更多<
? 報考條件:無要求。
? 考試時間:隨報隨考。
CDA Level II >了解更多<
? 報考條件:獲得CDA Level I 認證證書;
? 考試時間:隨報隨考。
CDA Level III >了解更多<
? 報考條件:獲得CDA Level II認證證書
? 考試時間:一年四屆 3月、6月、9月、12月的最后一個周六。
——熱門課程推薦:
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《劉靜:10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda ...
2025-04-23