
CDA數據分析師 出品
作者:徐楊老師
編輯:Mika
大家好,我是徐楊老師。
上期給大家分享了一些數據分析師面試基礎指南,這期給大家分享一些大廠面試的技術難點。
話不多說,進入正題。
在大廠的技術面試中,有兩個地方是非常有難度的。很多小伙伴都折在的這兩個地方。
第一個地方,算法的筆試題,而且是手寫算法的筆試題。
我們知道大部分人在寫算法的時候,通常都是把函數的前幾個字母打出來,或者變量名的前幾個字母打出來。按一下Tab或者按一下快捷鍵,就可以帶出整個的函數名,然后自己就可以繼續往后去寫了。
但是如果不過我需要你手寫一個算法,顯然這是不夠的。你只有一張白紙,沒有快捷鍵可以幫你自動調出函數名。
比如說,之前就有一位小伙伴在筆試的時候拿到了一個手寫算法的題。
題目很簡單,就是讓他實現一個分類算法。
那么分類算法比較好的有什么?有XGBoost,對吧?于是,小伙伴大筆一揮寫下了import XGBoost。
于是,被扣分。
扣分的原因是什么?sklearn里那個包的名字叫什么?叫XGBoost嗎?不是,那個包的名字叫XGBClassifier。
所以說如果你不熟悉這個算法語句中的所有細節,你在手寫的時候就類似于寫一篇英語作文,可是你忘了單詞怎么拼。
這是一個很讓人痛苦的事情,算法你會,但是你寫不出來。
因此這是第一個技術難點,手寫算法。
那就要求大家在日常的學習與工作中,一定要把常用的算法語句用的滾瓜爛熟,才可以讓我們在這樣的問題上有比較好的回答成果。
第二個在大廠面試中的難點是,把一個技術問題往下深挖好幾次。
比如說最簡單的一個算法回歸分析。有可能在面試的時候面試官問你:
—— 同學,線性回歸會嗎?
—— 當然會。
—— 線性回歸不能有共線性,你知道嗎?
—— 當然知道。
Ok,開始提問。
什么是線性回歸你的共線性?
你解釋了一下。我相信在座的小伙伴都可以解釋的很清楚。
下面再往下挖一層:怎么檢測共線性?
有的小伙伴可能直接就說,共線性嘛,系相關系數就可以啊。
結果被扣分了。為什么?
我們現在要檢測的是線性回歸里的相關性,那是要考慮偏相關問題的。只用相關技術矩陣可以嗎?不夠用的,應該用一些更加深入的指標,比如說VIF值等等去檢測。
比如說這個問題你正確的回答了出來,檢測變量之間的相關性,可以使用VIF值。
那就再往下挖,為什么要檢測變量之間的相關性呢?
如果我不考慮這個問題會有怎樣的結果出現,那么你不能只回答,如果不考慮共線性問題的話,我這個模型預測效果不好。
顯然面試官想要的不是這么直接的回答,他想問你的是這個問題的技術細節。
所以你在這個地方應該回答出的是:
如果我們不處理共線性的問題,就會導致最后最小二乘法所需要的逆矩陣在被計算的時候,這個矩陣的行列式的值就會非常小。于是導致我們求出來的逆矩陣就會非常的大。這是一個非常不好的結果。
你求出的矩陣,用這個矩陣算出來的所有參數的取值全都趨近于正無窮,你覺得這個效果能好嗎?顯然有問題。
如果到這兒你仍然可以準確的回答出來,這已經被挖了三次了,但是你要知道這個問題還可以繼續往后挖。
我們再往后挖就是,如果普遍檢測出了一共10個變量,這10個變量普遍VIF值都比較高,我們有什么好的方法來處理?
有同學可能馬上就會說,正則化方法嘛。
正則化方法又可以問問題了。
正則化方法有偏還是無偏?用完了以后效果怎么樣?哪個包可以實現?
我們發現這種技術問題,面試官可以就一個點給你一直往下深挖好幾層。
我看過一個調查,同一個問題,當一般往下深挖到第5層的時候,大部分人就已經回答不出來了。
所以這就要求大家平時在學習與工作中,要把每一個技術細節都掌握好,要把技術細節之間的聯系找到。因為往下深挖,其實挖的就是這些技術點之間的聯系,這是第二個在大場面之中非常容易折的一個點。
最后,這里再分享一個考試備考過程中人人皆需的模擬題庫——CDA考試模擬題庫。
題庫是緊密結合CDA考試大綱而編寫的一套模擬試題庫。為順利通過考試奠定堅實的基礎
1、解析詳盡:每道題目基本上都配備了詳細的解析和答案,幫助你深入理解題目背后的知識點和解題思路。
2、便捷高效:你可以隨時隨地通過手機或電腦訪問題庫,進行自主學習和練習,充分利用碎片時間,提高備考效率。
3、模擬考試:題庫提供了多套模擬考試試卷,幫助你熟悉考試流程和題型。
以上就是今天給小伙伴們的分享,希望對大家有幫助,謝謝大家。
點擊CDA題庫鏈接,獲取免費版CDA題庫入口,??荚図樌?,快速拿證!
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24