熱線電話:13121318867

登錄
首頁大數據時代【干貨】大廠數據分析師面試,最常犯的2個技術錯誤
【干貨】大廠數據分析師面試,最常犯的2個技術錯誤
2025-01-29
收藏

01專家簡介

徐楊老師,CDA數據科學研究院教研副總監,主要負責CDA認證項目以及機器學習/人工智能類課程的研發與授課,負責過中國人民銀行結算中心數據分析內訓、華夏銀行數據分析內訓、蘇州銀行總行數據挖掘內訓項目,英國影子銀行風險監管分析,紐約市場對香港市場高頻交易分析項目。

在大廠的技術面試中,有兩個地方是非常有難度的。很多小伙伴都折在的這兩個地方。

1、算法的筆試題

我們知道大部分人在寫算法的時候,通常都是把函數的前幾個字母打出來,或者變量名的前幾個字母打出來。按一下Tab或者按一下快捷鍵,就可以帶出整個的函數名,然后自己就可以繼續往后去寫了。

比如說,之前就有一位小伙伴在筆試的時候拿到了一個手寫算法的題。

那么分類算法比較好的有什么?有XGBoost,對吧?于是,小伙伴大筆一揮寫下了import XGBoost。

扣分的原因是什么?

sklearn里那個包的名字叫什么?叫XGBoost嗎?不是,那個包的名字叫XGBClassifier。

這是一個很讓人痛苦的事情,算法你會,但是你寫不出來。

那就要求大家在日常的學習與工作中,一定要把常用的算法語句用的滾瓜爛熟,才可以讓我們在這樣的問題上有比較好的回答成果。

CDA數據分析師的能力測試大家可以抽空做做,提高一下自己對模型、函數的敏感度。

2、技術問題深挖掘

第二個在大廠面試中的難點是,把一個技術問題往下深挖好幾次。

比如說最簡單的一個算法回歸分析。有可能在面試的時候面試官問你:

—— 同學,線性回歸會嗎?

—— 線性回歸不能有共線性,你知道嗎?

Ok,開始提問。

你解釋了一下。我相信大部分小伙伴都可以解釋的很清楚。

下面再往下挖一層:怎么檢測共線性?

有的小伙伴可能直接就說,共線性嘛,系相關系數就可以啊。

結果被扣分了。為什么?

我們現在要檢測的是線性回歸里的相關性,那是要考慮偏相關問題的。只用相關技術矩陣可以嗎?不夠用的,應該用一些更加深入的指標,比如說VIF值等等去檢測。

比如說這個問題你正確的回答了出來,檢測變量之間的相關性,可以使用VIF值。

那就再往下挖,為什么要檢測變量之間的相關性呢?

如果我不考慮這個問題會有怎樣的結果出現,那么你不能只回答,如果不考慮共線性問題的話,我這個模型預測效果不好。

顯然面試官想要的不是這么直接的回答,他想問你的是這個問題的技術細節。

所以你在這個地方應該回答出的是

如果我們不處理共線性的問題,就會導致最后最小二乘法所需要的逆矩陣在被計算的時候,這個矩陣的行列式的值就會非常小。于是導致我們求出來的逆矩陣就會非常的大。這是一個非常不好的結果。你求出的矩陣,用這個矩陣算出來的所有參數的取值全都趨近于正無窮,你覺得這個效果能好嗎?顯然有問題。

如果到這兒你仍然可以準確的回答出來,這已經被挖了三次了,但是你要知道這個問題還可以繼續往后挖。

我們再往后挖就是,如果普遍檢測出了一共10個變量,這10個變量普遍VIF值都比較高,我們有什么好的方法來處理?

有同學可能馬上就會說,正則化方法嘛。

正則化方法又可以問問題了。

正則化方法有偏還是無偏?用完了以后效果怎么樣?哪個包可以實現?

我們發現這種技術問題,面試官可以就一個點給你一直往下深挖好幾層。

我看過一個調查,同一個問題,當一般往下深挖到第5層的時候,大部分人就已經回答不出來了。

所以這就要求大家平時在學習與工作中,要把每一個技術細節都掌握好,要把技術細節之間的聯系找到。因為往下深挖,其實挖的就是這些技術點之間的聯系,這是第二個在大場面之中非常容易折的一個點。

CDA數據分析師認證考試的一級和二級都注重對基礎概念和知識的挖掘,這些考點都是結合給大廠、銀行、金融機構內訓總結出來的工作中最實用的技能和知識點。

抓住機遇,狠狠提升自己

隨著各行各業進行數字化轉型,數據分析能力已經成了職場的剛需能力,這也是這兩年CDA數據分析師大火的原因。和領導提建議再說“我感覺”“我覺得”,自己都覺得心虛,如果說“數據分析發現……”,肯定更有說服力。想在職場精進一步還是要學習數據分析的,統計學、概率論、商業模型、SQL,Python還是要會一些,能讓你工作效率提升不少。備考CDA數據分析師的過程就是個自我提升的過程。

CDA 考試官方報名入口:https://www.cdaglobal.com/pinggu.html

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢