熱線電話:13121318867

登錄
首頁學生感言在CDA學成之后,終于拿到了我的理想offer!
在CDA學成之后,終于拿到了我的理想offer!
2021-12-13
收藏


上海57期數據分析就業班學員


姓名:譚同學
畢業院校:湖南大學
專業:軟件工程
入職信息:上海某汽車公司,數據分析師,薪資保密,上海

各位同學大家好,很榮幸接到李智老師的邀請,分享一些個人的收獲給大家。以下是本人面試完,到最終拿到期望offer后的一些心得體會,希望可以給大家提供一些幫助!
根據本人的面試經驗,本文主要做些課堂補充。


數據崗位大體分為兩類:1業務數據分析;2數據建模


1、 業務數據分析技能:Tableau+數據思維


數據思維:漏斗、留存、指標體系都是最為基本的,想要高薪需要具體業務的分析和推進思路,這方面我至今不到火候,就不班門弄釜了

2、 數據建模


個人把模型方面分為三部分
2.1第一部分:監督算法模型主力:回歸模型+決策樹+集成算法模型
金融崗愛問
2.1.1回歸模型
損失函數L1,L2及其區別、邏輯回歸公式推導
2.1.2集成算法模型(風投愛問)
隨機森林、GBDT、XGB,特點+意義
2.2第二部分:監督補充sank(svm+ann+nb+knn)
SVM公式推導
2.3第三部分:非監督算法模型:關聯+聚類
2.3.1關聯
apriori可以拓展到推薦模型,結合協同過濾知識點一并交流(市場對推薦模型有偏好,問得多)
2.3.2聚類
kmeans的算法步驟:迭代地確定簇心,調整簇數據,直至簇心穩定
kmeans分箱是非監督分箱的一種

3、特征工程


處理缺失、異常值、共線性、數據不平衡性、編碼、歸一化、分箱、降維。。。。

缺失值:83法,小于30%填補+大于80%考慮刪除+之間可獨立成一項
異常值:蓋帽法
不平衡性:過采樣+欠采樣(各自的處理方案最好心里有數,可以適當做一定的拓展閱讀)
歸一化:提高模型收斂速度和精度
分箱:分為監督分箱+非監督分箱(分別有哪些,心里要有數)
降維:分為線性降維+非線性降維(分別有哪些,心里要有數)
按上述展開方案,特征工程這塊就能聊很久,可使簡歷上的項目生動形象

4、相關問題


這些算是我的直接面經吧,答案都在課堂+自我拓展里,準備不到位免不了到場卡殼
4.1特征工程耗時70%,你們都做了什么?
4.2寫一下邏輯回歸的推導公式
4.3寫一下SVM的推導公式
4.4邏輯回歸交叉熵公式?
4.5決策樹熵增益公式?GINI公式?
4.6評分卡
4.6.1為什么要對原始數據進行卡方分箱?不可以直接使用原始數據嗎?
4.6.2降維的方法有哪些?你知道PCA的原理嗎?
4.7寫一下apriori支持度、置信度、提升度公式?你還知道其他指標嗎?
4.8bagging、boosting的區別?

最后,非常感謝CDA的這個學習平臺,學習期間收獲頗多,同時也感謝同學和各位老師們提供的幫助,希望CDA越來越好,可以培育出更多的優秀分析師?。?!

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢