K近算法之巴氏距離 巴氏距離(BhattacharyyaDistance),在統計中,Bhattacharyya距離測量兩個離散或連續概率分布的相似性。它與衡量兩個統計樣品或種群之間的重疊量的Bhattacharyya系數密切相關。 ...
2014-11-30K近算法之馬氏距離 馬氏距離(MahalanobisDistance) (1)馬氏距離定義 有M個樣本向量X1~Xm,協方差矩陣記為S,均值記為向量μ,則其中樣本向量X到u的馬氏距離表示為: ...
2014-11-30K近算法之標準化歐氏距離 標準化歐氏距離(StandardizedEuclideandistance),標準化歐氏距離是針對簡單歐氏距離的缺點而作的一種改進方案。標準歐氏距離的思路:既然數據各維分量的分布不一樣,那先將各個分 ...
2014-11-30K近算法之閔可夫斯基距離 閔可夫斯基距離(MinkowskiDistance),閔氏距離不是一種距離,而是一組距離的定義。 (1)閔氏距離的定義 兩個n維變量a(x11,x12,…,x1n) ...
2014-11-30切比雪夫距離_數據分析師 若二個向量或二個點p、andq,其座標分別為及,則兩者之間的切比雪夫距離定義如下:, 這也等于以下Lp度量的極值:,因此切比雪夫距離也稱為L∞度量。 以數學的 ...
2014-11-29曼哈頓距離_數據分析師 我們可以定義曼哈頓距離的正式意義為L1-距離或城市區塊距離,也就是在歐幾里得空間的固定直角坐標系上兩點所形成的線段對軸產生的投影的距離總和。例如在平面上,坐標(x1,y1)的 ...
2014-11-29K近鄰的距離度量表示法 我們看到,K近鄰算法的核心在于找到實例點的鄰居,這個時候,問題就接踵而至了,如何找到鄰居,鄰居的判定標準是什么,用什么來度量。這一系列問題便是下面要講的距離度量表示 ...
2014-11-29什么是K近鄰算法_數據分析師 何謂K近鄰算法,即K-Nearest Neighbor algorithm,簡稱KNN算法,單從名字來猜想,可以簡單粗暴的認為是:K個最近的鄰居,當K=1時,算法便成了最近鄰算法,即尋找最近的那個鄰居 ...
2014-11-29數據挖掘中所需的概率論Landon的推導(九)_數據分析師 Landon的推導(1941) 第三條道是一位電氣工程師,Vernon D. Landon 給出的。1941年,Landon 研究通信電路中的噪聲電壓,通過分析經驗數據他發 ...
2014-11-29數據挖掘中所需的概率論與數理統計知識(十) 正態分布和最大熵 還有一條小徑是基于最大熵原理的,物理學家E.T.Jaynes在最大熵原理上有非常重要的貢獻,他在《概率論沉思錄》里面對這個方法有描述和 ...
2014-11-29數據挖掘中所需的概率論(八)Herschel(1850)和麥克斯韋(1860)的推導 Herschel(1850)和麥克斯韋(1860)的推導 第二條小徑是天文學家John Hershcel和物理學家麥克斯韋(Maxwell)發現的。1850年,天文 ...
2014-11-29數據挖掘中所需的概率論 高斯的推導(七)數據分析師 論道正態,正態分布的4大數學推導 如本blog內之前所說:凡是涉及到要證明的東西.理論,便一般不是怎么好惹的東西。絕大部分時候,看懂一個東西不難, ...
2014-11-29數據挖掘中所需的概率論與數理統計知識(六 ) 高斯導出誤差正態分布 事實上,棣莫弗早在1730年~1733年間便已從二項分布逼近的途徑得到了正態密度函數的形式,到了1780年后,拉普拉斯也推出了中心極 ...
2014-11-29數據挖掘中所需的概率論與數理統計知識(五) 拉普拉斯的工作 在1772-1774年間,拉普拉斯也加入到了尋找誤差分布函數的隊伍中。與辛普森不同,拉普拉斯不是先假定一種誤差分后去設法證明平均值的優良性 ...
2014-11-29大數據流程處理“三要”“三不要”_數據分析師 大數據時代處理數據的三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果。 具體的大數據處理方法確實有很多,但是根據筆者長時間的實踐,總結 ...
2014-11-28大數據時代_大數據分析將走向何方_數據分析師 現階段關于大數據的未來,下一步是什么,我們如何利用數據在更深的層面提取有意義的消費者信息來超越我們現在的程度?最標準的答案是從比以往更 多的設備上實 ...
2014-11-28大數據實踐 基礎架構先行_數據分析師 大數據被認為是下一個創新、競爭和生產力的前沿,誰率先抓住大數據的先機即意味著能夠在未來市場競爭之中取得桿位。當前大數據市場除了傳統廠商之外,還同時涌現出一大批 ...
2014-11-28解讀讓大數據價值圓滿實現的四條建議 大數據分析可創造出大量的價值。正如大多數有價值的工作一樣,大數據值得我們投入時間和精力去挖掘其中的價值。 基于這種經驗,筆者在下方給出了四條建議,用于 ...
2014-11-28【連載5】如何用spss做加權最小二乘回歸及嶺回歸 上一節我們講到一般多元線性回歸的操作方法。本節要介紹的是多元線性回歸的其他幾種情況。包括適用于含有加權變量的加權最小二乘回歸方程等。然后繼續討論上 ...
2014-11-28【連載4】 如何用spss做一般(含虛擬變量)多元線性回歸 回歸一直是個很重要的主題。因為在數據分析的領域里邊,模型重要的也是主要的作用包括兩個方面,一是發現,一是預測。而很多時候我們就要通過回歸來進 ...
2014-11-28CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25