熱線電話:13121318867

登錄
首頁精彩閱讀談談數據挖掘和機器學習
談談數據挖掘和機器學習
2016-08-17
收藏

談談數據挖掘機器學習

首先聲明的是本人并非數據挖掘機器學習的高手,只是作為業余興趣剛剛開始研究,據我所知好多朋友也和我一樣對這方面的東西感興趣,個人認為機器人技術是未來發展的方向。雖然我的專業是軟件開發,基于Windows的,基于linux的,但是我認為未來的軟件開發可能面對的硬件將會是多元化的,適當的了解一下未來的趨勢也不為過。

本來想從機器學習開始,但是通過對業內人士的咨詢,朋友建議我從數據挖掘開始,通過近一個月的學習,對數據挖掘的基本思想有了些粗淺的認識,分享出來,希望和大家共同快樂,共同進步。在這樣的信息爆炸的時代,我希望對每個重要的知識點用一句話通俗的表達出來,既然是入門篇,讓大家看明白了最重要。


分類和決策樹

分類技術要解決的問題是從一批已知的完整記錄中學習到一顆決策樹或者一個模型,然后應用這個模型對未知的數據屬性進行預測或分類。有時候對于一些現實的問題,我們無法通過純數學的解析式表打自變量和因變量的關系時,我們就可能降低要求,從精確的解析式到模型足夠好,可以解釋大部分的現象,解決大部分的問題,通過分類技術和決策樹就可以解決一部分問題。

下面是一個簡單的決策樹歸納算法實現

關聯分析 

關聯分析要解決的問題是通過算法找出隱含在數據中的關聯,比如買尿布的人大部分也買啤酒,買啤酒的人大部分也買花生米,有了關聯就可以做針對性的廣告或者商業分析。

聚類分析 

聚類分析要解決的問題是將數據分成內部高內聚,外部低耦合的集合,這樣對相似的事物進行分析就會更有針對性。

異常檢測 

一批數據中總有些數據記錄的性質和其他大部分的數據差別很大,對有些分析我們需要找出這些數據并排除其對整體的影響,當然在某些極端的情況下對異常數據的深入研究也是有必要的。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢