熱線電話:13121318867

登錄
首頁精彩閱讀數據分析/數據挖掘/機器學習必讀書目
數據分析/數據挖掘/機器學習必讀書目
2016-06-23
收藏
總結一下我讀過的機器學習/數據挖掘/數據分析方面的書,有的適合入門,有的適合進階,沒有按照層次排列,先總結一下,等總結的差不多了再根據入門--->進階分塊寫。下面列的書基本上我寫的都是讀完過的,不然不敢寫,怕誤人子弟  = =

///數據分析篇

實習的時候只會Matlab,公司小,沒錢買正版,所以領導要我兩星期把R學會,當時看的有這些書

1.R語言實戰
https://book.douban.com/subject/20382244/

評價:很好的入門書,從安裝、入門、基本的統計分析,作圖命令,以及常見的分類、回歸、降維等方法都有寫

推薦指數:★★★★★

2.數據分析-R語言實戰
https://book.douban.com/subject/25953866/

評價:專門用R語言寫的數據分析的書,掌握R的基礎后可以看看,側重數據分析的基本方法,介紹了一些常見的分析方法,比較基礎。

推薦指數:★★★★☆

3.探索性數據分析
https://book.douban.com/subject/1551897/

評價:外國人寫的書,但是翻譯真的太爛了。而且內容其實沒什么干貨啊,關于分位數、展布等這些概念直接找本統計學的教材看看吧。

推薦指數:★★★☆

4.R語言編程藝術
https://book.douban.com/subject/24699632/

評價:在圖書館意外發現了這本好書,對于R中的數據結構和性能提升講的不錯。

推薦指數:★★★★

5.利用Python進行數據分析
https://book.douban.com/subject/25779298/

評價:這本書是pandas模塊的作者寫的書,一句話總結:Pandas使用手冊。如果用Python做數據分析,基本上Pandas是必不可少的包。

推薦指數:★★★★

///數據挖掘/機器學習

1.大數據時代的R語言 數據挖掘R語言實戰
https://book.douban.com/subject/25901568/

評價:和上面的“數據分析-R語言實戰”好像是一個系列的,基本上常見的數據挖掘方法都介紹了,有理論有實例,適合入門。

推薦指數:★★★★

2.數據挖掘概念與技術
https://book.douban.com/subject/2038599/

評價:入門書,理論多,好像是很多研究生學數據挖掘的教材,很詳細,孟小峰老師的翻譯還是不錯的,相對很多翻譯很爛的還是可以的。

推薦指數:★★★★

3.機器學習實戰
https://book.douban.com/subject/24703171/

評價:Python寫的,沒有Python基礎的話還是先學學Python吧,基本上都是實例為主,代碼很詳細,講的也很通俗易懂,github上可以下載代碼

推薦指數:★★★★★

4.集體智慧編程
https://book.douban.com/subject/3288908/

評價:機器學習實戰一起看的,也基本上都是實例,翻譯的也可以,比“探索性數據分析”的翻譯好多了??!有代碼,可以實操,基本上真正掌握了可以應對一般的數據挖掘的需求了。

推薦指數:★★★★★

5.統計學習方法
https://book.douban.com/subject/10590856/

評價:李航博士寫的機器學習常見算法的數學推導,講的算是比較詳細了,對于有數學基礎的還是很好理解的,如果沒有數學基礎,可以先看看數分高代凸優化之類的書再看。適合有一定基礎的學習。

推薦指數:★★★★★

6.推薦系統實戰
https://book.douban.com/subject/10769749/

評價:看名字就知道是講推薦系統的,對于不知道推薦系統是啥的可以好好看看,看完基本上了解推薦系統的大概框架和流程,也有一些例子,但是每個例子以及理論都講的很淺,沒有深入,只適合入門。

推薦指數:★★★★

7.數據挖掘導論
https://book.douban.com/subject/5377669/

評價:實習的同事本科時上課的教材,也是一部大巨頭啊,外國人寫的書,很通俗易懂,非常非常詳細。

推薦指數:★★★★

以下是關于hadoop/Python/Spark的書,以及一些比較不錯的論文。

8.Spark快速大數據分析
https://book.douban.com/subject/26616244/

評價:8.4/10,很薄的一本書,主要介紹的Spark的基本語法命令之類的,適合快速入門,Learning Spark的中文版

推薦指數:★★★★★

9.Spark高級數據分析
https://book.douban.com/subject/26647951/

評價:豆瓣上評價很少,但是我買回來看了以后發現還是不錯的,基本上從分類,聚類,推薦,征信這幾塊都有實例講解,比較詳細,看的也很快,上手不錯。

推薦指數:★★★★★

10.Hadoop權威指南
https://book.douban.com/subject/6523762/

評價:7.8/10,很厚,Hadoop講的很深,不太適合入門,適合做數據倉庫的人看,數據挖掘的可以先看看hadoop實戰

推薦指數:★★★

11.Hadoop實戰
https://book.douban.com/subject/20275953/

評價:7.0/10,我看的是國內的一個教授寫的,并不是“Hadoop in anction”的中文譯本,這個寫的很淺,適合入門,但是感覺還是Hadoop in action 寫的好一些

推薦指數:★★★☆

12.Hive編程指南
https://book.douban.com/subject/25791255/

評價:7.4/10 ,講Hive操作的,講真,如果真的只想了解下hive怎么操作,可以不用看這本書,直接去搜一下hive編程命令集合就可以了,這本書比較適合ETL的人,如果只是數據挖掘入門入門的話可以暫時先不用看這本書。但是書本身講的還是很好的

推薦指數:★★★★

13.R語言與網站分析
https://book.douban.com/subject/25854151/

評價:7.4/10,本來只是去國圖偶然看到的一本書,但是看了幾章后覺得講的挺清晰,而且后面的實例講的挺好的,就去亞馬遜上買了kindle電子書,關聯規則和社群分析講的都挺不錯的,看的特別快。

推薦指數:★★★★

14.R的極客理想工具篇
https://book.douban.com/subject/25962666/

評價:7.5/10,作者是張丹,最開始是關注他的博客,寫的很清晰,步驟也很明確,對于學習R的人來說是個不錯的學習地方。這本書后面幾張講的主要是R的性能、以及數據庫、hadoop、hive結合起來做的方法,值得一看。

推薦指數:★★★★

15.Mysql必知必會
https://book.douban.com/subject/3354490/

評價:8.4/10,不多說,入門Mysql必讀書,很薄的一本小冊子。

推薦指數:★★★★★

16.高性能MySQL
https://book.douban.com/subject/4241826/

評價:8.7/10,專業級的MySQL書籍,適合進階,但是中文翻譯很爛,買英文版英文版英文版

推薦指數:★★(還有三顆星給了英文版)

17.凸優化
https://book.douban.com/subject/21249088/

評價:9.4/10,很好的教材,而且很全,之前上數值分析這門課學的很多內容都包含在里面了,機器學習的很多概念也可以在里面找到,讀完可以讓你更深入的理解機器學習,而不是僅僅只會套用包。

推薦指數:★★★★★

18.Pattern Recognition and Machine Learning
https://book.douban.com/subject/2061116/

評價:9.6/10,PRML是機器學習的經典教材啊,非常值得看!有人翻譯了中文版的,如果需要的話可以留言我把鏈接發出來~

推薦指數:★★★★★

19.統計自然語言處理
https://book.douban.com/subject/25746399/

評價:8.8/10,做自然語言處理的入門書,書很厚,但是講的很多概念性的東西,卻一點也不覺得枯燥,唯一的缺點就是,大概因為是經典教材類的書,所以實例比較少,有點像綜述,大而全,如果想實戰,可以看看Python寫的一本自然語言處理的書,nltk,忘記叫啥名了,想起來了貼上來(評論里有人補充了,貼一個,Natural Language Processing with Python  https://book.douban.com/subject/3696989/)

推薦指數:★★★★

20.機器學習
https://book.douban.com/subject/26708119/

評價:上次居然忘了寫這本書,周志華老師的新書,公式推導很詳細,豆瓣評分9.2,周老師在講數據挖掘的算法之前先講了如何評估算法的效果與選擇,可以宏觀的了解機器學習一些基礎知識,在之后學習算法的時候對于它們的適用場景也會有個大概的了解。作者的思路很清晰,強烈推薦?。?!

推薦指數:★★★★★

再推薦幾本科普書,業余可以看看提升下興趣

· 從0到1
· 大數據時代
· 浪潮之巔
· 數學之美

· 數據之巔

本文由CDA作者庫成員Charlotte原創,并授權發布。轉載請獲得授權并注明來源

原文:http://www.cnblogs.com/charlotte77/p/5381681.html

CDA作者庫凝聚原創力量,只做更有價值的分享。

如果你也想推薦優質文章,請微信添加trasn863為好友,或發送郵件至songpeiyang@pinggu.org




數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢