熱線電話:13121318867

登錄
首頁精彩閱讀讓R語言和Python共舞
讓R語言和Python共舞
2017-04-08
收藏

R語言和Python共舞

Python和R已經成為數據分析中兩大利器,兩者各有所長,相互借鑒。

Python 的 pandas 從 R 中偷師 dataframes,R 中的 rvest 則借鑒了 Python 的 BeautifulSoup,我們可以看出兩種語言在一定程度上存在的互補性。通常,我們認為 Python 比 R 在泛型編程上更有優勢,而 R 在數據探索、統計分析是一種更高效的獨立數據分析工具。所以說,同時學會Python和R這兩把刷子才是數據科學的王道。本文將介紹R和Python的應用場景,同時介紹在Windows環境下如何安裝R和Python的共舞通道——rpy2。

Python的應用場景

網絡爬蟲/抓?。罕M管 rvest 已經讓 R 的網絡爬蟲/抓取變得容易,但 Python 的 beautifulsoup 和 Scrapy 更加成熟、功能更強大,結合django-scrapy我們可以很快的構建一個定制化的爬蟲管理系統。

連接數據庫: R 提供了許多連接數據庫的選擇,但 Python 只用 sqlachemy 通過ORM的方式,一個包就解決了多種數據庫連接的問題,且在生產環境中廣泛使用。Python由于支持占位符操作,在拼接SQL語句時也更加方便。

內容管理系統:基于Django,Python可以快速通過ORM建立數據庫、后臺管理系統,而R中的 Shiny 的鑒權功能暫時還需要付費使用。

API構建:通過Tornado這個標準的網絡處理庫,Python也可以快速實現輕量級的API,而R則較為復雜。

R的應用場景

統計分析: 盡管 Python 里 Scipy、Pandas、statsmodels 提供了一系列統計工具 ,R 本身是專門為統計分析應用建立的,所以擁有更多此類工具,尤其是在計量經濟學方面的包,是Python無法比擬的。

互動式圖表/面板: 近來 bokeh、plotly、 intuitics 將 Python 的圖形功能擴展到了網頁瀏覽器,甚至我們可以用tornado+d3來進一步定制可視化頁面,但 R 的 shiny 和 shiny dashboard 速度更快,所需代碼更少。

如何實現R語言和Python的完美結合

Python和R共享文件,將Python清理好的數據儲存成cvs等格式,再交給R進行進一步的回歸分析和圖表繪制等。

讓Python直接調用R函數;目前可以通過第三方庫——rpy2實現R語言和Python的互通。

顯然第二種方法可行性較高,但是windows環境下,rpy2的安裝經常報錯,我之前在安裝rpy2時遇到了無數的坑,所以將經驗共享給大家。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢