熱線電話:13121318867

登錄
首頁精彩閱讀為什么機器學習的框架都偏向于Python
為什么機器學習的框架都偏向于Python
2017-05-13
收藏

為什么機器學習的框架都偏向于Python

總結:好寫、支持全面、好調、速度不慢。

1.Python是解釋語言,這讓寫程序方便不只一點。舉例來說,在C等編譯語言里寫一個矩陣乘法,需要自己分配操作數(矩陣)的內存、分配結果的內存、手動對BLAS接口調用gemm、最后如果沒用smart pointer還得手動回收內存空間。Python幾乎就是import numpy; numpy.dot兩句話的事。
Update (2015-5-7):當然現在很多面向C/C++庫已經支持托管的內存管理了,這也讓開發過程容易了很多,但解釋語言仍然有天生的優勢——不需要編譯時間。這對機器學習這種需要大量prototyping和迭代的研究方向是非常有益工作效率的。

2.Python的開發生態成熟,有很多非常有用的庫可以用。除了上面說到的NumPy,還有SciPy、NLTK、os(自帶)等等不一而足。Python靈活的語法還使得包括文本操作、list/dict comprehension等非常實用的功能非常容易高效實現(編寫和運行效率都高),配合lambda等使用更是方便。這也是Python良性生態背后的一大原因。相比而言,Lua雖然也是解釋語言,甚至有LuaJIT這種神器加持,但其本身很難做到Python這樣,一是因為有Python這個前輩占領著市場份額,另一個也因為它本身種種反常識的設計(比如全局變量)。不過借著Lua-Python bridge和Torch的東風,Lua似乎也在寄生興起。

3.寫程序方便對做機器學習的人很重要。因為經常需要對模型進行各種各樣的修改,這在編譯語言里很可能是牽一發而動全身的事情,Python里通??梢杂煤苌俚臅r間實現。

4.Python的效率不差。解釋語言的發展已經大大超過許多人的想象。很多比如list comprehension的語法糖都是貼近內核實現的。除了JIT[1]之外,還有Cython可以大幅增加運行效率。最后,得益于Python對C的接口,很多像gnumpy, theano這樣高效、Python接口友好的庫可以加速程序的運行,在強大團隊的支撐下,這些庫的效率可能比一個不熟練的程序員用C寫一個月調優的效率還要高。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢