熱線電話:13121318867

登錄
首頁精彩閱讀關于機器學習需要了解的知識
關于機器學習需要了解的知識
2019-03-06
收藏


當我們要學習人工智能的時候,我們需要學習很多的知識,比如機器學習、深度學習等。一般來說,機器學習是人工智能的核心知識,要想學好人工智能就必須重視機器學習的知識。在這篇文章中我們給大家介紹一下關于機器學習需要了解的知識。


當然,說到機器學習就必須要說一下機器學習算法,在機器學習算法中,尤其是神經網絡被認為是新的人工智能革命的起因。而機器學習中涉及到了增強學習,那么什么是增強學習呢?數據驅動算法可以分為三類:監督式、非監督式和增強學習。監督式學習和非監督式學習通常用于執行諸如圖像分類、檢測等任務,雖然它們的精確度是顯著的,但這些任務不同于我們所期望的智能。而這些就是增強學習的來源。而增強學習的原理還是很簡單的,環境給agent一個正確的東西給予獎勵,并且對于錯誤的東西來懲罰它。


下面我們就給大家介紹一下增強學習中的算法,有兩種應用廣泛的增強學習算法,分別是Q Learning和Deep Q Learning,其中Q Learning是一種應用廣泛的增強學習算法。如果不進行詳細的數學運算,給定的動作質量取決于agent處于什么狀態。agent通常執行給予最大回報的操作。當然,在這個算法中,agent根據環境給予多少回報來學習每個動作的質量。每個環境的狀態值以及Q值通常存儲在表中。當agent與環境交互時,Q值從隨機值更新到實際上有助于最大化回報的值。而Deep Q Learning則是Q Learning的拓展,這是因為Q Learning的使用表的問題在于它不能很好地擴展。如果狀態數太高,該表將不適合于內存。這就是Deep Q Learning可以應用的地方。深度學習基本上是一種通用的近似機器,它能理解抽象的表示。深度學習可以用來近似Q值,也可以通過梯度下降學習Q值。


在增強學習中,在訓練數據的情況下總會有經驗回放,這是因為在訓練神經網絡時,數據不平衡起著非常重要的作用。如果一個模型被訓練,當agent與環境交互時,就會出現不平衡。所以,所有狀態以及相關數據都存儲在內存中,神經網絡可以隨機選取一批交互和學習。


那么增強學習有什么延伸的方面呢?其實增強學習有很多的功能,能很好地處理許多事情,但是在反饋稀疏的地方通常會失敗。agent不會長期探索實際有益的行為。有時,為了自身的緣故而不是直接嘗試解決問題,需要采取一些行動。因為這樣做可以讓agent執行復雜的操作,基本上允許agent計劃事情。在這種設置中,有兩個Q網絡。它們被表示為控制器和元控制器。 元控制器查看原始狀態并計算要遵循的目標。 控制器與目標一起進入狀態,并輸出策略來解決目標。檢查是否達成目標,并向控制器給予回報。 當片段結束或達到目標時,控制器停止。然后,元控制器選擇一個新目標,并重復這個目標。


在這篇文章中我們簡單給大家介紹了關于機器學習需要了解的知識,具體的內容就是關于增強學習的一些知識。通過這些內容我們可以更深入地了解深度學習的知識,希望這篇文章能夠更好地幫助到大家。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢