
古往今來,人類一直在探求科技的極限。隨著信息技術在21世紀的爆發,數據科學與人工智能技術迎來自己的春天,尤其是以深度學習為基礎的人工智能技術可謂是大放異彩,在諸多領域遠勝人類,并且如人臉識別這樣的技術也紛紛落地,甚至悲觀者認為,機器智能時代來臨,倘若某天機器有了自主思維,人類將會面臨滅頂之災??墒?,深度學習就如此無所不能嗎?答案是否定的!深度學習是利用深層神經網絡的技術,雖然在圖像識別等方面已經能夠超越人類,但是它仍然有許多方面是不能完成的,本文列舉深度學習目前不能實現的一些領域,希望能夠幫大家打開思維,更好地認識深度學習。
既是學霸,又是游戲王
一般來說,多數人每年可以看300篇文獻,而IBM的Watson系統在10分鐘里就可以閱讀2000萬的文獻,顯而易見,深度學習的學習能力是遠遠大于人類的,是個十足的“學霸”。與此同時,在游戲領域,不管是圍棋還是dota2,深度學習有足夠的能力碾壓人類。所以深度學習既是學霸,又是游戲王。
多才多藝
下棋,寫詩,作曲,藝術畫······2016年,阿爾法狗大勝李世石,2017年微軟小冰出版第一部詩集,隨后又開始轉向音樂創作·····深度學習已經慢慢變成琴棋書畫樣樣精通,多才多藝全能王。
從深度學習所取得的成果來看,它似乎已經無所不能,在諸多方面超過了人類。
算法輸出不穩定,容易被攻擊
在圖像識別領域,我們可能在一張圖像中只改變一個像素點的值,那么輸出結果會發生巨大改變,這就是算法輸出不穩定導致的,這種細微的改變在人類看來微不足道,對于算法模型來說確不同。不僅在圖像領域,自然語言處理領域也有這樣的問題。在問答系統中,在原始文本中隨機得加入一些簡單的詞,模型的理解能力大大降低。這種問題不僅出現在深度學習,傳統機器學習更容易被攻擊。
模型復雜度高,難以糾錯或調試
在2016年阿法狗與李世石的大戰中,李世石贏了一局。在李世石的78手后,阿法狗的勝率便直線下降。如果可以投降的話,那么在李世石的第78手后,阿法狗應該會選擇投降,而并不會針對這一手進行相應的改進。此外,在深度學習進行翻譯時,不管是給模型什么數據輸入,都會有一個有意義的輸出。此前的谷歌翻譯曾遇到過這樣的問題,在翻譯結果有明顯錯誤的時候,翻譯部門的工程師也很難去對模型修改,可見深度學習模型的復雜。
層級復合程度高,參數不透明
在圖像識別領域,我們在模型的中間層中盡力去抓取圖像的特征。在第一層的卷積層計算后,我們對結果進行可視化,可以很容易看出結果與原圖像有很大相似性。然后,隨著層數的加深,對中間其他層的可視化,我們完全不能看出中間層所代表的意義。主要原因在于感受野的復合,而且每層的卷積核也會產生復合,加上一些模型會有自己特有的復合,如inception模塊的復合,殘差的復合,讓我們難以從中間層的可視化中看到模型具體運行的結果。
對數據依賴性強,模型增量性差
深度學習是端到端結構,靈活性非常低。我們將單個圖像拼接在一起,人類很容易識別的內容,深度學習確無能為力,可見其遷移能力較差。在“語義標注”和“關系檢測”這類問題中,人類可以通過完成一個任務中的多個子任務,并將子任務整合的方式解決問題,而對于深度學習來說,多個子任務與一個總任務是完全不同的兩個任務,需要不同的模型去解決問題。在數據量較小的情況下,模型擬合能力較差。
專注直觀感知類問題,對開放性問題無能為力
我們小時候都曾學習過關于烏鴉喝水的故事。烏鴉在面對半瓶水,而自己的嘴夠不著水時,會往瓶子里丟入石子,使得水面上升從而喝到水。此外,烏鴉在無法撥開堅果時,它會把堅果丟在馬路上,讓來往的車輛碾壓從而遲到果實,在此過程中,烏鴉能夠通過觀察人行道的情況學會判斷車輛是否會行駛以保障自己的安全。而鸚鵡也有自己的智能,在聽過人類重復說過的話后,鸚鵡能夠很好地模仿人類說話。深度學習只能做到鸚鵡的智能,而做不到烏鴉的智能,可見其泛化能力之低。此外,深度學習也難以理解圖像背后的寓意。當一幅圖中出現奧巴馬與一群大象時,深度學習僅僅能辨認圖中是一個男人與一群大象,顯然圖作者卻是想透過圖片暗喻美國的兩黨之爭,一般來說,大象喻指美國民主黨。
機器偏見難以避免,人類知識難以有效監督
這可能是目前深度學習面臨的最大問題。數據是深度學習的基礎,而數據的可靠程度決定了模型的可靠程度。微軟層開發聊天機器人Tay,模仿年輕網民的語言模式。但是試用24小時后便被引入歧途,成為偏激的種族主義者,甚至發出了“希特勒無罪”的消息。原因在于年輕的網民本身的語料庫并不是純凈的,是人就會有偏見,這種偏見在網絡中尤其嚴重,這樣便導致了Tay用來訓練的數據帶有偏見,并使得Tay誤入歧途,而人類知識的監督很難有效采用,這就無法避免機器的偏見。另一個例子,美國法院用以評估犯罪風險的算法COMPAS,也被證明對黑人造成了系統性歧視。機器偏見無法消除,日后可能會給人類帶來嚴重的后果。
不可否認,深度學習可以在特定領域超過人類,有很好的效果,但它并非萬能。某種意義上說,它離智能還差很遠。目前,對深度學習的泛化性與可解釋性的呼聲越來越高。2017年7月,國務院在《新一代人工智能發展規劃》中提出“實現具備高可解釋性,強泛化能力的人工智能”?;蛟S下一代人工智能技術還是在深度學習基礎之上展開,但是希望新的技術能夠很好地解決現在深度學習的不能,更好地造福人類!
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25