
CDA數據分析研究院出品,轉載需授權
從廣義上講,人工智能涉及機器做一些只有人才能做到的事情。也就是說,計算機科學家不同意幾年前的某些計算能力是否可以構成人工智能。如今,許多這些功能可能僅僅只被稱為軟件。
人工智能的現代復興是由一種非常特殊的計算方式的進步推動的:也就是機器學習。我們經常在Emerj上交替使用人工智能和機器學習,但許多計算機科學家喜歡將兩者分開。關于人工智能的究竟是由什么構成的,在該領域存在(并且可能永遠存在)辯論。一些計算機科學家不考慮人工智能的計算能力,除非它們涉及機器學習。
這些科學家可能會繼續改變他們的人工智能參數,直到實現人工一般智能(AGI)。AGI的發展(計算機執行人類所能執行的任何智力任務的能力)是許多計算機科學研究人員的目標,但實現它可能需要很多年,并且它值得在其他的時間用專門的一篇文章來形容。
研究人員似乎同意的一點是機器學習在某種程度上屬于人工智能的范疇,而人工智能本身屬于計算機科學學科。深度學習是后續文章的主題,并且深度學習是機器學習的一個子集。這一概念由NVIDIA提出,解釋如下:
Yoshua Bengio,過去二十年來最杰出的深度學習研究者之一,為我們提供了他自己對機器學習的定義:
機器學習研究是人工智能研究的一部分,旨在通過數據,觀察和與世界的互動為計算機提供知識。獲得的知識允許計算機正確地推廣到新設置。
盡管機器學習在今天的人工智能思想的主導地位,但人工智能曾經以一種截然不同的方式被研究。
專家系統和人工智能的早期方法
在21世紀末和2010年初的機器學習取得進步之前,人工智能的興趣圍繞著一個完全獨立的計算能力。在60年代和70年代,專家系統主導了人工智能的開發。開發人員試圖通過將其概念化為一系列if-then語句來模仿人類思想和決策。實質上,專家系統是一個由if-then場景構建的大型網絡,通過該場景過濾查詢以實現一些預編程的最終結果。專家系統背后的if-then語句被硬編碼到軟件中。因此,AI每次都會以相同的方式響應某些輸入。
如果所得到的軟件在工業中具有任何實際用途,那么這些if-then場景需要適當地通知領域專家。例如,為了建立一個專家系統來了解當出現某種傳染病時應該做些什么,開發人員需要以某種方式將軟件的if-then場景建立在傳染病專家在傳染病時可能做的事情的基礎上 。
例如,開發人員可以采訪40位不同的傳染病醫療專家,并向他們詢問有關癥狀和治療的一系列問題,并將他們的反應硬編碼到專家系統中。這需要軟件開發人員進行大量的深謀遠慮和規劃。他們需要與領域專家合作,列出某人可能詢問某個特定主題的所有可能問題,然后找出這些問題的所有可能的答案。如果他們沒不能解釋一個問題或答案,那么專家系統將無法提供用戶問題的準確答案。
另一個例子可能涉及客戶支持票。專家系統可以建立在以下if-then場景上:“如果電子郵件的正文中包含”退款“字樣,則將票證路由到退款票據桶?!边@當然看起來是一個合理的規則,它確實可能會將大部分退款票據路由到相應的桶中。該規則不考慮客戶談論與退款相關的概念或使用退款相關短語而不使用“退款”一詞的支持票。
客戶可能會說,“如果你不給我回電話,我就會打電話給我的銀行?!币粋€有業務背景的人力支持代理可能知道這樣的門票通常涉及到客戶不知道他們賬戶的費用是他們注冊的年度訂閱服務。代理商可能也知道,在幾乎所有情況下,客戶都希望退還該費用?;趯<蚁到y的軟件永遠無法將這些票據退還到退款桶中。
專家系統的局限性
從理論上講,具有業務“客戶支持票證背景”的人員可以在構建專家系統之前將有關此場景的信息傳遞給構建專家系統的開發人員。if-then規則可能類似于“如果電子郵件的正文包含'bank'一詞,則將票證路由到退款票據桶?!?/span>
但是,如果該企業最近才開始銷售其訂購服務,那么其基于專家系統的客戶支持軟件將無法適應進入系統的各種票證,并對其訂閱服務進行模糊引用,例如上面的示例。在業務聯系開發人員以使用另一個if-then規則更新軟件之前,這些票證不會被路由到退款桶中。
圍繞這一限制進行工作明顯是不切實際的,這也是專家系統(以及通常的人工智能)在一段被稱為“人工智能寒冬”的時期內衰退的最大原因。
隨著互聯網的出現,從在線購物到保險理賠的大量數據都變得數字化。數據現在已成為常態,即使是最小的公司也將數據存儲在數字格式中。
機器學習是一種讓計算機以與專家系統完全不同的方式模仿人類思想和決策的方式。如果一個人有能力存儲,訪問和理解他們可以做出決策的大腦中的數十億個數據點,他們可能會做出與我們現在做出決策的方式截然不同的決策; 在任何情況下,在絕大多數情況下,對更多信息和背景做出的決定優于在較少信息和較少背景下進行的決策。
簡而言之,機器學習模型可以對數十億個數據點做出決策。它們理解這些數據,并將其轉化為可能性,為它們的產出提供動力。這與專家系統非常不同,專家系統每個if-then規則只有一個輸出,每個“if”只有一個“then”。更重要的是,機器學習模型是為了適應新的意外的輸入而構建的。專家系統不知道如何處理不屬于退款票規則的退票,但隨著時間的推移,機器學習模型可以開始將“我正在給我的銀行打電話”路由到退款桶中,作為回應人的反饋。
機器學習的適應性
如果人員在其路由正確或不正確時向模型指示,那么它可以使用該反饋來通知其基于其票證路由的可能性。雖然我們建議不要將人工智能擬人化,但它本身會問自己“這張票應該被送到退款桶的可能性是多少?”每當提供支持票時。如果確定可能性很高,則票證將被路由到退款桶。如果確定可能性較低,則可以對模型進行編程以標記票據以供人工審查。
這種適應性是機器學習和專家系統之間的關鍵差異,這就是為什么一些計算機科學家不再考慮專家系統和人工智能的其他計算能力的原因。它也是斯坦福定義機器學習的基礎:“讓計算機在沒有明確編程的情況下采取行動的科學?!?/span>
這種適應性的一個例子是Netflix的推薦引擎。當平臺上的新用戶第一次從俄克拉荷馬州的某個位置登錄時,推薦引擎除了用戶的IP位置之外幾乎沒有任何關于該用戶的數據。但是,Netflix確實有幾百萬個數據點來自于俄克拉荷馬州的其他用戶。推薦引擎可以使用該數據來基于過去與類似用戶的交互來做出關于該新用戶可能想要看到什么內容的一般假設。
當用戶繼續與Netflix交互時,他們選擇觀看的數據,當他們暫停這些節目或完全停止觀看時,以及顯示他們連續觀看的數據通知機器學習模型推薦給用戶可能喜歡的節目。該模型響應用戶的交互并適應他們的偏好。用戶的數據還為其他用戶提供了推薦,這些用戶具有第一個用戶相似的偏好和相似的人口統計學特征。
機器學習的核心是在大量數據上進行訓練機器,使機器能夠識別數據中的模式,從而確定使用特定輸出而獲得成功的可能性。
機器學習的局限性
機器學習有其局限性,事實上,當涉及到一個核心概念時,它比專家系統更糟糕:那就是可解釋性。
我們可以遵循一系列if-then規則來弄清楚專家系統是如何產生特定輸出的。如果結果證明他們的答案”then“是不正確的,那么就允許開發人員修復這些規則。專家系統是高度透明的,這在某些領域甚至是必要的,這是有幫助的。
如果患者詢問他們的醫生為什么他們診斷患有疾病,醫生如果根據專家系統的輸出做出診斷,那么醫生可以回答這個問題。從理論上講,他們可以通過專家系統的if-then規則讀取導致其輸出的信息,以及患者的診斷結果。
機器學習模型不是這種情況,它比if-then樹復雜得多。機器學習模型背后的神經網絡可能如下所示:
這是華威大學的典型的drop-net神經網絡
如果醫生根據機器學習模型的輸出進行診斷,他們將無法向患者解釋清楚。機器學習模型基于在數據集中自行構建的模式進行輸出。人類在沒有任何上下文的情況下為機器學習算法提供數據,并且該算法提供了一些基于人類目前無法識別的模式來確定結果。
機器學習模型可以基于任意數量的數據點為患者進行診斷。這可能是因為患者的CT掃描異常。也可能是因為他們的人口統計學特征,他們的名字,以及他們的保險索賠歷史,比其他人更容易被診斷出患有特定疾病。醫生既無法確認也無法否認。
這個問題也就是所謂的人工智能的“黑匣子”。機器學習模型可以通過以人類無法達到的規模查找數據模式來進行預測和推薦,但沒有人能夠解釋模型如何或為何做出這些預測和建議。沒有透明度,這是某些行業的一個主要問題,正如我們在報告中討論的那樣,在B2B和B2C中應用人工智能 - 有什么區別?對于計算機科學研究人員而言,黑匣子是一個令人擔憂的問題,被稱為“人工智能教父”的杰弗里·辛頓甚至建議“把它扔掉,然后再重新開始”。
商業領袖的經驗
絕大多數商業領袖可能會考慮的人工智能解決方案,我們在Emerj所涵蓋的確實是機器學習解決方案。商業領袖可以在談話中使用人工智能,并希望他們的數據科學家能夠理解他們所指的是機器學習。從歷史的角度來看,專家系統通常被認為是人工智能,但是在80年代末期之前開發的計算能力通常不是人們在談論人工智能時所指的。
有可能在未來十年或二十年內,機器學習本身將面臨類似的命運,被歸納為計算機科學史的范疇,作為一種計算能力,它在當時發揮了應有的作用,但最終讓位于某種更復雜,或許更具解釋性的東西。再或者,機器學習可能不會被拋棄,而是變得無處不在,以至于它不再被稱為人工智能。
商業領袖可以將專家系統和機器學習視為人工智能頻譜的兩端?,F在,開發人員在開始構建人工智能解決方案時,通常不會構建專家系統; 他們建立機器學習模型。是實現人工智能相同目標的兩種截然不同的方法:讓計算機完成傳統上為人類保留的智力任務。機器學習和專家系統是人工智能的子集,它是整個計算機科學的一個子集。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25