
2016年文本、語義、社交分析十大趨勢
大數據時代,文本、語義和社交分析就像企業的“天眼”,可以聆聽到來自用戶、患者和市場的聲音。目前文本、語義和社交分析技術已經包括金融、醫療、傳媒、電商在內的在多個行業得到廣泛應用,企業從海量的互聯網和企業內部數據,包括文本、視頻等結構化和非結構化數據中提取那些能提高決策質量的有用信息和情報。
但是,文本、語義和社交分析技術依然處于成長期,在一些領域,例如數據分析和市場研究方面的應用還只是剛剛起步,而在相對成熟的領域,例如用戶體驗、社交聆聽和用戶互動方面,還有很大的提升空間。
總之,文本、語義和社交分析技術依然有很大的創新和成長空間,對于新進入者和現有的玩家來說都是如此,以下是Alta Plana公司戰略顧問Seth Grimes對2016年這個市場發展趨勢的預測:
一、多語言是王道
目前文本語義分析還是以英語為為主,但是機器學習和機器翻譯技術的成長可以幫我們擴展到多語言分析,并使之成為常態。如果你需要跨語言分析,那么選擇供應商的時候可要小心了,因為很多供應商的核心語言分析能力很強,但是其他語言就不敢恭維了。
二、文本分析獲得重視
文本分析是客戶體驗、市場研究、用戶調查以及數據分析和媒體測量的關鍵解決方案,這個領域的供應商競爭很激烈,總的趨勢是“量化定性”,而且會有越來越多的針對企業的解決方案出現。
三、機器學習、統計與語言工程并存
未來屬于深度學習,也就是遞歸神經網絡之類的技術,但就今天而言,歷史悠久的語言工程方法(例如語法分析、詞條語義網絡、句法規則系統等)依然會是主流方案。
當前是傳統與創新并存,百花齊放的階段,例如眾包標準的開創者CrowdFlower擁抱了機器學習,而創業公司Idibon則以將傳統和創新結合為賣點。
四、圖像識別進入主流
領先的圖像識別技術廠商,例如Pulsar、Crimson和Hexagon已經可以從社交媒體圖片中辨識品牌信息,而IBM 2015年收購的AlchemyAPI,主打的也是深度學習概念。創業公司MetaMind也意識到了圖像識別的巨大商業價值,在2015年從自然語言處理轉型到圖像識別技術。
五、語音分析將爆發,視頻分析緊隨其后
首席營銷官們熱衷于討論多渠道分析,最常掛在嘴邊的詞是“用戶畫像”。如今社交媒體渠道中的語音和視頻數據越來越多,這些非文本數據有著不同的分析元素,例如語調、語速、聲高等都有其含義。2016年不僅僅是客服中心,更多的營銷人士、出版商和市場研究分析人士都將開始擁抱語音分析技術,語音分析還是打造準確性極高的對話界面的關鍵技術。
六、情感分析的擴張
廣告主們深知情緒對消費者的購買決策起著至關重要的作用,但是,長久以來廣泛系統的情感研究難以開展。隨著情感分析技術的成熟,這一局面有望改變。創業公司們開發的情感分析技術能夠從圖像、視頻、文本和語音中分析面部表情或用戶情緒反應。這方面的創業公司包括Affectiva、Emotient,視頻分析方面有Realeyes,語音方面有Beyond Verbal、文本方面有Kanjoya,情感分析技術開展最快的領域包括廣告、媒體等行業。
七、ISO表情符號分析
2015年社交媒體領域最熱門的莫過于表情符號,相比圖片、文字和視頻,表情符號更簡潔、更易用,也更有趣。除了卡戴珊的身體部件表情符號之外,Facebook已經開始表情符號的實驗項目Reations,隨著表情符號的流行,相關的分析技術創業公司也開始浮現,代表性的如Emogi。(參考Emogi發布的:2015年表情符號報告)目前大多數研究者對表情符號的研究還停留在統計和歸類,但是Instagram工程師Thomas Dimson、CLARIN.SI以及SwiftKey的研究值得一看。
八、網絡與內容結合的圖譜分析(Graph Analytics)
網絡關系是對話的基礎結構,而內容挖掘則獲取有效信息,只有把內容分析和網絡關系節點的分析結合起來,才能挖掘出深度的情報。因此對于分析者來說,2016年需要在工具箱中增加圖譜數據庫(Graph Database)和網絡可視化工具。這也是為什么Neo4j、js和Gephi這幾個開源項目大受歡迎的原因。
九、機器撰寫內容將越來越多
機器撰寫內容的技術被稱之為自然語言生成(NLG),可以讓計算機撰寫短信、郵件、翻譯,甚至撰寫長篇文章。NLG特別適用于海量且重復性高的內容,例如金融、體育、天氣預報等。目前的代表性供應商有:Arria, Narrative Science, Automated Insights, Data2Content, 和 Yseop。其實我們日常已經開始大量接觸人機對話,例如蘋果的Siri、微軟的Cortana小冰,亞馬遜的Alexa和谷歌的Google Now(這個除外),這些都屬于人工智能和自然語言界面(NLI)的范疇,Artifical Solutions的方案值得一看。
十、機器翻譯更加成熟
人們都想擁有類似星際迷航中的宇宙萬能翻譯器,但遺憾的是,雖然早在上個世紀五十年代研究者就宣稱機器翻譯將在三五年內達成,但是半個多世紀過去了,機器翻譯依然不太靠譜。ACM Queue的文章,”站在人工智能和人機界面十字路口的機器翻譯”一文,有助于我們了解機器翻譯的現狀。得益于大數據和機器學習技術的突飛猛進,未來一兩年機器翻譯將能夠勝任大多數場合和任務的需求。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25