熱線電話:13121318867

登錄
首頁職業發展百度大數據預測為何測不準_數據分析師培訓
百度大數據預測為何測不準_數據分析師培訓
2015-04-11
收藏

百度大數據預測為何測不準_數據分析師培訓


未來某一天,在你驅車前往公司的路上,導航系統通過預測交通流量,會自動幫你選擇一條最合適的交通路線;根據以往精準的歷史數據和參賽人員相關信息,互聯網公司就能提前預知如歐冠、NBA等體育賽事下一場哪方奪冠;可穿戴設備和智能健康設備幫助網絡收集人體健康數據,或許將提醒你身體罹患某種慢性病的風險……

  但是,大數據預測也會遭遇“測不準”的失敗。去年百度通過大數據預測電影《黃金時代》將熱映,結果恰恰相反。

  大數據在改變哪些行業?

  今年清明小長假期間,想知道全國哪些景區最火熱?各大5A景區舒適度如何?當游客在百度搜索“清明節旅游”等相關內容時,搜索結果頁右側則出現了全國景點擁擠度預測,在預測中,用紅、橙、黃、綠等色塊體現了不同景區的不同“熱度”。

  大數據也被逐漸應用于新聞領域。去年1月,央視“晚間新聞”推出《“據”說春運》《“據”說春節》等大數據新聞報道,成為國內最早系統、持續地通過大數據技術改進電視新聞播出形態的欄目,并嘗試透過數據挖掘,講述春運背后的故事。

  其實遠不只是這些行業,大數據在股市、健康、電影、餐飲等各個行業領域已無處不在?!捌毡闈B透到各行各業的現象,是當前大數據發展的重要表現,也是大數據從概念走向應用的明顯標志?!鼻迦A大學新聞與傳播學院教授沈陽表示。

  央視綜合頻道新聞編輯部策劃組副組長、“據說”系列大數據報道項目負責人郭俊義認為:“隨著互聯網技術迅速發展,各個行業領域的大數據價值正被逐漸挖掘出來。大數據廣泛應用或許不一定給傳統行業帶來顛覆,但一定會帶來巨大變化。如果傳統行業不能適用‘互聯網+’下的大數據技術,那么可能在競爭浪潮中就處于下風?!?/span>

  以大數據對傳媒領域的影響為例,郭俊義介紹,目前對電視節目的評價標準除收視率外,有些電視臺還將網絡影響力作為一個重要權重。因為電視節目在網絡媒體傳播、社交媒體評價等方面的效果反饋,很難通過人工方式收集,大多需要依靠大數據進行細致挖掘和分析。

  此外,業界人士也指出,大數據已開辟了一個新聞報道的全新領域?!按髷祿屝侣劚磉_方式更加數據化,圖形、圖表等的運用讓新聞呈現形式更加可視化;同時新聞生產也更加實時化,依靠大數據挖掘手段,媒體從業人員能迅速準確地找到熱門選題;此外,大數據還能幫助新聞產品完成在傳播過程中的評估以及傳播效果的反饋?!鄙蜿栒f。

  客觀看待大數據預測失準

  有人說,就電影行業而言,大數據是市場拓展與經營的救命丹藥——因為在對以往數據把握的基礎上,大數據對電影票房的預測曾被業界認為“可圈可點”。不過,去年10月份電影《黃金時代》上映,大數據票房預測卻遭遇了“馬失前蹄”,這也讓不少人紛紛質疑大數據預測的準確度。

  大數據預測究竟靠不靠譜?重慶大學新聞學院院長董天策認為,大數據預測在不同領域的成熟程度不同,相比氣象、經濟、機器制造等領域,電影領域涉及的變量頗為復雜,預測過程中也帶有較強的偶然性,出現預測偏差情況也屬正常。

  董天策進一步分析說,網絡輿情很多時候和該領域的用戶結構有莫大關聯,因此,大數據網絡用戶結構和社會整體結構存在偏差,導致了現有數據積累不能代表整體社會心態?!昂蛡鹘y抽樣調查相比,雖然大數據的數據量大、運作速度快,但很多時候存在‘變量遺漏’和‘樣本偏差’等狀況。即使將所有數據提取出來預測分析,其預測結果也不夠準確。這個問題在各個領域都或多或少存在?!?/span>

  除當前大數據總量普遍存在積累不足、數據收集不完整外,沈陽認為,現有數據中還存在很多“垃圾數據”“臟數據”等干擾信息,由于預測手段的局限,這些因素對預測結果造成了負面影響。

  此外,沈陽還指出,在大數據預測過程中,各個行業中隨時都可能出現社會突發事件以及人們心理變化等不可控變量,這些因素也會大大影響大數據預測的精準度。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢