熱線電話:13121318867

登錄
首頁職業發展大數據你知道,那語言大數據呢?
大數據你知道,那語言大數據呢?
2016-03-31
收藏

大數據你知道,那語言大數據呢?

近日,“語言大數據聯盟”成立預備會在京召開,這個組織要解決的問題顧名思義。該聯盟是一個全球性、多領域、多語言的基于大數據資源開放與共享平臺的科研應用聯盟,將解決語言大數據下的系列問題,為全民提供跨語言大數據智庫。

作為中國最具代表性的跨境電商,阿里巴巴國際站上有超過1億件產品,平均每件產品有2000字產品說明,按此計算阿里國際站上的產品需要翻譯總量超過2000億字,而這個數字每天都在增長。整個中國跨境電商產品翻譯總量預計超過4000億字/年。

一個BAT的需求只是冰山一角。根據《2015全球互聯網報告》最新發布的數據顯示,目前全球互聯網用戶已超過30億,占全球總人口的40%。截至2014年12月,中國網民規模達6.49億,互聯網普及率為47.9%,然而全球接近90%以上的網民不具有母語以外的語言技能,其中59.4%以上的用戶具有跨語言、交友、購物、娛樂、旅游、享受教育等的需求。

無法計算的數據量每一天都在資訊、影視多媒體、社交媒體、電子商務網站上呈指數增長,分秒間都在提醒我們身處于大數據時代。

在國家大數據戰略下,各行各業的大數據應用都在挖掘數據海洋的價值。根據中國信息通信研究院的報告,2015年,中國大數據市場規模116億人民幣;IDC數據顯示,2016年,全球大數據市場將達238億美元;《中國大數據產業白皮書》大膽預測,2020年,中國大數據市場規模8200億人民幣;而麥肯錫對2020年美國大數據市場價值的估計是6900億美元。

但是,目前大多數大數據只是在單一語種,那些散落在全球范圍內的多語種價值大多沉睡海底。放眼國際,你可曾想過聯合后的多語數據比單一語種數據價值能高出多少倍?這部分無法計量的價值又如何打撈?

好消息是,語言大數據至少是目前解決此問題的不二方法。語言是一切溝通的基礎,通過語料的收集、處理和智能分析,我們將從數據源頭抓取跨語言大數據的價值。

近日,“語言大數據聯盟”成立預備會在京召開,這個組織要解決的問題顧名思義。該聯盟是一個全球性、多領域、多語言的基于大數據資源開放與共享平臺的科研應用聯盟,由全國翻譯專業學位研究生教育指導委員會、中國對外翻譯有限公司及全國二十余所重點高校聯合發起,將解決語言大數據下的系列問題,為全民提供跨語言大數據智庫。據悉,2016年4月8日此聯盟將在青島召開第一次大會,屆時有超過100所高等院校、企業與科研機構參與會議,共同就語言大數據的共建、共享與協同進行深入地交流與分享。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢