熱線電話:13121318867

登錄
首頁精彩閱讀大數據行業四大困惑
大數據行業四大困惑
2017-07-12
收藏

大數據行業四大困惑

2017年5月末,大數據行業被媒體貼上“監管趨緊”“大洗牌”“灰色數據交易”的標簽,并稱多家大數據公司被列入監管的調查名單之中。

“被調查”風波

數據堂被某媒體報道“中槍”后的第4天,在全國中小企業股份轉讓系統(新三板)網站上發布臨時公告稱:“公司某一客戶存在被公安機關調查的情況,公安機關為進一步了解具體情況,向公司個別業務人員及財務人員進行情況了解,不存在傳聞‘公司高管被抓’的情形?!?

“對于多家大數據公司被調查的報道目前還無法證實?!卑⒗飻祿洕芯恐行拿貢L潘永花告訴《經濟》記者,但從側面來看,個人信息保護受到監管層的重視?!氨槐O管查出問題的企業在數據交易方面,或多或少存在違規現象?!敝?,“數據灰色地帶或許被行業或監管部門所容忍。但2017年6月1日《網絡安全法》正式實施以后,清理不規范企業對整個產業規范化發展是有利的?!?

在大數據行業15年之久的貝格大數據總裁李常青告訴《經濟》記者,它出現的背景是《網絡安全法》,將來無論是對不合規企業約談還是處罰,都會促進行業的健康發展。

“一直以來,國家對數據的灰色交易打擊很嚴厲,該抓的抓,但不能說是針對大數據行業進行的?!本糯畏酱髷祿撌既送跞蹖Α督洕酚浾弑硎?,對于打擊灰色數據交易,首先要從打擊內鬼開始,我們經??吹绞謾C號碼泄密或各種賬戶泄密問題,“很多數據外流都是因為內鬼?!?

《最高人民法院、最高人民檢察院關于辦理侵犯公民個人信息刑事案件適用法律若干問題的解釋》規定了非法獲取或出售50條以上個人信息,以及違法所得5000元以上等均可入罪。潘永花指出,法律填補了我國個人信息保護的空白,是對打擊非法數據交易的重要依據。

數據確權之困

“過去我們也有過困惑,非法交易數據很容易賺錢,但通過正常的技術采集、清洗、加工的大數據公司卻賺錢不易。這很不正常?!本糯畏酱髷祿撌既送跞壅f。

“幾個人或幾十個人的團隊攢點數據就去賣錢,這些底層數據的價格便宜,很容易產生暴利,也激活了很多公司的內鬼?!蓖跞壑赋?,這種行為對合法的數據流通會造成負面影響。

“一個人買了別人偷來的手機,這是什么性質?”王叁壽向《經濟》記者透露,采購數據機構不乏保險公司和銀行,包括小貸公司、互聯網金融公司,他們交易的數據的確不是他們偷的,但是他們買了小偷的數據?!昂弦幍慕鹑跈C構不應該去采購沒有經過確權的數據?!?

“令我們最為困惑的是數據確權問題。比如,政府的數據就應該是政府,醫院、電信運營商的數據也應該屬于他們自己?!碧詫毶系馁徫飻祿降讓儆谡l的,國家一直沒有明確規定。王叁壽認為,國家應該盡快出臺關于數據確權的法律,也有利于打擊灰色數據交易。

“數據作為一種新的資產類型,哪些數據是屬于個人的,哪些是屬于企業的,哪些是可以交易的,未來都會有一個界定?!崩畛G啾硎?,現在除了國家安全、個人信息等數據不能交易,其他數據仍是混沌狀態。他建議,數據交易可以先從公開渠道披露的數據入手,比如上市公司披露的報表、行情、價格等數據進行加工整合,給客戶一些預測性意見。再如,淘寶等電商積累的消費數據雖然不能交易,但由此形成的快消品報告是可以銷售的。

“在產業界,非個人數據交易也很多?!蹦持髷祿灰灼脚_CTO陳逸云告訴《經濟》記者,我們自己采集、加工的數據,不涉及具體的人或物,甚至沒有特定物體的標識,像人工智能、無人駕駛等企業對這些數據的需求量大?!暗珨祿陌鏅鄦栴}至今無解。我們提供的數據被用戶買走后再復制傳播,我們毫無辦法,唯一的生存之道就是不斷地做新數據?!?

數據交易之困

未來需要數據化、智能化的事物無窮無盡。張涵誠指出,產業尚未形成規模,“未來企業在數據生態中的競爭也是無窮無盡的?!?

“大數據的行業規則仍不明晰,只在細分領域有所突破?!弊?012年開始關注大數據行業的騰訊研究院首席經濟學家、產業與經濟研究中心主任孟昭莉對《經濟》記者表示,整體產業沒有規范化,目前還沒有成熟或被大家所認可的商業模式出現,市場還沒有發展起來。行業較為關注的大數據交易,其交易規則、定價、數據所有權以及數據盈利如何分配等問題仍在探索之中。

“如果賣給你不需要的數據,你1分錢都不會出。如果是你需要的數據,100元你也愿意出?!蓖跞壅J為,定價不是問題,也不是影響數據交易產業發展的主因?!拔覀冏罱诳紤]數據拍賣的事情。一組脫敏的數據,某家公司比其他十家出的價格高,就可以獨享這些數據?!?

中國電子信息產業發展研究院互聯網研究所副所長陸峰告訴《經濟》記者,應該鼓勵發展大數據交易,健全數據開放、共享、流通、交易、使用相關規章制度,以及加強對數據采集、存儲、傳輸、交易、流通、使用等過程中數據保護技術的研究,提高技術自主可控能力。

數據交易所是一個很好的探索。張涵誠認為,但目前仍處在發展初期?!澳壳皵祿灰姿圆扇鹘y的會員制?!彼鼪]有進一步解決數據存儲、確權、脫敏等問題。

脫敏是實現敏感隱私數據的可靠保護的一種技術?!?a href='/map/shujutuomin/' style='color:#000;font-size:inherit;'>數據脫敏本身不是技術難題,但問題是數據到底要脫敏到什么程度?”李常青指出,企業拿到工商局網站上的數據做了MD5的身份驗證,但很容易通過身份證號來推導,這種脫敏的意義就不大。

“底層數據好比泉水,脫敏以后可以把它變成農夫山泉或依云礦泉水?!蓖跞郾硎?,脫敏肯定會增加成本,數據的采集、清洗、脫敏的程序,類似大數據領域的“富士康”,要依靠大量的人工成本支撐,這也是大數據分析師的由來。

“做數據生意的人丟單率比較高?!睆埡\指出,“業務談了一段時間,談著談著就崩了?!?

“客戶買不到想要的數據,這是買方市場最大的困惑?!睌祿咎峁┑耐皇琴I方真正的需求,或者能夠支撐起業務的數據。賣方也很難按照買方的邏輯加工數據?!皵祿嵌嘀匾馁Y源,哪能你想要啥就給你啥?”很多數據都是在業務過程中產生的?!拔覀兌甲鐾瑯拥纳?,我怎么愿意把自己的數據給你呢?所以,真正有價值的數據,別人是不愿意出售的?!?

“客戶的確對大數據很挑剔?!标愐菰票硎?,“我們在數據質量、模式、交付方式以及后期數據質保等一系列流程都要考量加工完的數據是否是最終用戶需要的東西,并按照他們的標準去交付?!?

應用之困

“目前非盈利、匿名化,不涉及個人信息的大數據應用是公眾比較接受的?!?

大家越來越多地意識到,政府部門擁有很多有價值的數據。政府也意識到這一點。孟昭莉指出,政府數據在某些公共服務領域凸顯出數據的應用價值。比如,通過地理位置、熱地圖等信息判斷某地的交通狀況、出行狀況。去年武漢的那場暴雨,受災面積廣泛?!敖衲陝t不同,比如一個人發布某地鐵站進水較深,當這些數據通過眾包的模式收集起來,政府利用這些信息進行提前預警?!?

“利用人臉識別技術尋找丟失小孩的應用也有價值?!泵险牙虮硎?,當前人臉識別率已達到98%的精準度,正是通過大數據、人工智能技術來尋找失聯的孩子。

“很多時候,我們拿到的數據需要進行二次加工?!崩畛G啾硎?,數據在使用的過程中需要通過它們之間的關聯性發掘一些有價值的東西。譬如,某機械加工廠得知螺紋鋼漲價了,過去他會覺得生產升本增加了得趕緊購買原材料。但現在他可以通過歷史數據去了解行業下游的需求?!斑@才是大數據應用的意義?!?

“好的數據產品會說話?!睆埡\指出,隨著醫保、社保、交通、水電煤氣等政務數據不斷地被政府釋放出來,應該開發更有價值的數據產品?!跋癫樵兤髽I信用的數據產品在銷售環節既有章可循,也可以產生一定的經濟效益?!?

“我們很早就使用大數據、云計算為客戶提供服務了?!蹦炒髷祿髽I創始人沈立勤對《經濟》記者表示,“但目前我更關注的是AI(人工智能)?!?

“大數據是AI的基礎?!泵险牙虮硎?,“我們至少需要大量的數據來喂養一個AI?!盜BM的AI機器人(19.84 -1.49%,診股)沃森可以學習各種病例,比人類學得快,積累得多。谷歌的AlphaGo也是通過大數據學習,戰勝了李世石和柯杰?!皼]有數據,AI很難實現??梢灶A見,未來3-5年,大數據和AI將是高熱投資區域?!?

監管之困

目前數據非法交易的監管難度較大。陸峰告訴《經濟》記者,一方面非法數據交易信息互聯網傳播渠道尚未被及時、有效切斷,多部門協同打擊的常態化機制尚未建立。另一方面,非法數據交易傳統打擊手段難以有效應對,網絡化和平臺化監管治理模式尚未建立。

“貴陽大數據交易所探索了兩年多,交易量才突破1億元,但是黑市交易的數據量至少是我們的99倍!”王叁壽的另一個身份是貴陽大數據交易所執行總裁。他認為,區塊鏈技術可以有效打擊數據非法流通問題?!澳壳敖灰姿筒捎昧藚^塊鏈技術,相當于給數據加了一個GPS,可以對交易的數據進行追蹤?!钡壳八]有真正發揮出實力?!爸挥写蠹叶加脜^塊鏈技術,才能真正解決黑市交易問題?!?

“打擊大數據灰產交易,如果采用新的技術,監管的效果也會有明顯提升?!泵险牙虮硎?,當短信詐騙、微信詐騙形成一定的規模時,我們也積累了打擊它們的辦法和技術。

如果有人把偽基站放進雙肩包,然后繞著國貿大廈附近走動,偽基站的信號會覆蓋大廈四周,樓內的人會收到偽偽基站推送的信息,并信以為真。如果反詐騙能力或技術的不斷提高,對大數據行業的困局也會有所改變。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢