熱線電話:13121318867

登錄
首頁精彩閱讀互聯網+大數據等于大數據征信
互聯網+大數據等于大數據征信
2017-09-04
收藏

互聯網+大數據等于大數據征信

近年來,借助互聯網,大數據的概念浮現市場。進一步,人們在互聯網大數據的基礎上,嘗試開展征信活動,并時有人聲稱取得新的成功。從目前實踐情況來看,互聯網大數據征信的現狀,猶如站在叢林上面看地下茫茫的市場,找不到路!

這里的關鍵是有些核心問題還未找到解。

從數據來源渠道看。目前,一些互聯網企業的所謂大數據,大體來自五個方面。一是信用交易數據。個別銀行機構和人人貸(P2P)等類金融機構,在管理上實行數據服務外包,將所謂“脫敏”后的客戶信用數據,如信用卡和個人零售信貸業務,外包給自認定的IT企業,以幫助其針對特定人群開發特定產品。據市場上最有影響的互聯網大數據企業介紹,這類數據在其總數據量中的占比不到10%。

blob.png

二是商品和服務交易數據以及行為數據。一些電商、金融、娛樂、旅游等企業,以及水、電、氣、話、教育、醫療等公用服務機構,利用自有的工作機制和網絡平臺,收集本機構留存的客戶買賣商品和享受服務中的身份信息、業務信息和社交行為信息,并對這些數據進行有序加工整理,形成數據庫。由于不同企業和服務機構處于競爭狀態,彼此力爭形成自己所謂的“閉環”,提供他人分享的內在動力不足,所以這類信息也主要是企業和服務機構自身的客戶信息。這類信息在一些互聯網大數據企業中所占的比重也不到10%。

三是收集公開數據。主要是政府公開信息和公共服務信息,特別是有關企業和個人的注冊登記信息和電話黃頁上的信息。根據政府信息公開要求,一些政府部門及其直屬機構,將企業和個人的注冊登記信息以及城市電話薄上的黃頁信息(大多電子化)統一匯集后,對外提供查詢服務。一些互聯網企業甚至通過批量下載方式,通過上述渠道掌握了大量的企業和個人的身份及通訊聯系信息。這類信息約占其信息量的30%。

四是通過非常渠道竊購數據。目前能夠生成企業和個人信息的機制,除了上述的企業和服務機構生成的客戶信息外,主要是行政司法機關掌握的企業和個人在接受行政管理、履行法定義務過程中形成的信息。由于生成和掌控信息的渠道與部門眾多,有私權的市場主體,也有公權的政府機構,所以在實踐中,由于主觀和客觀原因,一些不法分子內外勾結,倒賣盜買數據牟利,就成為可能。當前坊間談論的數據黑色產業鏈,大體屬于這種情況。在所謂的互聯網大數據中,這類數據的占比很難判斷,也無人承認,但確實存在,估計占比約在20%。

五是通過技術手段爬取數據。對于一些互聯網企業來講,彼此之間通過爬蟲技術爬取數據,似乎已成常規,彼此心照不宣,互不言偷。在這里比的不是行為規范,而是技術水平。這是許多互聯網大數據企業的數據獲取之道。這類數據占比約在30%,有些企業的占比甚至更高。

由上可見,互聯網企業大數據的形成渠道非常復雜。有少量從市場采集的,有大量從政府公開信息中獲取的;有少量市場交易信息,有大量社交行為信息;有少量從正規渠道獲取的,有大量從非常渠道獲取的;有少量標準數據,有大量非標準數據;有少量普通數據,有大量敏感數據;有少量脫敏數據,有大量非脫敏數據;有少量當事人被告之授權采集的數據,有大量當事人未被告知未授權被采集的數據;有少量來源渠道清晰的數據,有大量來源渠道不明的數據;有少量按明示規則采集的數據,有大量通過營銷優惠誘報采集的數據。而且,每一個互聯網企業為了自己的所謂大數據,采集數據的基本規則是有數即要,不怕多。這樣,大數據幾乎成為大垃圾,坊間更有“垃圾進,垃圾出”的說法。由于數據來源渠道復雜,大量信息采集未經當事人同意授權,所以在目前互聯網大數據的形成上,普遍存在信息來源不可追溯、不可異議、不可糾錯,當事人在無意識下信息“被采集”,這嚴重侵害信息主體的隱私和財產權益,與國家發布的《征信業管理條例》規定的信息主體同意權和糾錯權嚴重相悖,致使大數據的合法性和公信力嚴重缺失!

從數據使用情況看。從目前接觸到的有影響的互聯網大數據企業運行情況看,其數據使用無一例外地是通過客戶分群向數據需求方或數據使用者進行營銷推介。這種客戶分群的方式大多是評分,評分幾乎是互聯網大數據企業的主打產品。據介紹,一些互聯網企業利用非負債數據,主要是行為信息和社交信息,能判斷一個人居住環境的好壞,收入的高低,工作單位重要與否,朋友圈社會地位高低,本人消費傾向奢與儉,生活的貧與富,以及本人愛好的善與惡等等,根據這些不同數據維度的權重,匯總得出相應的分數,來直觀地對每個人進行“畫像”。個人居住環境好的,收入高的,所交朋友社會地位高的,消費偏向大手筆一幅富人派頭的,本人愛好“高大上”的,所得的分數就高。反之則反是。

這種評分畫像,從市場組織營銷的角度來說,無可厚非。但從征信的角度評估,這種客戶分群不僅政治上不正確,而且難以保證信息主體的公平一致性,它繪出的將是一幅比真容更美或更丑但卻不太像的肖像。道理很簡單,在現實生活中,富人有崇尚節儉的,窮人有要面子貪奢華的,上層領導有與草根百姓打成一片的,上述每一個劃分維度的科學性都經不起逆向的理性拷問。

進一步,從數據使用看,來自不同渠道的維度數據匯聚一起,加工成不同的分數,在分散數據變成一個分數的過程中,任何一個互聯網企業,不僅沒有,而且也難以做到一一取得信息主體的同意授權。大量數據的應用,沒有依《征信業管理條例》取得信息主體的任何同意授權,而且抓住人性貪利的弱點進行營銷,實屬信息濫用。當前人們疾惡征信市場混亂,期盼征信市場健康發展,對互聯網企業進行的所謂大數據征信,須依法進行規范。若仍任其自發發展,則就像莫里哀劇中的醫生所斷言,病人不按規則,就不能痊愈。應警惕互聯網大數據行業出現“e租寶現象”!

從數據運用效果看?,F在,全國聲稱自己為互聯網大數據的企業到底有多少家,其中又有多少家與征信掛鉤,很難說清楚。但一個不爭的事實是,互聯網大數據企業之間,以鄰為壑,互相防范,每一個都想形成所謂的“閉環”成為行業老大,互聯網大數據企業從信息共享的愿望出發,有效地實施了信息的分割,形成有限的幾個信息孤島,這與征信解決信息不對稱問題的初衷相悖,與建立覆蓋全社會的征信系統的目標相悖。之所以如此,是因為人們的想象力預先就沉浸在所謂的“征信藍?!奔磳砼R的聞所未聞的巨大預期收益中。認為征信是一個可獲利巨豐的行業,進而把征信作為資本市場的一個概念或噱頭加以想象和利用,這是對征信的極大誤解和誤用。

我國將互聯網大數據應用于征信的實踐尚處于探索之中,對這種探索的效果,除了從業人士的一些概念化的預期外,目前缺乏理論和實證的評估。實際上,在互聯網大數據的“故鄉”美國,人們早就在探索互聯網大數據與征信的內在聯系。在我國,人們動輒以美國征信體系為模板或參照系來討論我國征信體系的發展問題,那么,當前美國征信業對互聯網大數據與征信的關系是怎樣看待的呢?據世界銀行和美國的征信專家介紹,美英征信機構均認為,互聯網大數據在征信服務中須慎用,可以作為參考數據來源,但對傳統征信數據無法形成替代,也無法發揮傳統征信數據的功能。根據美國一些數據服務商(Data Broker)的服務實踐,即通過金融科技創新,幫助越來越多的貸款人嘗試擺脫傳統的信用評估方式,尋找新的方式來評估沒有傳統信用記錄的潛在客戶。例如,利用臉書(Facebook)中的聯系人,查看當事人受教育的程度等。對此,美聯儲作為重要的監管機構,警告金融科技公司,使用諸如社交媒體信息等非傳統數據來判斷信貸價值,存在著風險,因為這種判斷方式有可能會導致他們觸犯與公平貸款相關的法律。美聯儲總監拉爾·布雷納德(Lael Brainard)指出,這些社交數據和信貸價值之間,還沒有建立起普遍認同和實際的聯系,而這些數據有可能與公平貸款法所保護的一些特征相關;使用新型數據還存在透明度的問題,因為個人甚至監管機構都不可能永遠知道如何使用具體的信息來做決定,也不清楚人們會如何通過調整自身行為來調整信用狀態以及定價。因此,隨著銀行與數據公司之間合作關系的增多,美聯儲正在積極審查數據供應商風險管理問題。

從數據營運模式看。目前,互聯網大數據企業的營運模式離定型還有很大的差距。與此相關的問題也值得認真思考??萍碱I域有一種流行的說法,即發展速度越快,所造成的破壞也就越大。減少破壞,加快發展,是我們由衷的追求。這樣,我們不得不拷問下列問題:

其一,互聯網大數據的營運模式或業務形態,到底是隨機所遇好還是基本穩定好?隨機所遇是指想怎么干就怎么干,碰到什么數據就收集什么數據,誰需要什么數據就賣給誰什么數據,即前述的“垃圾進、垃圾出”,只要有利可圖就行。當前坊間盛傳的數據黑市和所謂的信息服務“劣幣驅逐良幣”的現象,大體屬于這種情況?;痉€定是指互聯網企業在大數據的集合結構、數據采集的渠道、數據產品的研發和數據使用的服務等方面,有基本穩定的業務規則和操守準則。但目前鮮見這種業務模式基本定型的互聯網大數據企業。

其二,互聯網大數據中的數據,要不要標準化?從原理上推斷,互聯網大數據應該是有利于信息共享的,因為解決信息不對稱問題,是市場交易成功與否的前提和基礎。這為互聯網大數據的存在提供了內在的動力。但是,信息共享的前提是數據標準化,集合不同渠道不同性質的數據,若不以標準化為規則,則數據的可加性和可比性就得不到保障,在這種情況下的信息共享,可靠性和可信性就無法保證。結果只能是張冠李戴、以偏概全、以訛傳訛。我國目前的互聯網大數據企業,基本是各居“山頭”,各自為戰,數據的標準化遠未提上內控管理日程,亦或遠未到進行數據標準化的階段,這嚴重影響大數據的質量。

其三,互聯網大數據是大集中好還是大分散好?我國現階段互聯網企業眾多,許多都以大數據為目標。數據規模無論多大,都分屬不同的互聯網公司或數據公司,不同互聯網公司的數據不能聚合,數據的分散存在與大數據的理念和功能似乎并不齒合。若不同的互聯網企業能以大數據為共同的理念進行整合,則有可能形成一個或少數幾個互聯網巨型企業整合不同企業的數據模塊,并形成真正意義上的互聯網大數據。但這種假設是否有理,是否能為相關方接受,是否能變為現實,現在似乎還看不到這樣的苗頭。

進一步,若大數據并不意味著數據大集中,則數據大分散能構成大數據嗎?從理論上分析,只有一個條件能滿足這種需求,即通過統一的數據目錄和數據格式來方便數據共享。否則,在這種情況下,就根本不存在所謂的大數據。

上述對互聯網大數據現行業態的悲觀看法,是否就意味著互聯網大數據的發展沒有希望呢?答案是否定的?;ヂ摼W大數據企業只要具備以下三個條件,其發展潛力還是巨大的。

一是正當?;ヂ摼W大數據企業在本質上,是一個信息科技+信息中介機構,它本身不直接參與商品和服務交易。這就要求其信息來源渠道和信息使用渠道具有正當性,不能通過非常途徑獲取數據,不能以承諾或特定目的加工使用數據,以數據服務的中立性來保證其正當性。否則,數據歧視會帶來產品的歧視,進而會毀掉大數據的基本功能。

二是透明?;ヂ摼W大數據企業的行為規則和大數據業務模型假設必須公開透明,且能為公眾認知和監督?;ヂ摼W大數據企業不能依靠互聯網科技的概念,外加自身和別人都未搞懂的所謂大數據概念,來神化和泛化大數據功能,進而打造一個別人不懂、只有自己懂、功能似乎普惠、自詡無可替代、舉世仰望的佼佼者。陽光是最好的消毒劑,透明是防欺詐的法寶!

三是兼容?;ヂ摼W大數據有數據大集中的內在屬性,但將互聯網大數據全部集中在一個超級的互聯網企業手中,似乎也不現實。根據互聯網大數據的功能屬性,在理論上應有不同的互聯網企業參與大數據服務,且這些互聯網企業之間,應可兼容、可共享。若這個立論成立,則當前一些互聯網大數據企業則應進行資源整合。想自己單干,并企求一家獨大,如前述,似乎不現實。

若互聯網大數據企業同時具備上述正當性、透明性和兼容性三條件,則其與征信掛鉤還有市場基礎和法理基礎。反之則反是。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢