
在大數據的年代,避免被惦記
前段時間,我們花了個周末出去短途旅行。在車上,LD跟我說:哎呀,忘記通知送鮮奶的,明天我們不在家,不用送奶了。你說現在大數據這么厲害,為什么不能做到智能點呢?比如手機定位發現家里人都出去了,或者用水用電監控發現家里沒有人,就自動通知送牛奶的、送純凈水的,這段時間不要送了?
我答:這想法倒是好,但是萬一數據被濫用呢?你不在家的消息,送牛奶的知道了是不會來,但是小偷知道了,可能正要上門呢。
她接著問:這倒是個問題。但是,技術那么厲害,你們難道不能限制信息只讓送牛奶、送水的人知道,不發給別人嗎?
我想了想:這個,好像真做不到。數據本身是中性的,一般沒辦法限定那么細的用途。而且即便只發給送牛奶、送水的人,也沒法保證他們不會對外傳播呀……
這答案讓她無奈了:如果“知道我不在家”的人讓我信不過,信息又會四散傳播,看來還是不要大數據的好。
這段對話讓我印象深刻,是因為它代表了當今很多普通人對“大數據”的認識。普通人一般認為,大數據很神奇,很強大,很有用,可以給我們提供很多便利。沒錯,通過收集、存儲、分析、挖掘大量數據,我們的確享受到很多便利。
但是出于職業習慣,我會想的更多。很多時候我們只看到,“方便”是目的,運用大數據手段收集、存儲、分析、挖掘數據,則是達到目的的手段。然而一旦數據被拿走,就不知道會存在什么地方,能被誰看到,繼而怎么分析,是否僅僅用于當初那個“方便”的目的。
前些年流行過一陣“車載智能”設備,裝在你的汽車的OBD(車載診斷)接口上,然后就可以看到自己車的詳細數據,比如節氣門開度、噴油量等等,進而可以曬數據,也可以準確知道自己的駕駛習慣是否優秀??雌饋砗苌衿鎸Σ粚??科技含量確實足夠高。
但是你或許不知道,詳細收集這些數據的目的并不只是簡單改進你的駕駛習慣,還有更深層次的目的。記錄了你的駕駛習慣,以及你經常走的路線,就可以判斷你出事故的幾率。知道了出事故的幾率,就能為你“量身定制”保險的保費。車主把數據交托出去,可能就是簡單直接地想到“看到我的車的運轉細節”,絕不會想到“我的保費因此上漲”吧。
不要以為這種情況只針對“有車一族”,同樣的邏輯早已深入生活,不少“健康體檢”也是這樣的玩法。通過體檢了解不同人的身體情況,保險公司拿到這些數據之后,評估出每個人買保險的風險高低,作出不同決策。你以為參加免費或者低價的體檢,是自己占了便宜,其實真正占便宜的沒準是保險公司。
中國有句老話:不怕賊偷,就怕賊惦記。我覺得,它也挺適合描述大數據時代的處境?!百\偷”,代表的是傳統生活里和賊的一次相遇,盡管損失可能會慘重,但無非是一錘子買賣,損失有限?!百\惦記”,代表的是大數據時代下,基于個人的行為數據持續對個人反復分析,且美其名曰“挖掘潛在價值”。
“挖掘潛在價值”,這個說法聽起來很美妙,其實掩蓋了不少東西。
重要的問題是,價值是誰的,誰能享受到這種價值?窺見你的興趣,推一些商品讓你買,你最終買了,大概是給雙方創造了價值。但是,如果你本來只是打個順豐車,卻讓車主給你標上“膚白貌美”、“嬌美柔弱”、“非此女不娶”的標簽,當然還是在挖掘你的價值,但受益的到底是誰,恐怕就不是個簡單問題了。
身為技術人員,我很清楚地知道,目前我們對“大數據”的收集能力,要遠遠大于對其應用正當性的管理能力。比如,如今許多“大數據公司”已經可以用非常低的成本拿到普通用戶的大量數據,姓名、年齡、籍貫、戶口所在地、收入情況、消費習慣、信貸狀況……許多時候,數據收集方甚至沒有明確這些數據有什么用,但是仍然抱著“數據不怕多,收集了再說”的念頭下手。
然而,有這么多數據在手,如何保管、使用,卻一直沒有明確、合理的規范。如果某項數據被濫用了,要追查“濫用”的來龍去脈往往異常復雜,甚至證實“濫用”本身也很難。
當然,大多數情況下,數據在收集之前都會和用戶簽一份協議,盡管絕大多數用戶根本懶得看也看不懂(或許根本就沒想讓你看懂)這份云山霧罩的協議到底說了什么。在絕大多數人的潛意識里,“我授權你用我的數據”并不等于你“我授權你在當前場景下、為我們約定的明確目的,利用我的數據”,他們并不知道,數據一旦被收集,就難以避免被非法復制,難以避免被用于其它目的。
這不是危言聳聽。我們身邊有許多人喜歡拍胸脯說“這就是我的隱私,拿去吧,我無所謂”。其實據我觀察,他們并不是真的無所謂,而是根本沒有認識到,隱私被拿去可以用來干什么。一旦告訴他們,“隱私”甚至包括他們每個月收入多少錢、花多少錢、去什么地方、錢是怎么花的、和誰一起消費……
如果你仍然覺得無所謂,那么玩法可以繼續升級,拿到這些私密信息就可以冒充你的密友,去獲取其他人信任、展開詐騙…… 按照我的經驗,絕大多數一開始“無所謂”的人,其實都是不懂,一旦講明白這些道理,都感到心驚肉跳。相反,越是懂技術的人,越不會對此無所謂。
那么,有什么好辦法約束這種情況,避免“被(惡意)惦記”嗎?至少在我看來答案很悲觀:沒有。這些數據往往都是現成躺在公司的數據倉庫里,等待著業務從各種角度的反復爬梳、挖掘。目前這類問題大多處在法律模糊地帶,唯一有可能約束它們的,暫時只有公司的價值觀和職業道德。
不過,價值觀、職業道德這玩意兒多少錢一斤?我真不知道。你大概記得,好幾次出現類似的事故,BAT中某家的員工都是同一套說辭:別跟我們談道德,我們只是家公司,賺取利潤才是公司的首要目的,懂嗎?
在這種嘴臉面前,你還能指望自己的數據因為有“職業道德”約束而不被濫用?反正我是不敢。我們唯一能做的,只有“不跟你打不必要的交道,也不給你不必要的數據”。
這也是我想說的,大數據的時代已經來臨,大數據時代對隱私的侵犯和濫用又沒有很好的解決方案,身為普通人,我們能做的就是避免被大數據惦記,不泄露那么多數據,不讓泄露的數據被串聯起來,精確定位到我們——總之,避免被大數據惦記。
怎么做才能避免被大數據惦記呢?
我覺得,最重要的是“不要單純圖省事,單純怕麻煩”。無數“居心叵測”的數據收集,都是打著“為你方便”的幌子進行的。天知道掛著“方便”牌匾的門下面暗藏著幾條地道,通向什么地方。你在這里方便了,在其它地方會不會方便,會不會有風險?這些問題既然未知,就別一心想圖方便。
如果認可“不要單純圖省事,單純怕麻煩”,下面有些具體的指引,大概能給你點幫助。
1.申請專門的手機號,用于銀行等要害信息。如今手機號已經越來越重要了,方便了認證,也方便其他人知道了我們的聯絡信息,就能順藤摸瓜找到網銀賬號等等。所以,申請一個專門的手機號,專門用于銀行等要害信息很有必要。如今各大運營商都推了不少含有副卡的套餐,直接申請個副卡很方便。重要的是,這個手機號盡量避免暴露,避免被其他人知道。
2. 對這個專門的手機號,配備專門的手機,使用“有良心”的系統,比如iOS或者干凈的Android?,F在許多Android手機都提供了“智能短信”的服務,能把收到的銀行短信做好格式化,換一種更美觀的表現方式。這樣做,用戶體驗當然是更好了,用戶隱私也沒了。黑產之所以知道許多人的私密信息,讀到“您尾號xxxx的銀行卡剛剛入賬工資xxxx元”是個特別好的途徑。
3.為不同賬號設置不同的密碼。在大數據的年代,要串聯多個場合定位同一個人,難度其實并不大??紤]到許多時候我們的用戶名都是手機號或者郵箱,而手機號和郵箱又不可能經常變化,“知道你在甲網站賬號就可以破解你在乙網站賬號”的難度就低了很多。比較好的辦法是,為不同的賬號提供不同的密碼。當然,你不必死記硬背,有個竅門是按自定規矩來生成密碼。密碼有一部分是固定的,還有一部分是變量,變量可以根據網站來生成。比如京東的域名是JD,看看電話的撥號鍵盤,J和D對應的按鍵分別是5和3,所以你的密碼中的變量就是5和3。其它網站的密碼都可以照此類推。
4.善用瀏覽器的隱身模式。如今許多瀏覽器都提供了隱身模式,其實也就是“不帶任何歷史信息干凈模式”,這樣就避免了被定位,出現“你剛在甲網站搜了某商品,乙網站馬上就給你推對應購物信息”的情況。我的習慣是,每天早上新開一個隱身窗口,當天大部分瀏覽都在這個窗口里進行,晚上關掉。這樣真正做到了“tomorrow is another day”。
5. 如果你習慣沒事玩手機,不妨安排點不一樣的玩法,詳細檢查手機里每個應用申請的權限。許多應用默認會申請完全沒有必要的權限——比如地圖申請通訊錄和發短信的權限。但是關掉這些權限,它也可以運行。所以沒事玩手機時查查權限列表,確保關掉了不必要的權限,這是個好習慣。
6. 在遇到各種App或者活動申請權限的時候,停下來換個角度想一想。不要單純從“為了達到眼前的目的,我需要提供哪些數據”的角度來看,還要想想“一旦我提供了這些數據,你還可以用作其它什么目的”。這種思維習慣建立了,許多不懷好意的運營伎倆就會看得非常清楚。
7. 把行為拆散到不同的App和不同的生態,打散成碎片。雖然互聯網公司的大數據很厲害,但不同互聯網公司之間的大數據通常不是互通的,我們很難想象,微信和支付寶之間互通數據。所以如果你習慣手機支付,不妨有意識地混用微信和支付寶,不要單純依賴一家,有些時候,用用現金也是非常好的習慣。如果你喜歡看書,沒事逛逛書店買幾本書,既支持了實體書店,也避免了暴露自己全部的購書記錄。
8.注意保護其他人尤其是未成年人的隱私。我經??吹胶芏嗳嗽谂笥讶裢?,不但有小朋友的面部照片,還有生日、得獎、體檢等等詳細信息。這樣做或許提供了一時的歡樂,但是換位思考,大概沒有人愿意長大之后,被長輩甚至不認識的朋友拿出照片來,細細歷數自己小時候的成長細節。再進一步說,如果“別有用心”的人或系統平時把這些信息收集起來,可以做什么更是未知數。所以,即便要在朋友圈曬娃,也一定要注意適度。
我衷心祝愿大家在大數據時代能生活得安全、開心,不要被目的不明的大數據惦記著。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25