
從刷支付寶乘地鐵談起,淺議大數據時代的隱私安全
據悉,在2018年,每個月都會有新的城市在公交地鐵領域開通移動支付。
近期支付寶、微信、銀聯等移動支付企業紛紛搶灘城市公共服務。針對地鐵公交這一場景,目前已經有超過30個城市在支付寶內上線了電子公交卡功能,這意味著——用戶可以丟開匿名的交通卡,使用支付寶及相關應用進行刷碼通行。
和此前共享單車市場相比,軌道交通等公共出行在每個人的生活中都占據了更重要的地位。用“現代支付系統”取代“傳統地鐵充值卡”所能提供的便利,讓很多用戶感到迫不及待。
而在現代支付系統的接入之后,出行的數據也可能繼續用在城市交通管理之中,改善更多其他服務,如改進城市的交通服務、整治擁堵等等。而這些便利存在的前提在于——當今的大數據時代大背景。
高速發展、高吞吐量的大數據時代,絕大多數人都的所有行為逐漸都能在信息世界之中留下數據足跡,無論是用戶主動留下的數字腳印,還是由他人建立的關于用戶的數據。
在此,筆者仍然希望“老生常談地”與大家探討大數據時代的個人隱私問題。
個人與服務商之間的信息不對稱
信息時代下,只要我們使用在線工具和平臺,或者接入平臺的服務,就會產生相應的數據。在一些觀點看來,人人是數據的生產者,可以讓信息變得更透明。但是作為線上服務的使用者,即便有用戶隱私條款的存在,多數的用戶仍然并不了解自己被采集了什么樣的信息,被追蹤了哪些數據。
條款中冗長的文字、專業的術語,都會給普通用戶的精準理解帶來一點困難。除此之外,用戶條款中夾雜的“可能”、“潛在”等詞匯的存在,繼續模糊了好不容易建立起來的一點概念。這些數據的使用狀況,數據分析和挖掘的目標和最終的數據消費者,更是不得而知。
即便一些用戶是較為謹慎的——他們在選擇應用服務的時候會考慮“數據泄漏”帶來的影響,但他們能夠避開的更多只是一些聲譽差的,已經發生過數據泄漏的企業。通常情況下,規模較大的企業能夠享有更好的聲譽和用戶口碑,獲得多數人的信任和青睞。
如果這家服務商的大名家喻戶曉,人人都在使用它的APP,更多的用戶就能放心大膽的進行注冊,然后開始使用這款服務。但顯然,這仍然只是“一廂情愿”的信任,大的企業也可能存在安全漏洞和疏忽。僅在過去的一年中,就繼續曝出了大大小小的數據泄漏事件,其中也有不少知名大企業的身影。
互聯網巨頭 Yahoo 數據泄漏:10億賬號的用戶姓名、生日、郵箱地址、密碼、電話、安全問題和答案全被泄露
美國三大信貸之一 Equifax 數據泄漏:超過 1.43 億的美國用戶數據泄漏,包括姓名,社保號碼,出生日期,地址,及駕駛證信息;20.9 萬用戶的信用卡號,以及部分英國和加拿大用戶信息。
移動出行 Uber 數據泄漏:5700 萬乘客用戶信息泄漏,5萬名司機信息泄露。
深度分析和機器學習在混淆隱私邊界嗎
積累足夠全面的數據才能讓有規律的隨機事件,在大量重復出現的條件下,呈現出幾乎必然的統計特性。
隨著政府的政策支持和公共部門積極進行數據整合,冗余數據中蘊含的戰略和資產方面的價值逐漸浮出水面,企業紛紛著力于進行大數據技術研發與產品化。企業在應用數據進行決策和謀利的同時,仍然會不言而喻地使用用戶的個人數據,使之在整合、關聯和深度分析時受到隱私侵犯。 在當前數據科學和信息技術發展的過程中,隱私信息的界定正在變得不嚴格。
巨大的數據集之下,即便個人提供部分數據字段,也可能被得出一些隱秘的推測,并給用戶帶來風險。
2016年,上海交通大學的一篇機器學習論文《基于面部圖像的自動犯罪概率推斷》曾引起過爭議。相同遭遇的還有2017年斯坦福大學公布的論文《Deep neural networks are more accurate than humans at detecting sexual orientation from facial images》,其中的 AI 算法已經能夠通過個人的肖像照片識別同性戀,且準確率高達81%。
公開在社交網站及其他角落的相片信息中的肖像不存在隱私問題,但對于人臉圖像數據的分析、存儲和使用,隱私權問題依舊面臨挑戰。如果個人用戶并不在意自己在各個角落的信息披露,認為網絡空間僅僅是和普通公共場所一樣,那么當處在隱私邊界時,他們就容易遭到認知偏差的影響,比如過度低估個人信息的利用程度和數據價值。只需要一些公開的信息,運用技術就可以對個人的情況進行推斷、分類甚至“定價”和“特殊對待”。
如今企業在技術層面的數據挖掘技術的演進、機器學習和深度學習算法的發展,都讓數據利用效率和程度得到顯著提升。特定的分析流程和算法有時很難進行描述和解釋,服務運營商甚至在進行分析之前也不了解他們能夠得到的結果。更多隱私問題甚至是在二次開發利用原始數據時才引發的,因此在法律監管上也存在難度。
隱私專家 John Diebold 曾前寫過這樣一句話,而這在不久之后的將來,這可能會成為現實。
信息時代你留下的每一個字節,都會是構成隱私的血肉。
隱私意識在覺醒,但是…
2018年伊始時,大家的朋友圈都曾一度遭遇被“支付寶年度賬單”和“網易云音樂”統治的時刻,隨后當天就有用戶揭露被安插在年度賬單首頁之中、必須簽署的《用戶隱私協議》。
細心用戶發現了這行隱蔽的小字,并點開看了《用戶協議》,但也許是因為個人意志還無法抗衡從眾心理,又或許還是敗給了自己的好奇心,最終絕大多數用戶還是同意將自己的數據授權給了芝麻服務,開開心心地在朋友圈曬了支付寶年度截圖。
可以發現人們的隱私意識雖然存在,但依然愿意用犧牲個人數據換取更好的網絡生活,或者將安全和隱私的責任完全寄托在政府和網絡服務商身上。2014年時,EMC在15個國家和地區進行了15000 用戶的隱私保護調查,而調查結果依舊讓人擔憂。
50%的用戶遭遇過或大或小的數據泄漏
62%的用戶并不會定期修改密碼
33%的人不會修改社交網絡上的隱私設置
39%的人不會對自己的移動設備設置密碼
而 2018 年 剛剛召開的Usenix Enigma 安全峰會上,谷歌工程師也在演講時道出了谷歌用戶的安全意識現狀,可以看到情況并不樂觀——盡管早在 7 年前谷歌就開始引入了兩步驗證(2FA)功能,但目前有效的谷歌賬戶中,少于 10% 的用戶開啟了兩步驗證功能對賬戶進行保護;而使用密碼管理器的用戶在整體僅占12%的比例。
安全、便利和隱私之爭始終無法停歇大數據時代的便利已經滲透進了我們生活的每個角落,更低的商品價格、更符合實時需求的產品和社會溝通度,要使用這些服務就會創建個人數據,而通過數據信息就總有辦法辨析出個人的身份。
如果用戶確實關心自己的隱私狀況,不希望泄漏信息還是有一些簡單的措施可以采納:
1.避免連接公共WiFi,及時在所有設備上進行安全更新
2. 開啟賬戶兩步驗證功能,安裝密碼管理器
3. 注意所有應用程序的權限設置
4. 斟酌填寫真實信息,適當選擇備用方式
5. 開啟瀏覽器拒絕跟蹤功能,及時清理 cookie
6. 適當使用匿名互聯網服務
科技之殤:端到端加密究竟保護了誰?
研究人員稱HTML5可以被用來追蹤網民
得到相機授權的iPhone APP可在你不知情的情況下偷偷拍照竊取隱私
Firefox再次從Tor瀏覽器中借鑒了一個隱私保護功能
Signal 新探索:運用英特爾 SGX 加強聯系人搜索功能的隱私安全
Google無視用戶隱私設置,暗中收集Android位置數據
iTerm2 中可能通過 DNS 請求泄漏隱私信息
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25