
大數據利益相關者的利益矛盾及其倫理治理
2013年是大數據元年[1],大數據時代的到來,已給我們的生產、生活、學習與工作帶來了前所未有的變革,同時也帶來了許多的挑戰。在一切皆可數據化的新歷史條件下,數據成為了最寶貴的資源,通過循環往復的數據挖掘和二次利用,隱藏在數據中的巨大價值正在不斷地被挖掘與利用。2014年荷蘭學者Andrej Zwitter撰文Big Data ethics(《大數據倫理》)指出:“這里有三類大數據利益相關者(Big Data stakerholders):大數據搜集者(Big Data collectors),大數據使用者(Big Data utilizers)和大數據生產者(Big Data generators)?!盵2]在這數據搜集、存儲、挖掘、預測與利用的過程中,大數據利益相關者難免會出現這樣或者那樣的利益矛盾,有必要從倫理視角進行相應地治理,特別是在法律規范相對滯后的前提條件下,實現數據共享的健康運行,最終促進大數據時代的順利發展。
一、大數據利益相關者的利益矛盾分析
作為利益矛盾共同體的大數據利益相關者,在一切皆可數據化的條件下,應該共同利用大數據技術,挖掘和享有數據的巨大價值。雖然總體而言他們的目標是一致的,都是為了占有與享有大數據蘊藏的巨大價值,但是在總體的共同目標之下,他們又是帶著各自獨特目標的,特別是在大數據技術還沒有全面普及的情況下,由于利益分配不均而導致的諸種利益矛盾將無法避免。
按照Andrej Zwitter的理解,大數據搜集者是按照特定目標來決定搜集和保存哪些數據以及保存多長時間。[2]顯然大數據搜集者的目的并不是為了搜集而搜集,為了存儲而存儲,之所以要搜集與存儲,就是要利用數據進而占有和享有其中的巨大價值。正因為是帶著特定目標來搜集和存儲相關數據,所以必然會導致有所選擇。而這樣的結果就是,所搜集和存儲的數據相對于某一特定目標而言是整體而全面的,但是相對于其他目標則不盡如此了。因此,特定目標直接影響了數據的整體性與全面性。換句話說,大數據搜集者只能搜集和存儲與某一特定目標緊密相關的數據,并想要以此來實現這一特定目標。但是,特定目標最終能否實現還要依賴于大數據使用者。
大數據使用者主要是利用大數據技術對已搜集和存儲的數據進行挖掘、預測和利用。他們可能是帶著特定目標來進行的,也可能是毫無目標的。[2]大數據使用者才是真正的大數據技術掌控者。由于大數據使用者擁有獨特的技術優勢,完全有可能導致數據在挖掘、預測和利用中偏離大數據搜集者的初衷,因為數據能夠不斷地被二次利用與挖掘。因此,如果大數據使用者在數據挖掘、預測和利用中產生了超出大數據搜集者本來目標的新價值,那么該如何分配,是共享還是獨享?特別是由于技術優勢的存在,大數據搜集者可能根本就不知道原來搜集和存儲的數據產生了怎樣的新價值。當然,如果大數據搜集者和大數據使用者是同一群體的話,就不存在這樣的問題。問題的關鍵在于很難真正實現二者合二為一,因為大數據搜集者是帶著特定的目標來搜集和存儲的,他們僅僅能夠在實現某一目標的過程中既是大數據搜集者,也是大數據使用者,但是數據的二次利用呢?因此,大數據搜集者和大數據使用者很難實現完美合一,總是處于矛盾地合作中。
如果說大數據搜集者和大數據使用者處于利益矛盾之中是因為無法實現利益最大化的話,那么大數據搜集者、大數據使用者和大數據生產者之間的利益矛盾則是如何實現傷害最小化了。相比較而言,大數據生產者一直處于最被動地位。因為大數據生產者每時每刻都自覺與不自覺地生產著數據。在大數據時代,一切皆可數據化,大數據生產者的一言一行都必將以數據的形式存在。這就導致了大數據生產者根本就無法知道哪些數據被搜集和被存儲以及存儲了多長時間,并且根本就不知道自己生產的數據在何種目的的作用下被挖掘、預測與利用,更不可能知道自己生產的數據在被挖掘、預測和利用了之后將對自己產生怎樣的影響。因此,對于大數據生產者而言,只要不對自己產生消極影響就足夠了,根本就無法想象還能從中獲取本屬于自己的價值。如此看來,大數據生產者和大數據搜集者、大數據使用者也必然處于利益矛盾狀態:對于大數據搜集者和大數據使用者而言肯定是要盡可能多地搜集、存儲、挖掘、預測和利用大數據生產者的數據,這就不可避免地會對大數據生產者產生消極影響,例如對隱私(Privacy)、機密(confidentiality)、透明(transparency)、身份(identity)和自由選擇(free choice)等構成了威脅;[3]對于大數據生產者而言,由于處于被動地位,只希望自己的利益能夠得到有效保護,將傷害降到最低限度;如果傷害一旦產生,則希望能夠得到相應的補償,包括物質的和精神的。
綜上分析,由于分工的不同和地位的差異,大數據利益相關者必然處于利益的尖銳矛盾之中。其根本原因就是數據價值很難實現按比例恰當分配:大數據搜集者與大數據使用者難以實現利益均沾,大數據搜集者、大數據使用者與大數據生產者則是利益與傷害不均等。
二、大數據利益相關者的利益矛盾表現
從大數據搜集者與大數據使用者之間的角度來分析,如果是在某一特定目標作用下進行數據的搜集、存儲、挖掘、預測和利用的話,那么到底應該按照何種比例來分配數據的巨大價值呢?或者說,到底是數據搜集與存儲重要呢,還是數據的挖掘、預測和利用重要呢?這就需要做到具體問題具體分析,在數據的搜集、存儲、挖掘、預測和利用之前必須確定相應的比例以避免矛盾的出現。但是到底應該如何確定比例呢,特別是在此過程中如果又產生新價值呢?因此,即使是在同一目標作用下,確定了利益分配的比例,也難免會出現這樣或者那樣的糾紛。
如果不是在某一特定目標作用下進行的話,情況就更加復雜了,利益矛盾就可能更加尖銳。由于數據可以不斷地被二次利用和預測,大數據使用者就能夠從中挖掘出源源不斷的新價值。在某一個特定目標實現之后,數據并不會因此而消失,而是能夠源源不斷地發現新的價值,即能夠不斷地實現不同的目標。這樣,大數據搜集者與大數據使用者處于分裂狀態將是必然。相對于大數據搜集者而言,當某一目標實現了之后,搜集與存儲起來的數據就可能處于閑置狀態,不會考慮其中的新價值。但是相對于大數據使用者而言,這些數據并不會因為某一特定目標的實現而被刪除掉,更何況根本就無法刪除,正如維克托·邁爾-舍恩伯格(Vikor Mayer-Schǒnberger)所言:“數字技術已經讓社會喪失了遺忘的能力,取而代之的則是完善的記憶?!盵4]因此,必然會產生源源不斷的新價值。這個新價值該如何分配呢?由于不是在某一特定目標下進行的,大數據搜集者可能根本就不知道自己搜集與存儲的數據被用作他途,這就不僅無法在進行數據挖掘、預測與利用之前確定相應的利益分配比例,甚至大數據搜集者根本就不知道產生了什么新價值,要共享其中的利益談何容易。如果長此以往,矛盾必然持續爆發。
有利益分配必然就有責任承擔問題。在數據的搜集、存儲、挖掘、預測和利用的過程中肯定會產生各式各樣的責任,最典型的問題就是對大數據生產者的隱私保護。一旦在此過程中對大數據生產者產生了侵犯隱私的消極后果,那么該如何承擔這一責任呢?肯定不能僅僅由大數據搜集者或者大數據使用者承擔。如果是在某一特定目標下進行,也許會相對好一點,就由他們共同承擔(當然也涉及到責任的比例劃分問題);如果不是在某一特定目標下進行的呢?對于大數據搜集者而言也許處于“無知”狀態,是否也需要承擔由大數據使用者造成消極影響而形成的責任呢?
從大數據搜集者與大數據生產者之間的角度來分析,首先是大數據生產者根本就無法共享利益。如前所述,由于大數據生產者在大數據利益相關者共同體中一直處于被動狀態,可能根本就不知道自己的一言一行已形成數據而被大數據搜集者所搜集與存儲。要和大數據搜集者共享其中的價值根本就無從談起。如此看來,好像大數據搜集者與大數據生產者基本上不會出現什么利益矛盾。但是一旦大數據搜集者在搜集與存儲數據時,對大數據生產者造成了諸如隱私泄露等傷害,二者之間的利益矛盾就必然爆發。
其次,是二者之間的傷害不對等。數據在搜集和存儲的過程中基本上不會對大數據搜集者構成什么傷害,但是如果沒有遵循諸如保密原則等職業倫理準則,那么就會對大數據生產者造成持久的傷害。這個不對等地位也必然會導致二者之間處于緊張的利益矛盾狀態。
再次,是涉及由于二者之間利益矛盾而導致的對大數據生產者的利益補償問題。這就涉及如何進行補償以及補償的比例等問題,難免會出現利益糾紛。
最后,是數據再利用的利益矛盾問題。如果是在為了實現某一特定的公共目標且征得了大數據生產者同意的情況下,大數據搜集者進行了相應數據的搜集與存儲,那么當這一特定目標實現了之后就涉及到數據的刪除問題。但是由于數據無法刪除,難免會被用作他途而導致對大數據生產者產生傷害。在這種情況下,二者也難免會出現各式各樣的利益矛盾。因此大數據搜集者和大數據生產者也必將處于尖銳的利益矛盾之中。
從大數據使用者與大數據生產者之間的角度分析,他們之間的利益矛盾表現不僅與大數據搜集者和大數據生產者之間的利益矛盾表現相一致,還有自己的獨特表現。第一是數據的新價值無法共享。由于數據能夠持續不斷地二次利用,進而獲得源源不斷的巨大新價值。這些新價值不僅大數據搜集者難以實現與大數據使用者共享,而且大數據生產者根本就無法與大數據使用者共享。因為大數據使用者到底是帶有怎樣的目標來持續二次利用數據也只有他們本人才清楚,對于大數據生產者而言只能“任人宰割”,因為他們基本上處于“無知”狀態。
第二是產生持續傷害。在數據的二次利用中難免會對大數據生產者產生諸如隱私侵犯等傷害,并且這個傷害是隨著數據的不斷二次利用而對大數據生產者構成持續傷害,而將會產生怎樣的傷害以及傷害多大,對于大數據生產者而言是無法預估的。
第三是必將導致大數據生產者要實現必要的補償顯得異常艱難,甚至無法實現。在自己生產的數據完全無法控制且不斷被二次利用的前提條件下,大數據生產者根本就無法估量將對自己產生怎樣的傷害以及產生多大的傷害,要實現必要的補償就顯得極其艱難,也許一個傷害得到了相應的補償而下一個傷害又接踵而至,使大數據生產者處于循環往復的深淵之中。因此,大數據生產者與大數據使用者也處于緊張的利益矛盾之中。
總之,在大數據時代條件下,大數據利益相關者處于利益矛盾之中是有其必然性的。
三、大數據利益相關者的利益矛盾的倫理治理
為了協調好大數據利益相關者之間的利益矛盾,有必要進行相應的倫理治理,以實現數據共享的有序進行,進而實現大數據時代的順利發展。因此,需要對大數據利益相關者制定出相應的倫理原則。
相對于大數據搜集者和大數據使用者而言,應該遵循如下原則:
原則一:授權。只要情況許可,無論是大數據搜集者還是大數據使用者在搜集、存儲、挖掘、預測和利用數據時都必須得到大數據生產者的授權,如果采用秘密或者非法的手段進行,必將造成難以估量的傷害。沒有得到對方授權而進行的數據搜集、存儲、挖掘、預測和利用等行為本身就是不道德的,應該被譴責。這是進行數據搜集、存儲、挖掘、預測和利用的前提原則。
原則二:告知。在搜集、存儲、挖掘、預測和利用數據時必須告知大數據生產者其中的目標與用途,將產生怎樣的巨大價值以及將產生怎樣的消極影響。如果將產生重大的消極影響,那么大數據搜集者和大數據生產者將采取什么樣的預防措施;如果對大數據生產者產生了傷害,又將采取什么樣的補償措施這些都必須告知大數據生產者。這樣才能夠實現在大數據利益相關者之間和諧有序地進行數據共享。
原則三:保密。在具體的數據搜集、存儲、挖掘、預測和利用的過程中必須實現保密,特別是涉及到大數據生產者隱私的情況下必須采取匿名化技術處理措施,保證大數據生產者不會因為自身數據在共享過程中被非法盜取而產生不必要的傷害。這是保證大數據生產者權益不受到傷害的重要倫理原則。
原則四:自律。自律是大數據搜集者和大數據使用者必須努力養成的基本道德原則。大數據搜集者和大數據使用者必須在數據搜集、存儲、挖掘、預測和利用的過程中養成良好的道德自律,保證符合最起碼的道德規范和準則。當然,這是一個長期的過程,不是一天兩天就能夠實現,但是無論如何都應該養成良好的道德自律。
原則五:責任。這要求大數據搜集者和大數據使用者必須承擔責任。按照著名技術哲學家漢斯·林克(Hans Lenk)的觀點:在任何情況下,任何技術力量的強大都會導致某種系統的反彈,導致生態失衡,這其中的根本原因就是我們在利用技術時沒有承擔相應的責任。[5]這就要求大數據搜集者和大數據使用者必須在努力實現數據價值的同時,勇于承擔起相應的責任,特別是在產生消極后果的時候,否則大數據利益相關者之間的利益矛盾將永遠無法得到圓滿解決。
原則六:利益。利益原則就是要實現利益最大化。利益最大化不能僅僅從自身進行考量,更重要的是要從大數據利益相關者視角來實現。即既要實現大數據搜集者利益最大化,也是實現大數據使用者的利益最大化,更為重要的是要實現大數據生產者的利益最大化。這樣才能真正有助于大數據利益相關者的利益矛盾解決。
原則七:傷害。有利益最大化就必然有傷害最小化,這對于大數據生產者而言具有特別重要的意義,也是解決大數據利益相關者利益矛盾的關鍵所在。絕不允許把實現利益最大化建立在導致傷害最大化的基礎上,或者是建立在部分人傷害最大化的基礎上。結合前面的論述,原則七的關鍵是要實現大數據生產者的傷害最小化。
原則八:補償。大數據技術和以往的技術一樣必然具有雙刃性,在給我們帶來巨大價值的同時,也不可避免地帶來了消極影響。要真正利用好大數據技術,對其產生的消極影響絕對不能視而不見,更不能推波助瀾,應該采取積極的補償措施,避免傷害的擴大化。這是大數據技術產生消極影響的重要補救措施。
相對于大數據生產者而言,則應該遵循如下原則:
原則一:轉變觀念?!按髷祿暮诵木褪穷A測?!盵6]在大數據時代,基本上每一個人都是透明的,因為“大數據能讀懂過去、預測未來”。[7]這就要求大數據生產者必須轉變觀念,積極保護自己生產的數據,而不能像原子時代一樣,對自己的生產出來的數據無動于衷。如果繼續這樣下去,大數據生產者就會出現人性危機,對隱私、機密、透明、身份和自由選擇等等產生威脅。因此,大數據生產者必須時時刻刻關注自己的一言一行,關注自己生產的數據,估量這些數據將產生怎樣的消極影響。而不是想當然地認為這些數據不會對自己的未來產生任何影響。
原則二:自我保護。由于大數據生產者處于被動地位,這就要求他們增強自我保護意識,積極拿起相應的法律道德武器來保護自己的合法權益,使其免受侵犯;當自己的合法權益受到侵犯時,要敢于拿起相應的法律道德武器與之斗爭,并積極爭取相應的精神與物質補償??傊?,大數據時代里大數據生產者的自我保護意識與行為不能停留在原子時代,而應該積極適合大數據時代的發展需要而變得更為主動與積極。
原則三:注重數據。數據被譽為是大數據時代的取之不盡用之不竭的“石油”,數據中蘊藏著無法估量的巨大價值,我們所能看到的價值僅僅是數據價值的冰山一角。而這些數據主要都是由大數據生產者生產。這就要求大數據生產者更加注重自己所產生的數據,特別是不能讓這些數據用于非法用途而給整個社會帶來消極影響。需要特別指出的是,大數據生產者應該積極關注數據權。
原則四:利益與傷害。大數據技術是一把雙刃劍,既有積極的作用,也有消極的影響。因此,對于大數據生產者而言,必須努力實現數據價值的最大化和傷害的最小化。雖然大數據生產者很難與大數據搜集者、大數據使用者實現利益均沾,但是大數據生產者應該積極地參與到數據利益的分配中,特別是在數據能夠成為商品的條件下。同時,在此過程中必須實現傷害最小化。
原則五:尋求補償。在受到傷害時,大數據生產者應該積極尋求精神與物質的補償。這是實現傷害最小化的一個補救措施,也是在傷害已經產生的條件下應該采取的一個重要措施。這種補償不僅是物質補償,更為重要的是精神補償。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25