熱線電話:13121318867

登錄
首頁職業發展業務驅動的政府大數據平臺數據治理
業務驅動的政府大數據平臺數據治理
2018-04-23
收藏

業務驅動的政府大數據平臺數據治理

一、問題提出

為推動經濟轉型, 提升政府治理能力及國家競爭力, 國務院印發《國務院關于積極推進“互聯網+”行動的指導意見》及《促進大數據發展行動綱要》, 文件提出通過布局大數據基礎設施平臺實現數據共享、數據交換和數據開放。實踐層面, 為深化互聯網與社會經濟領域的融合并推進大數據發展和應用, 各省市相繼開展政府大數據平臺的建設實踐。理論層面, 政府大數據平臺帶來的聯接力與創新力促進了政務數據的共享、開放和交換, 有利于推進簡政放權、創新政府治理方式、優化市場服務并加強市場監管。但信息治理環境下政府信息化建設遺留的信息治理、信息安全等問題未完全解決。進入大數據時代, 建設政府大數據平臺同樣面臨大數據4V (Variety, Volume, Velocity, Value) 特征的挑戰, 這些因素成為阻礙數據共享、數據安全、數據主權、數據治理實現的障礙, 大數據治理正是為應對這些挑戰提出的解決路徑。

目前對大數據治理的研究局限于對大數據治理概念的界定, 其中代表性的研究包括:Soares將其定義為信息治理的一部分, 是與大數據優化、隱私、變現、多功能協作相關的政策制定。在此基礎上, 梁芷銘提出, 為應對大數據的挑戰, 大數據治理是運用技術工具進行大數據管理、整合、分析及挖掘的行為, 并按照對象將其劃分為人、物、數據、技術四位一體的框架。此外, 大數據背景下通用的數據治理體系框架包括數據持久化層、數據集成層 (主數據) 、統一建模層、數據質量層、元數據管理層和數據治理人員組織層。

文獻調研的結果表明, 現有研究主要集中于對大數據治理概念框架的探討, 缺乏對其實施細節的研究和解釋, 同時缺乏對大數據治理實現過程的實證支持。為了填補這一研究空白, 本文提出以下研究問題:跨系統和跨部門的政府大數據平臺如何實現數據治理?鑒于當前政府大數據平臺數據治理實踐和理論的探索性, 本文采用案例研究方法。

二、研究方法及數據收集

針對跨系統和跨部門的政府大數據平臺如何實現數據治理的研究問題, 論文采用案例研究方法, 并通過多案例增強結論的說服力。遵循理論抽樣原理, 論文選取了寧波市三個政府部門建立的大數據平臺數據治理實踐為案例, 首要原因是寧波市大數據發展過程中呈現的大數據治理實踐為本研究提供了實證支持。根據《寧波市人民政府關于推進大數據發展的實施意見》, 寧波市以國家城市大數據綜合示范應用城市、國家級大數據創業中心和城市大數據產業基地為未來發展目標。寧波市代表了政府大數據平臺數據治理的先進水平, 其在大數據發展和應用中取得的成績, 包括國家新型城鎮化綜合試點城市、國家創新型試點城市、2015中國十大智慧城市等, 尤其是海曙區的政務大數據共享和開放建設獲得2017大數據產業峰會的“大數據應用優秀案例獎”, 提供了典型的政府大數據平臺數據治理中國方案和地方經驗。更為根本的原因在于寧波市政府大數據中心、寧波市智慧城市管理中心以及寧波市海曙區經濟和信息化局三者建設的大數據平臺均包含完整的數據治理過程, 具有數據融合、業務融合和系統融合特征, 且三者之間的治理模式存在近似之處, 符合逐項復制的原則。

在數據收集方面, 本研究通過不同數據來源為研究結論提供三角互證, 主要包括訪談、政策及文獻調查。其中主要的數據來源于半結構化訪談, 選取每個平臺的高層管理者、負責人及技術人員共9人開展訪談, 訪談圍繞“大數據治理、大數據標準及大數據質量”展開, 在每項訪談中, 訪談對象圍繞組織的整體業務情況、平臺的建設情況進行介紹, 并演示了平臺的具體功能及其數據、業務及系統的融合過程。

本研究主要采取以下方式提高收集數據對結論的支持度。首先, 對不同級別對象進行訪談以避免個人偏見, 其中高層管理者負責平臺的頂層設計, 由負責人進行整體規劃, 技術人員負責具體的功能及技術細節實現。其次, 采用多源數據, 并在不同平臺的訪談對象間尋求規律和差異進行相互印證, 以避免可能的偏見。最后, 對訪談對象做匿名化處理, 鼓勵訪談對象積極參與并提供準確信息。

在數據分析方面, 通過歸納性分析產生政府大數據平臺數據治理的主要內容。隨后的第一項任務是進行內部案例分析, 對各平臺的數據治理問題進行研究。第二項任務是在復制邏輯的指導下進行跨案例分析, 采用表格形式提煉不同平臺的共性和差異, 初步形成政府大數據平臺數據治理的路徑, 并通過不同平臺進行相互印證。最為重要的過程是在理論和訪談數據及文獻之間進行循環分析, 形成最終的研究結論。

三、政府大數據平臺數據治理案例特點

本研究調研的寧波市三個政府部門建立的大數據平臺, 均為政府部門內部為促進數據流轉建立的跨系統和跨部門的大數據平臺。表1總結了三個案例的特點。

在建設層級方面, 海曙區與寧波市政府大數據平臺的一個關鍵區別是, 區級平臺直接面向實際工作和業務活動, 而市級平臺不負責具體業務只負責任務分配, 與市級平臺相比, 區級平臺面向業務的數據共享需求更為強烈。

關于管理模式, 政府大數據平臺的管理模式沿襲了我國條塊分割的管理體制。海曙區與寧波市大數據平臺及其城管系統的數據融合平臺, 因涉及不同職能部門間的數據流轉, 因而實行橫向職能管理;但對于城管系統內部, 則在行業內部實行自上而下的垂直管理, 其中的一個顯著不同是專業部門建設的大數據平臺與業務直接相關。

表1 政府大數據平臺數據治理案例特點

就數據來源而言, 海曙區建立的大數據平臺以職能部門提供的應用數據為主, 與之相似, 市級政府大數據平臺同樣以職能部門提供的數據為來源, 兩個平臺本身并不擁有數據資源;與之相區別的是, 市級智慧城管平臺的數據來源于城管系統的業務活動。

四、政府大數據平臺的數據治理路徑

鑒于數據資源作為政府核心資產的重要屬性, 本文探討的數據治理聚焦于政府大數據平臺以數據為對象開展的治理活動。課題組主要圍繞“大數據治理、大數據標準及大數據質量”展開訪談, 本文僅討論與數據治理相關的數據。按照數據治理輸入、過程和輸出三個階段對案例數據進行分析, 跨系統和跨部門的政府大數據平臺的數據治理問題涌現為數據集成、數據一致性、數據處理、數據存儲數據共享五項具體內容。圖1描述了三個政府大數據平臺的數據治理路徑。

(一)憑業務需求實現數據集成

根據政府信息化發展歷程及數據治理理論, 信息化是數據集成的背景和環境。由于信息系統建設造成“信息孤島”問題, 為減少冗余數據、保障數據一致性、促進信息共享, 數據集成成為政府部門的必然選擇, 并由早期的信息系統集成發展到云計算環境下的數據集成。為實現數據集成, 現有學術研究中對數據集成方法和技術的探索包括:數據倉庫、數據交換、模式集成、數據復制及綜合型集成?,F有研究表明, 信息化是數據集成的誘因, 數據集成主要依靠技術方法實現。區別于現有研究, 本研究揭示出數據集成與業務需求的關聯性。

圖1 跨系統和跨部門的政府大數據平臺數據治理路徑

參考現有研究中對數據集成的定義, 本文將政府大數據平臺的數據集成定義為:政府各部門將異構、分布、相互關聯的多源數據集成到統一的政府大數據平臺, 實現數據資源的有效組織和部門間數據共享。通過對文獻和訪談資料的整理, 表2揭示了數據分析的結果及代表性觀點, 描述了基于業務需求的政府數據集成。

表2 基于業務需求的政府大數據平臺數據集成

實際訪談的結果顯示政府大數據平臺的數據集成起源于職能部門的業務需求, 現有研究同樣表明集成方法的選擇依賴于業務應用系統的需求。在政府各職能部門履行職責的過程中, 因業務辦理產生對其他政府部門的數據需求。為實現各部門數據交換和共享的需求, 政府大數據平臺集成了不同部門的數據資源。在平臺上, 職能部門的業務需求直接決定其數據集成的內容和范圍, 對于與各部門業務需求無關的數據, 并不屬于大數據平臺數據集成的對象, 即數據集成取決于業務需求。

值得注意的是, 政府大數據平臺集成數據資源的來源與數據權屬問題。智慧城市管理中心實行縱向專業管理, 直接面向業務需求, 其建設的智慧城管大數據平臺主要實現專業范圍內數據資源的集成, 說明數據集成與業務的關聯性。與此相區別, 區級和市級政府大數據平臺本身并不產生業務數據, 其數據資源主要來自于與業務直接相關的各職能部門, 平臺集成的數據資源依然歸屬于各業務部門, 但平臺為各部門提供了數據交換和數據共享的渠道。兩種類型的大數據平臺均表明數據集成與業務需求的相關性。

綜合以上分析, 政府信息化建設及數據集成技術并非數據集成的決定性因素, 政府部門的業務需求是數據集成的關鍵原因和重要依據。雖然數據集成涉及數據碎片、冗余數據、數據一致性等問題, 但其并非必然導致數據集成。案例數據表明, 政府數據集成與業務需求直接相關, 尤其是業務需求直接決定數據資源集成的內容和范圍。

(二)依業務活動保障數據一致性

云計算為大數據提供了分布式存儲數據處理的平臺?,F有的大數據平臺主要采用云計算服務模式, 由于數據存儲于不同節點, 同時由于分布式數據處理造成數據不一致現象, 數據一致性保障正是用于解決數據不一致問題。

政府大數據平臺中的數據一致性主要關注不同業務部門關于同一主體的數據一致性問題。雖然保障政府數據一致性是現有研究的共識, 并通過政策、法律、標準實現約束, 但現有研究并未明確其制定依據。與現有研究相反的是, 訪談數據顯示政府部門數據不一致很正常。表3描述了基于業務活動保障政府大數據平臺的數據一致性。

表3顯示, 政府大數據平臺保障數據一致性的依據是業務活動。平臺數據來源于同一業務活動, 且數據依業務活動的變更而更新。此外, 為保障不同部門關于同一主體的數據一致性, 大數據平臺提供的輔助措施包括:不同部門間數據的比對, 通過數據普查進行核驗, 以及在實際工作中進行驗證。案例研究顯示, 三個部門在多年的工作中并未因數據一致性問題造成困擾, 即數據一致性并非政府大數據平臺的關注焦點。

與之相反, 由于各部門業務活動的差異, 數據不一致被視作正常。在寧波市大數據中心調研過程中, 平臺的負責人明確表示:數據不可能一致。關于數據不一致的原因與業務活動密切相關:第一, 業務部門承擔業務活動, 即使是同一主體的數據同樣會因業務活動的差異存在不一致;第二, 由于三個政府大數據平臺的建設者和使用者之間不存在直接的領導隸屬關系, 即使數據不一致, 平臺僅有告知的責任與義務, 并無強制執行的權力和保障;第三, 對于業務部門而言, 由于數據的采集和使用有責任單位, 業務部門不具有使用其他業務部門數據的權利。

表3 基于業務活動保障政府大數據平臺數據一致性

綜合來看, 大數據平臺的數據一致性主要由業務活動決定, 但數據一致性問題并未造成實際工作的困擾。反之, 由于業務活動的差異, 數據不一致現象客觀存在, 政府大數據平臺的數據治理出現由保障數據一致性到接受數據不一致的趨勢。但數據一致性保障及數據不一致現象均以業務活動為決定因素。

(三)據業務場景開展數據處理

數據處理是政府大數據平臺的核心功能, 是實現數據利用、數據共享的關鍵環節。大數據處理是對數據的鑒別、積累和分析, 在此項研究中主要涉及數據處理的依據、權限及結果?,F有文獻調研的結果顯示, 元數據是實現數據從無序到有序的重要依據, 主要在政府數據統計中發揮作用, 但由于標準不一亟待構建統一的元數據標準;在政府大數據平臺開展科學、合理分類是進行數據處理的共識, 中國政府公開信息整合服務平臺曾以內容和行政區進行分類, 但其效果并不理想;在權限方面, 目前僅限于對政府大數據平臺使用權限的探索。綜合現有研究成果, 其與訪談結果最為明顯的差異在于數據處理與業務場景的分離性, 具體如表4所示。


表4 基于業務場景的政府大數據平臺數據處理

訪談結果揭示, 業務場景決定政府大數據平臺數據處理的輸入和輸出。一方面, 區別于現有文獻, 就政府大數據平臺的輸入而言, 實踐中大數據平臺在數據處理之初將數據的業務屬性納入考慮范圍, 以元數據作為數據處理依據, 并賦予業務部門提供元數據說明的自主權, 以保障業務與平臺之間的連接。另一方面, 關于數據處理結果的輸出, 三個平臺數據處理的結果均提供面向應用的數據利用, 支持按照業務場景組合應用數據。

鑒于業務場景的差異, 三個平臺同樣存在數據處理的差異。對于與業務并無直接關聯的政府大數據平臺, 其元數據參照標準呈現多樣化特點;但對于專業性更強、與業務直接關聯的智慧城管平臺, 則以具有專業屬性的行業標準為主要依據。同時, 大數據平臺數據處理的權限與業務場景直接相關, 由于市級政府大數據平臺與業務無直接關聯, 平臺僅提供數據共享的渠道, 因而業務場景的無關性決定其數據處理過程不具有數據查看的權限。

上述結果表明, 業務場景直接決定政府大數據平臺數據處理的依據、權限和結果, 其中元數據用于保障平臺數據輸入與原始業務的相關性, 業務場景決定數據處理的權限, 平臺的數據輸出同樣提供根據業務場景組合數據的功能??傊? 基于業務場景開展數據處理, 在保證數據業務屬性的基礎上實現了面向業務場景的政府跨部門數據利用。

(四)以業務應用確保數據存儲

數據存儲是為滿足應用需求獲取數據的方式, 與數據存儲和數據管理相關, 現有的大數據存儲技術包括:分布式文件系統、No SQL數據庫、New SQL數據庫和大數據查詢平臺。具體到政府大數據平臺的數據存儲, 在現有文獻中, 無論是政府開放數據平臺, 亦或對政府信息資源管理的頂層規劃, 均包含對數據存儲的討論, 但并未明確多源數據具體的存儲方式及其相關依據。與現有研究提出的大數據均應存儲于云平臺相區別, 表5揭示出業務應用直接影響大數據平臺的數據存儲。

表5 基于業務應用的政府大數據平臺數據存儲

案例數據顯示, 政府大數據平臺的數據依然存儲在各業務部門。由于業務部門直接面向業務應用, 同時大數據平臺尤其是橫向職能型大數據平臺與業務的分離性, 直接決定業務數據的存儲依然在各業務部門。由此區分出兩種數據存儲類型:一類直接面向應用, 由承擔具體業務的業務部門存儲;另一類面向共享, 為大數據平臺的技術存儲與備份, 平臺僅提供共享的渠道, 即業務部門提供的數據僅用于共享, 技術存儲與業務應用無關。后者在存儲時間、存儲技術等方面具有一定的靈活性, 但不同平臺技術存儲的差異仍有待整體規劃。

以上分析表明, 政府大數據平臺的數據存儲以業務應用為決定因素, 由于平臺與應用的分離性, 因而數據存儲依然由業務部門負責。大數據平臺則主要提供數據資源的技術存儲及備份功能, 對于此類存儲, 未來仍有待于明確存儲時間、存儲技術、存儲管理以實現大數據平臺的數據治理。

(五)由業務部門決定數據共享

現有對政府跨部門信息共享的研究表明, 信息共享影響因素是其中的一項重要研究內容。目前對信息共享影響因素框架體系的代表性研究包括:基于政府跨部門信息共享的情境, 形成政策、組織、社會和技術四類因素;對于地方政府跨部門信息共享的研究形成資源、動力、認識和信任四大因素;此外還包括技術、組織管理、法律政策框架。這些研究潛在的假設是政府各部門不愿共享信息, 因而為促進政府跨部門信息共享, 激勵機制、標準規范、推進體系等內容成為學界研究的重點。事實上, 數據分析結果揭示本研究所調研的寧波市政府各部門對共享數據是比較積極主動的, 并且平臺上數據共享的權限是由業務部門決定, 如表6所示。

表6 基于業務部門的政府大數據平臺數據共享

如前所述, 政府大數據平臺起源于業務部門對其他業務部門的數據需求, 并以最終實現跨部門信息共享為目的, 因而數據共享是業務部門的共識。換言之, 政府大數據平臺的關注問題不是數據愿不愿共享, 而是數據如何有效共享。所調研機構的解決方案是將平臺上數據共享的決策權保留在業務部門, 由業務部門決定數據共享的內容、范圍、條件和方式等。具體措施是由政府大數據平臺與各業務部門簽訂保密協議試行數據流通規范、制定數據管理辦法等。案例研究再次證明政府大數據平臺的數據治理與業務的關聯性。

關于由業務部門而非大數據平臺決定數據共享的原因, 首先是體制問題, 各平臺的建設者之于平臺的使用者并無直接的領導與隸屬關系, 并不具備決策的權利;其次是能力問題, 各業務部門直接與業務活動相關, 而平臺的建設者只發揮協調、溝通作用, 并無決策的人力和物力支持;最后是平臺定位, 政府大數據平臺建設的初衷是為了促進數據流通, 核心在于調動各方積極性, 而非削弱業務部門的權利。

上述分析表明, 與現有文獻研究的主流觀點相反, 政府跨部門數據共享的影響因素眾多, 但由于存在業務需求, 各業務部門對數據共享表示支持, 而非各部門不愿共享數據。同時寧波市三個跨系統跨部門的政府大數據平臺數據共享的經驗揭示, 將數據共享的決策權保留在業務部門, 以減少業務部門數據共享的顧慮是有效的大數據平臺數據共享路徑。

五、結語

通過以上對三個跨系統跨部門的政府大數據平臺數據治理路徑的案例分析, 本研究發現:第一, 政府信息化的發展并非必然導致數據集成, 數據集成起源于業務需求;第二, 平臺上數據的一致性主要依靠業務活動保障, 區別于保障數據的一致性, 更為關鍵的發現是由于業務活動的差異性, 數據不一致被視為正常;第三, 大數據平臺通過規定數據處理的依據、權限和結果實現對基于業務場景數據處理的限定;第四, 區別于面向數據共享的大數據平臺本身采取的技術備份, 面向業務應用的數據存儲仍然保留在業務應用部門;第五, 現有關于數據共享的研究以部門不愿共享為其假設, 但案例數據顯示各部門對于數據共享持支持態度, 并且平臺上數據共享的權限保留在業務部門。以上五方面表明政府大數據平臺的數據治理路徑以業務為驅動。

政府大數據平臺數據治理是為打破條塊分割的管理體系, 實現跨系統跨部門數據共享而提供的探索性解決路徑。本研究得出政府大數據平臺數據治理的關鍵是業務驅動, 其實質是保持平臺上數據與業務的關聯性, 尊重業務需求實現數據集成, 遵循業務活動規范保障數據一致性, 遵守業務場景開展數據處理, 遵照業務應用要求確保數據存儲, 遵從業務部門規章制度要求決定數據共享。

總體而言, 現有關于政府大數據平臺數據治理的研究局限于概念性研究, 缺少與業務的關聯。本文的研究貢獻在于:通過提供實證支持, 將政府大數據平臺的數據治理問題具化為數據集成、數據一致性、數據處理、數據存儲數據共享五方面, 發現業務驅動是跨系統跨部門政府大數據平臺數據治理的有效路徑。未來仍將持續關注業務驅動的政府大數據平臺數據治理的有效路徑及其實現方式。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢