
大數據技術在公安業務的應用分析
行業大數據帶來的變革與機遇
公共安全一直以來都是國家的重要根基,是國家發展的前提。隨著國家對公共安全的重視、公共安全領域項目的不斷增多和系統的持續運行,積累的各種數據日益增多(比如音頻數據、視頻數據、卡口系統數據、DNA、指紋、人像模型、空間位置(GPS)數據、報警數據、社交網絡及移動互聯網數據、射頻(RFID)數據,以及其他傳感器數據)。如何將這些數據資源充分利用,使數據能夠更好地服務于公安的情報分析、公共交通、輿情分析等業務工作,并更好的驅動業務創新,特別是成為應急、維穩、偵查破案的核心競爭力,成為行業步入大數據時代公安實戰信息化的首要目標。
大數據帶來的變革
首先,犯罪環境正變得日益復雜,由案件本身獲取到的數據,越來越難以支撐起嚴密的邏輯推論。辦案人員不得不去想方設法獲取更多“場外”數據以補充證據鏈條。原本依靠于人腦記憶和檔案搜索的狀態,每一個線索的提取都需要依靠記憶提取,對于無法直接確認的線索信息又需要翻查相應的檔案,不僅容易出錯,而且效率極低。大數據的匯聚已是必然。
其次,隨著社會形勢的發展變化,傳統“從案到人”偵查模式明顯被動滯后。 “由人到案”一直都是“大情報”建設的重大課題,也是難題。實踐證明,“由人到案”是迫切需求,而大數據的技術也使得這種新模式成為可能。
大數據與應急
大數據在進入人們視野之初,便是一個一個神奇的案例,沃爾瑪超市“啤酒與尿不濕”的故事、天貓商城“雙11”對于銷量額的精準預測、京東商城通過數據預測銷售,提早通過物流運送到附近倉庫、美國大數據公司Palantir憑借其大數據分析系統,在抓捕本拉登的行動中,通過數據分析得出本拉登的藏匿點線索信息。
大數據的背后,蘊藏著一套“規則”,也許由于數據深度與數據廣度超出人類的認知能力,我們并無法推論為什么,但結果就放在那里不由分說。因此,借助大數據,既可以預測某一區域乃至全國的某種類型的犯罪趨勢,也可以預測某一時間某一具體地點某種類型的犯罪,還可以預測某一個體的犯罪概率。根據預測,我們可以制訂計劃,優化警力配置,提升行動效率。
大數據之與社會維穩
互聯網成為人們日常交流、表達思想和宣泄情緒的重要平臺,也是相關內容安全保障的重要平臺。網絡輿論已成為社會輿論的重要組成部分,越來越多地引起全社會的高度重視。
搜索引擎、微博、微信、論壇、貼吧等互聯網輿論集中的區域,搜集這些數據便獲取到了以往無法掌握的社會輿論動向,熱度輿論、以及輿論領袖。一些**件、突發事件和熱點、敏感問題在網上被惡意炒作,如“表哥”事件、渭河污染事件等與環境相關的輿論形成強大的網上輿論氣候,各種負面信息通過互聯網的各種服務方式快速、廣泛傳播,嚴重影響社會穩定和政府單位形象?;ヂ摼W不僅是現實社會的虛擬映像,還是現實問題的聚焦鏡和放大器。
通過輿情機制,一方面可以加強互聯網信息監管,另一方面,對于及時應對網絡突發的公共事件和全面掌握社情民意,并對于及時發現社會蘊藏的潛在不穩定因素,提早預防起著重要作用。
問題和挑戰
新形勢下的公安工作離不開大數據的支撐,公安基礎信息化更是大數據的挖掘和深度應用。然而,越來越多的公安科技部門發現,基于新的大數據形態,技術瓶頸逐步顯現。一方面,這些海量數據需要強大的存儲和計算平臺來進行實時處理;另一方面,當前數據呈現出數據量大、數據種類多、數據增長快的特點,該如何通過大數據挖掘分析改進公共安全管理能力,提高政府決策服務能力,為人民生活提供有價值的信息服務。如何在數據資源整合的基礎上建立數據共享應用機制,利用全警及社會面資源,形成信息化研判平臺支撐公安實戰工作引領大數據時代的公安信息化管理發展,服務于人民群眾生活和國家經濟社會建設顯得尤為重要。
數據處理
在信息化社會中,信息可劃分為兩大類,其中能夠用數字或統一的結構加以表示的為結構化數據,如數字,符號;而另一類信息無法用統一結構表示的則為非結構化數據;在數據的應用過程中,最常見到,也是使用最方便的當然就是結構化數據了,結構化數據可以更好的做數據統一和檢索查詢從而更好的進行數據碰撞和挖掘分析等操作。相對的非結構化數據在檢索和應用上就困難很多。
在公安信息化建設和平安/智慧城市建設中各類結構化、非結構化數據,摻雜其中(如系統數據庫數據、日志數據、監控視頻數據、卡口圖片數據、測量、圖表等數據)?,F有的公安系統在數據應用中往往只能將結構化數據做簡單應用,雖在借助標準的開源大數據技術后,基本可實現絕大部分對于大數據的應用需求。然而,多數非結構化數據則并沒有發揮該有的作用。
另外,公安大數據是由眾多不同用途,不同結構的系統數據匯聚而來的。在數據的匯集管理工作中,如何高效穩定的轉換數據,并且建立可視化的數據集成系統,實現對數據整合過程的輕松管理,定將是大數據應用最為重要的基礎。
數據統一
受到信息化建設階段性特點制約,以前制定的標準大多是從單一業務出發,解決局部問題,這樣就造成了數據缺少統一規范,數據關聯性不夠,相互孤立。比如,現場勘查信息與案件信息不關聯、案件信息與圖片信息不關聯、案件信息與被盜搶車輛信息不關聯。無法實現案件、人員、現場勘查、痕跡、物品等信息關聯查詢。
公安數據雖然龐大,但卻分散在不同的部門手中,各組織機構間缺少數據的有效管理和打通,造成數據不能有效利用。雖然目前隨著政策和觀念的放開,情況有所改善,但缺少統一的系統,信息難以共享,“信息孤島”仍然存在。公安要談大數據實戰,需要在機制和技術上打通壁壘,統一資源,只有將數據結構、數據字段(包含數據庫字段、結構化后的描述字段等)、用戶等資源做好統一,才能真正形成大數據資源,為以后的數據挖掘、研判分析做出更有效的數據支撐。
目前公安信息化數據庫中匯集有大量的信息數據,但由于以往的數據價值的忽視和處理手段的欠缺導致數據應用簡單,僅僅是對數據的單方面進行解讀應用,沒有對數據進行多種數據源、多途徑以及多維度的串并分析,無法發揮出數據的潛在價值。
在公安眾多應用場景中,往往需要對反饋時間有很強大要求(比如首次入城分析、實時熱力分布情況等),這些應用場景如果超出要求時間,不僅無法提供幫助,反而有可能造成誤導。這就要求對于上億條記錄的檢索、上千張表的碰撞、幾百個小時的視頻分析、以及大量的移動互聯網和社交媒體數據處理等應用,無不對大數據系統的數據分析能力提出更高的要求。所以,不盲目的采用熱門技術,通過針對不同場景,采用不同的數據分析模型和算法,才能更好的解決實戰面臨的數據分析要求。
數據展現
圖像是視覺媒體中一種非常重要的表現形式。在人類能夠直接感知的眾多媒體信息中,視覺媒體是人類最豐富的信息來源。統計表明,人類在感知外界信息的過程中,視覺獲取的信息高達65%。數據信息是一種具有深層次內涵、更易被理解吸收的跨越語種障礙的語言。
在公安的應用場景中,需要在城市數千萬人中發現異常,挖掘關系,呈現規律。要在處理海量的數據時,原本的文字和數字無法呈現的規律,通過圖形的方式展現的方式明顯比其它展現方式更直接,更清晰。所以更加美觀、簡潔、清晰的數據展現方式往往比更大量的數據堆疊要有意義。
數據安全
公安系統中很多數據關系著國家安全和人民生命財產安全,大數據系統作為整合分析者,匯聚有更大體量的敏感數據,所以信息泄露帶來的問題將會是十分嚴重的。因此,大數據在管理上要求要更加嚴格,從單點登錄、PKI認證、數據水印、日志審計等,不論是從底層技術層面、上層認證方式、還是安全管理機制,都要有相對應的提升,才能保證數據安全。
大數據公安業務應用現狀和思路
可以看出大數據在公共安全方面的潛力巨大,同時問題也同樣嚴峻。依靠互聯網、通訊行業這些數據大戶的“委培”,大數據已經日益成熟。它能承載數以千億計的數據量,快速反饋分析結果。能挖掘PB計的數據,發現潛在的規則。我們有HADOOP、SPARK、機器學習等的巨人為基礎,但還必須站在它的肩膀上遠眺。
公安有自己的實際情況,它沒有互聯網數據如此的數據量,也沒有金融、電商行業如此大的峰值吞吐量,但卻有極為復雜的數據維度、數據源和業務應用場景。所以,公安對于大數據應用的需求,并不是要建設一套世界最快的平臺,而是根據數據類型選擇最合適的處理工具,根據用戶業務應用選擇最實用的分析和展示幫助研判人員理清思路,挖掘重點。所以公安大數據具有其特殊性,理應應該是一個“混搭”型模式,不應是從標準的開源社區拿來一套標準架構就可以直接套用的。無論是從數據源的結構化、數據統一化,到核心的大數據運算模型,存儲結構。還是應用層面的數據挖掘、碰撞模型建立、數據展示、數據安審機制。每一個環節都需要從公安的核心業務出發,只有這樣的大數據系統才是公安需要的,能真正幫助公安業務發展的。
正是秉持這一思路,企業一方面投入大量人力深度研究公安業務員和大數據技術,力求公安用戶對于大數據應用的急迫需求,充分結合公安數據特性,從工具的選擇,開源架構的優化,應用的分析模型為核心秉承“最合適的才是最好的”原則,為公安用戶的大數據應用量身定做。另一方面,基于自身對于公安業務的充分理解,國家政策的支持和對市場需求的前瞻,推出公安大數據平臺。
警務實戰的發展必然走向大數據,但大數據并非是完美的終點。大數據不是無所不能,更不能替代干警精英。大數據是我們的耳目、觸手,我們希望的是將大數據與我們的業務直覺完美融合,借助大數據在海量數據間任意遨游,使數據為我們所用,對社會的安定和繁榮發揮其更大的作用。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24