熱線電話:13121318867

登錄
首頁職業發展大數據在食品安全中的應用
大數據在食品安全中的應用
2017-05-24
收藏

大數據在食品安全中的應用

時至今日,科學技術的發展能夠處理大量不同來源的結構化和非結構化數據。這些技術常常被稱作大數據,其開啟了新的研究和應用領域,也將會對當今社會逐漸產生影響力。本文評價了應用在食品安全領域的大數據及其潛在發展趨勢。在世界的各個地方,各國政府激勵源于公共資助研究項目的互聯網大數據發表。對于企業利益相關者如何處理食品安全和提出問題,這項政策迎來了新的發展機遇,這在以前是根本無法實現的。由于大數據新的發展,應用手機作為食品安全檢測設備和利用社交媒體為食品安全問題預警也將成為可能。

一、引言

在全球化進程的影響下,社會企業產生大量的數據,這些數據包括商業,政府,健康保健和各研究學科,比如天然科學、生命科學、工程學、人類學和社會科學。這些大數據越來越可利用化,可以被用來開拓視野,提高決策,并且提高產品和服務的質量。但是,大數據的聚集和加速產生,需要相關數據的有效收集、儲存和處理來戰勝挑戰。大數據的應用趨于多元化,比如來源于亞馬遜網站的推薦系統,可以實時預測流感的爆發。另外還有一些文章研究了大數據潛在的應用。

“大數據”一詞很少應用在食品安全相關領域,主要是因為食品安全數據和信息過于分散,主要集中于食品、健康和農業企業。食品安全領域大數據的應用需要內部操作標準的建立和實施,以及保密性保護。傳統食品安全數據,例如全國調控數據,數量相對有限,雖然在區域之間不能達到和諧,但是具有很好的結構化。為了考察大數據方法如何能夠有利于食品安全,本文作者分析了食品安全工具的應用,發展于不同階段的大數據研究(例如數據收集、數據儲存和轉移、數據分析和數據可視化)。此外,作者分析了某些大數據在食品安全中是否以及如何扮演重要的作用,同時提供了一些范例來探討未來的發展和機會。

二、大數據的定義

關于大數據的的定義有很多種。世界衛生組織使用的定義是:新興應用的快速收集的、復雜的數據,這些數據以不可定量的兆字節,拍字節,甚至澤字節的儲存形式存在。Gartner教授在2012年描述了對于大數據的數據管理挑戰,具有三維特性:大數據具有高容量、高速和高多樣性信息組,同時需要新的處理形式來提高決策,發掘觀點和過程優化。歐委會于2014年發布了相似的定義:3V,即容量、速度和多樣性。大數據指以高速產生的大量的不同字節的數據,其具有大量不同的字節來源。處理今天的大量和實時的數據組需要新的工具和方法,例如強有力的處理器、軟件和運算法則。2015年,De Mauro教授提出大家一致同意的定義:大數據代表具有高容量,高速和多樣性三大特性的信息組,同時需要通過特殊的技術和分析方法來使其轉換為價值所在。

三、食品安全中大數據應用

最近世界衛生組織提出采用大數據方法來支持食品安全中面臨的決策問題,產生了一個食品安全平臺“FOSCOLLAB”,對來源于不同的學科進行整合。在這個平臺中,來源于多個企業中的結構化和非結構化數據,例如農業、食品、公共衛生和經濟指數被整合,通過專用設施,能夠被使用者所應用。

(一)食品安全的數據收集

通過包含和產生食品安全有效信息,來區別不同類型來源,例如(在線)數據庫、互聯網、組學分析、手機和社交媒體。

1. 在線數據庫

為了監測食品中有害成分的數據,產生了許多數據庫。世界衛生組織于2015年發布的全球環境監測系統數據庫包含數以萬計的全球監測數據入口??紤]到其入口相對數量多,因此數據以一種邏輯化方式所結構化,并且容易獲取。關于化學試劑性質信息,微生物生長條件和天氣報告,在食品安全研究中占有重要地位。也可以使用模型來預測某些有害成分的存在,比如小麥中的真菌毒素。這些天氣狀況報告包含許多高速產生的數據,這些數據被收集在農業和供應鏈。不僅結構化數據庫會收集食品安全事件,而且也可以通過國際食品安全權威機構的網站和媒體報道來查看。而后者的數據來源是非結構化的,并且分散在網絡中,很難獲取。一個相似的例子是食品污染物突發事件的登記(通過疾控中心)。這些事件也可以在網絡和社交媒體中找到。

2. 互聯網

因為互聯網包含大量的信息來源,可以通過開發互聯網來輔助風險經理人和風險技術顧問應對食品安全問題。開發網絡信息采集系統用于在互聯網上查詢與食品安全相關的論文報告。這種系統的一個典型例子是MedISys,它屬于歐委會聯合研究中心開發的歐洲媒體監測系統。

3. 在線功能基因組學數據目錄

“組學”一詞覆蓋許多學科,包括基因組學(研究核苷酸變異對基因的影響)、轉錄組學(mRNA表達)、代謝組學(代謝物水平)和蛋白組學(多肽和蛋白質水平)。為化學安全所開發的基于毒理基因組學的預測實驗的主要方法,尤其是為了達到鑒定危險物的目的,包含大規模的基因組學數據庫,這些數據庫采集于細胞或動物的有毒物質的暴露。毒理基因組學的目的是闡明有毒物質表達的分子機制和分子表達類型(比如分子生物標記),同時能夠使用“基于動物”和體外(細胞)模型來預測體外和體內毒性。

4. 手機

使用手機變得越來越廣泛,新的應用快速發展,包括食品安全和健康相關的應用。報道顯示聯合使用智能手機和便攜式設備可以監測 (1)水質中汞污染,(2)啤酒中赭曲霉毒素A污染,(3)食品中多種過敏原污染,以及(4)水質和食品中微生物(大腸桿菌)污染。在手機上收集得到的數據不僅可以通過無線連接個人計算機,而且能夠轉移到數據云或其他數據中心。

(二)數據儲存和轉移

通常來講,通過數據管理系統能夠達到數據儲存,例如MySQL, Oracle和PostgreSQL。但是,這些系統不足以用來支持大數據處理。對于大數據而言,需要由比傳統系統所能提供的更快的速度、更好的機動性和可實現性。因此,下一代數據庫會發展非關聯的,開放源模式和水平可伸縮性,也就是NoSQL。這些系統很好例子有MongoDB, Cassandra和HBase等等。

(三)數據分析

在NoSQL中,隨著數據儲存和轉移到處理單元之后,接下來就是數據分析。使用最廣泛的大數據分析方法分為以下兩大類::(1)推薦系統;(2)機器學習。

(四)可視化

不同的可視化工具用來分析和總結大數據,這些工具有利有弊。最常見的是R和Cicos. R,這是一種通過使用在數據中的開放源程序語言,來可視化和分析數據的工具,并提供圖功能和網絡圖功能。Circos允許在循環布局中可視化數據,同時開發目標物和位置之間的關系。該軟件成為了可視化染色體的標準。對于商業可視化軟件而言,不需要編程技能,IBM公司開發的在線可視化處理工具 Many Eyes和Tableau都是很好的選擇。

四、食品安全大數據實例

(一)農業鏈和食品供應鏈

在農業鏈,大數據可以通過有關環境因素的鏈接信息來預測病原體或污染物存在。例如,通過監測田間作物條件,可以達到在進入食品鏈之前,鑒定黃曲霉毒素污染增加的面積。在另一研究中,研究者以歐洲西北部的小麥為對象,通過使用大量的模型和數據庫(包括天氣數據),開發出定量模型,從而預測小麥真菌毒素的污染。

(二)突發事件和來源鑒定

在食品安全性突發事件產生過程中,大量的樣品被收集和分析,產生大量的數據和信息,這些數據和信息被用來鑒定突發事件的來源??焖俸Y選病原體基因技術(全集因序列和下代序列)的發展,導致專一基因信息的收集和病原株或亞型的出現。例如,2011年,在德國發生的病原體“腸出血性大腸桿菌”事件,在不同面積,細菌存在的信息被收集到。健康個體的家能夠用來篩選庇護病原體,通過監測每個家庭來篩選二級感染。在初級階段,這些監測信息幫助檢測問題,允許及時地提供防護性措施,最終阻止突發事件的發生。

(三)鑒定突發事件采用可選擇性數據來源

除了基因信息,其他因素也用來建立污染來源。2011年,Gardy教授等學者從肺結核突發事件中得出結論:基因類型和單獨聯系溯源不能夠確切地獲取突發事件的真正動力學。作者采用社會環境信息與全基因序列結合,來檢測突發事件爆發的來源和原因。雖然數據樣本不足夠大,但是通過應用社會網絡,數據的多樣性大大增加。

五、食品安全大數據的未來

在歐洲,歐委會發布了一項大數據策略,用來支持數據驅使化的經濟發展。他們支持開放式數據獲取,例如,免費在線獲取歐盟資助項目的研究結果,包括科學論文和研究數據。這些歐盟資助項目包含 (1)發展中國家的作物監測,(2)全部產品生命周期監測,(3)提高產品開發過程的效率和質量。并且歐洲各國政府,例如荷蘭政府激勵公共-私人項目來開發大數據潛力。在美國,奧巴馬政府發布了“大數據研究和開發倡議”,以便更大程度的提高可獲取,組織和收集發現大量數字數據的工具和技術。這項倡議增加了政府支持,加速了聯邦機構從大量復雜數據中提取有效數據的能力。同時也鼓勵私營公司、學術機構、當地政府和基金之間關于新大數據項目的合作,比如2013年發布的“數據-知識-行動”項目。

六、結論

在全球范圍內,隨著大量數據的產生,這些數據與食品安全直接或者間接關聯。當前,在食品安全大數據領域,只開發出有限數量的方法。源于互聯網,從公共資助研究項目中獲得數據的發展趨勢,對處理食品安全的利益相關者來說,開啟了新的機遇。尤其是在食品安全監測中,手機、高級溯源系統和社交媒體的使用,需要比以前具有更多大數據特點的工具和基礎設施。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢