熱線電話:13121318867

登錄
首頁職業發展"大數據"能否連通專利信息"孤島"
"大數據"能否連通專利信息"孤島"
2018-03-17
收藏

"大數據"能否連通專利信息"孤島"

利用一件專利的申請人信息,直接通過工商登記信息關聯,就能夠對不同類型的創新主體進行專利情報分析;利用發明人信息,直接通過人事部門信息關聯,就能從多個角度對創新者進行分析……這種看似遙不可及的專利信息服務,在大數據時代或將成為現實。
    “大數據”(big data)概念在上世紀90年代最初提出時,只是對無法用傳統手段進行抓取、管理和處理的數據的統稱。近年來,隨著技術升級,“大數據”的內涵也發生了變化,并成為信息技術界最熱的概念之一。應用圍繞大數據產生的新技術,高速、大規模的數據交換、互聯,以及從前無法想象的數據處理方式正在成為可能。
    專利文獻以其內容廣博、數量巨大等特點,被人們譽為集科技、法律、經濟信息于一體的科技信息資源。專利信息這一涵蓋各個領域創新的技術寶庫與智慧海洋,如何能夠與大數據概念“聯姻”,誕生更完美的信息服務,產生此前不曾預料的價值呢?
    專利信息現狀 含有寶藏的“孤島”
    自專利制度建立以來,全球的專利文獻經過數百年的積累已經浩如煙海,且近100年人類科學技術突飛猛進,更使專利信息加速增長。我國專利申請總量用了近15年時間達到第一個100萬件,第二個100萬件僅歷時4年零2個月,現在,2012年一年的專利申請就有205萬件。在剛剛過去的8月7日至8月14日這一周內,中國就有4451件發明專利獲得授權,美國有5725件專利獲得授權。越來越多的創新成果正在不停歇地匯入大數據的洪流。
    倉庫大,內容多,好處是多得數不清,缺點則是對內容的分揀、選取、利用都成了“大任務”。目前,世界各國的在線專利文獻檢索服務均已比較成熟。國家知識產權局也建成了專利檢索與服務系統,任何用戶都可以通過專利申請號、授權號、專利名稱、申請人等信息,在中國專利數據庫中進行搜索,其中大部分都可以看到專利說明書等詳情。
    基于傳統數據庫技術與搜索技術,目前的專利數據已可以針對多種著錄項目進行檢索,性能成熟穩定,但在大數據技術下仍可期望有更多進展。上海市知識產權服務中心副主任梁建軍是為專利信息應用大數據技術的倡導者之一,他向本報記者表示,大部分國家都在互聯網上公開各自國家的專利,但這些數據存在著數量巨大、結構異樣、重復率高、更新頻繁的特點,海量信息反而猶如茫茫大海中的許多座含有寶藏的“信息孤島”。
    梁建軍表示,專利文獻的內容以直接公開技術信息及相關法律信息為主,其著錄項目不可能包含所有商業競爭情報分析所需要的信息。著錄項目是顯性信息,其后的大量隱性信息,則需要大數據的支持來獲得。
   大數據化展望 “小時代”期待“大變化”
   大數據會帶來一個什么樣的世界?關于這個“時髦”的話題,商業、科研、信息業都進行了為數不少的探討與設想。我們更關心,大數據會給專利信息帶來什么改變?
    首先,目前已有專利信息的全部著錄項目都會得到利用。大數據最大的特點是“4V”(Volume、Variety、Velocity、Value,即數據體量巨大、數據類型繁多、處理速度快、產生價值大)?!洞髷祿r代》一書的作者舍恩伯格認為,“揀著測、挑著存、采著樣處理”的小數據時代方式已經不合時宜,“要數據全集,不要采樣”。依照這種觀點,不僅專利權人、發明人、摘要這些重要的信息欄目會被重點分析,包括公開(公告)日期、優先權日、申請日、IPC分類號、申請人地址在內的信息也會獲得活力,因為分析它們需要的大量數據參考,在大數據時代將變得輕而易舉。
    梁建軍向記者表示,大數據技術的出現,將使源于各部門的“信息孤島”現象逐漸消失,而且會大大加快信息依存關系的顯現,從而使更有價值的隱性信息浮出水面。例如,企業名稱如果和工商部門企業登記信息關聯,就能夠對不同類型的創新主體進行專利情報的分析;發明人信息如果和公安或者人事部門的信息關聯,就能夠從多個角度對創新者進行分析。
    沿用至今的IPC分類號、洛迦諾分類表等為專利進行功能領域劃分的目錄,也許也會遭遇大的變革。這種單一維度的樹狀分類方式解決了紙件時代大量卷宗的存放和調取問題,但隨著創新技術的跨領域化發展,多維度、智能化的分類方式也許會在大數據的幫助下,對專利信息進行補充。當專利信息接軌大數據,專利信息的價值可能會向產業鏈上下端同時蔓延,新的信息加工和服務模式可以期待,它一定會超越人們的想像。
    梁建軍表示,今后規劃建設的專利信息服務系統,將會是個數據關聯度很高的系統,各類信息之間基本不存在割裂現象。對專利信息的利用和分析,也不再局限于技術、法律、經濟、戰略等,而可能抽象到更加宏觀的人類智力發展規律、地域社會發展變革等高度。
    面對待解之題 “大數據”迎接新考驗
   大數據是實實在在的信息與計算科學,在理念的轉變之外,還需要切實的實踐,才能將其從紙面上挪移到現實中。要為專利信息應用大數據技術,實行大數據化的改造,同樣面臨著不少待解之題。
    首當其沖的是投資者與受益者的關系,大數據需要高度發達的計算中心作為支撐,需要專門的人才領軍項目,自然也需要不菲的投資。放眼全球,專利都具有強烈的國家、政府和公益屬性,專利信息集中在特定的政府部門進行管理,但其大數據化后可開發出很高的公益價值以及可以想見的商業價值。那么,誰來投資?政府一家未必有這樣一筆宏大的預算,可能更應該科學合理地召集、促使產業內的領先企業對專利信息進行大數據化的開發,并設計公正和安全的回報、收益、激勵機制,在兌現開發價值的同時,也保護專利信息大數據化的產品不會被某家商業機構壟斷,而是產生應有的社會效益。
    與此同時,大數據化社會對信息的觀點也會有所變化。英特爾中國研究院首席工程師吳甘沙在評論《大數據時代》一書時指出,目前急需解決的是數據擁有權、隱私權和使用知情權。隨著個人、企業和政府更深地融入數據經濟,數據擁有權成為了覆蓋人類生活和工作每一個角落的基本權利,應該像其他私有財產一樣受到保護。擁有者應該可以隨時了解自己有幾份拷貝數據、這些數據在哪里、誰在使用、產生了多少價值,法律法規也應對這些權利進行界定。專利信息是一個大型的已有數據庫,對其開發會產生許多副產品,這些數據及衍生品的擁有者是誰?相關個人、相關企業、專利管理部門、數據開發商、數據應用商,各占比例幾何,誰有一票否決權?這將會是一個超越專利范疇的社會課題。
    無論如何,大數據的浪潮在向我們涌來,正如梁建軍所感慨:“大數據時代的來臨,將進一步推動信息服務業和知識服務業的發展,我們的政府、企業、科研院所以及中介機構應該緊緊抓住這個歷史性機會,加大對專利文獻和專利信息的傳播和分析利用研究力度,接軌大數據、融入大數據、利用大數據,不斷開發和探索新的信息加工和服務模式,共同推進高技術服務業、知識產權服務業的發展,推動專利創新能力的提高,不斷挖掘和提供最新的競爭情報和智慧信息,用信息和知識共享的機制來消除信息和知識的孤島,助力經濟轉型與發展?!?


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢