熱線電話:13121318867

登錄
首頁精彩閱讀數據模型多了,應該怎么管
數據模型多了,應該怎么管
2016-11-22
收藏

數據模型多了,應該怎么管

隨著近年來大數據挖掘概念的興起,數據分析建模的思想已經深入人心,于是會建模、能建模的人也就越來越多。他們可能是資深大拿,分析建模、結果解讀手到擒來全搞定,但也可能是專業的“調包俠”,分析工具包拿來就用,有效沒效有個結果再說??傊?,在各路專家光臨之后,企業中的模型越來越多,接下來我們會面臨什么情況呢?

銷售經理拿著數據專家小王新跑出來的營銷名單開始犯愁,模型新上線時效果確實不錯,營銷成功率大幅提升,但6個月過去了,營銷名單的質量有所下滑,銷售人員也開始質疑,銷售經理拿著名單去找小王,小王說這是數據挖掘模型出來的結果,不會有錯的……

技術部門的小李最近有點叫苦不迭,小王做精準營銷模型催著要提數,小趙做客戶流失預警模型也催著要提數,連公司前臺小周也在要員工數據分析哪個星座的愛加班,總之公司的各路人馬都在找技術部門要數,小李本來數據運行壓力就大這下更忙不過來了,他也搞不清楚怎么一下冒出來這么多挖掘請求……

公司領導老吳眼看著公司業績在數據分析的幫助下節節上升,心情大好。他想要了解目前公司到底做了多少模型,不調查不知道,一調查就犯了難。各個部門都在分別做模型,營銷部門、風險部門、營運部門都在做,有些模型部署在公司系統上,有些模型部門在部門內部。這些模型中有些是重復的,浪費了公司大量的計算資源;有些模型已經跑了兩年多沒人管了,當初負責的人已經離職了,目前這個模型誰也說不清楚,當初建模的文檔也早已不知道丟到哪兒了。當然也有很多模型存在個人電腦里……

以上問題總結下來,就是模型管理混亂,缺乏完整的模型管理流程和制度,造成了不能及時滿足業務部門的需求;數據管理混亂,模型數據不能共享;模型文檔管理混亂,不能滿足管理或監管的要求。

因此,變革的時候又來了!進入大數據時代,變革就是來得這么措不及防。模型工廠已經誕生,通俗講就是生產模型的工廠,在銀行業也把它叫為“模型實驗室”,它的建設包括管理規范、運營團隊、數據基礎、分析模型、系統平臺五大部分。它的范圍可大可小,可以是企業層面,也可以部門層面,總之,它的誕生就是為了保障模型管理的效率與質量。

管理規范:包括工作流程、數據質量管理、權限管理、知識管理等。標準化工作流程與模板,保證模型的全生命周期管理。以下是完整的模型全生命周期管理流程,不只是到模型上線部署就結束了,后續的模型持續監控、驗證也是必不可少的,一個預測能力下降的模型可能會給決策工作帶來負面影響。

模型監控是指對模型自變量的監控,需要與建模時的數據進行對比分析,去看看變量的結構是否穩定,是否與當初建模時已經發生了變化,常用的統計指標有變量穩定性指數,轉移矩陣及SVD等。

模型驗證是指對模型預測準確性的判斷,常用的驗證指標模型穩定性指數、KS統計量、CAP曲線和AR值、IV值、二項檢驗與卡方檢驗等。

冠軍模型和挑戰模型是對模型效果的一個輔助監控手段。模型版本記錄了模型演變歷史,歷史模型也是重要的模型資產。

知識管理是指對模型建設過程中的經驗總結和知識積累,在模型開發運維過程中需要做好文檔管理工作,常用的分析方法、工具、代碼都可以進入知識庫,有助于技能傳承和人才培養。

運營團隊:模型工廠的角色通常至少需要包括業務分析、數據管理、模型開發和模型驗證四個角色。四個角色有不同的技能要求,承擔不同的工作職責,需要分別制訂不同的職業發展路徑。在銀行業,銀監會要求模型開發和模型驗證必須由不同的團隊來執行。

數據基礎:模型工廠的數據基礎一般是數據倉庫數據集市,也可以直接來自于前端業務系統。歷史數據的長短、品質和覆蓋面決定了模型好壞與估算的精確度。數據基礎的建設需要分目標、分主題,同時需要盡可能考慮公共數據的建設,最大化數據成果的共享。為不同角色的用戶開放不同的數據權限,建立數據管控機制,防止數據濫用,同時發揮前臺人員主觀能動性,避免給數據部門帶來壓力。

分析模型:綜合考慮企業的戰略目標、行業熱點、風險導向、監管要求,制定企業的模型應用體系,然后以見效的速度和需求的緊迫性兩個角度來決定模型開發的路徑。針對同一個建模需求,可能可以建立不同的模型,冠軍模型和挑戰模型并存。在建模過程中注重建模數據的有效性,建模過程的科學性,模型結果的可解釋性。

系統平臺:系統平臺是模型工廠的技術支撐,需要軟硬件的有效結合。系統平臺需要包括以下功能:數據管理、分析建模、報表展現、模型管理、權限管理、流程管理、文檔管理,除此之外還需要支持復雜算法開發、數據可視化開發、移動端處理等個性化要求。建設系統平臺需要長遠規劃,建設過程中需要綜合考慮易用性、穩定性、可擴展性等。

大數據分析如火如荼的今天,做好一個模型并不難,難的是通過模型提高企業的綜合管理水平。在您的企業中或許已經多少有了模型工廠的影子,但稍微哪點做得不好,就容易遇上本文開篇的那些問題,希望本文能給您帶來啟發與幫助。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢