
五大商業分析技術趨勢及使用方式(1)
目前,趨勢中心對如何應對分析挑戰的關注力度并不亞于他們考慮在新商業視角中如何充分利用機遇的力度。例如,隨著越來越多的公司開始不得不面對海量數據以及考慮如何利用這些數據,管理與分析大型不同數據集的技術開始出現。提前分析成本與性能趨勢意味著公司能夠提出比以前更為復雜的問題,提供更為有用的信息以幫助他們運營業務。
在采訪中,首席信息官們總結出了5大影響他們進行分析的IT趨勢。它們分別為:大數據的增長、快速處理技術、IT商品的成本下降、移動設備的普及和社交媒體的增長。
1. 大數據
大數據指非常龐大的數據集,尤其是那些沒有被整齊的組織起來無法適應傳統數據倉庫的數據集。網絡蜘蛛數據、社交媒體反饋和服務器日志,以及來自供應鏈、行業、周邊環境與監視傳感器的數據都使得公司的數據變得比以往越來越復雜。
盡管并不是每個公司都需要處理大型、非結構型數據集的技術。Verisk Analytics公司首席信息官Perry Rotella認為所有的首席信息官都應當關注大數據分析工具。Verisk幫助金融公司評估風險,與保險公司共同防范保險詐騙,其在2010年的營收超過了10億美元。
Rotella認為,技術領導者對此應當采取的態度是,數據越多越好,歡迎數據的大幅增長。Rotella的工作是預先尋找事物間的聯系與模型。
HMS公司首席信息官Cynthia Nustad認為,大數據呈現為一種“爆炸性”增長趨勢。HMS公司的業務包括幫助控制聯邦醫療保險(Medicare)和醫療補助(Medicaid)項目成本和私有云服務。其客戶包括40多個州的健康與人類服務項目和130多個醫療補助管理計劃。HMS通過阻止錯誤支付在2010年幫助其客戶挽回了18億美元的損失,節約了數十億美元。Nustad稱:“我們正在收集并追蹤大量素材,包括結構性與非結構性數據,因為你并不是總是知道你將在其中尋找什么東西?!?/span>
大數據技術中談論最多的一項技術是Hadoop。該技術為開源分布式數據處理平臺,最初是為編輯網絡搜索索引等任務開發的。Hadoop為多個“非關系型(NoSQL)”技術(其包括CouchDB 和 MongoDB)中的一種,其通過特殊的方式組織網絡級數據。
Hadoop可將數據的子集合分配給成百上千臺服務器的處理,每臺服務器匯報的結果都將被一個主作業調度程序整理,因此其具有處理拍字節級數據的能力。Hadoop既能夠用于分析前的數據準備,也能夠作為一種分析工具。沒有數千臺空閑服務器的公司可以從亞馬遜等云廠商那里購買Hadoop實例的按需訪問。
Nustad稱,盡管并不是為了其大型的聯邦醫療保險和醫療補助索賠數據庫,但是HMS正在探索NoSQL技術的使用。其包括了結構性數據,并且能夠被傳統的數據倉庫技術所處理。她稱,在回答什么樣的關系型技術是經實踐證明最好用的解決方案時,從傳統關系型數據庫管理出發是并不明智。不過,Nustad認為Hadoop正在防止欺詐與浪費分析上發揮著重要作用,并且具備分析以各種格式上報的病人看病記錄的潛力。
在采訪中,那些體驗過Hadoop的受訪首席信息官們,包括Rotella和Shopzilla 公司首席信息官Jody Mulkey在內都在將數據服務作為公司一項業務的公司中任職。
Mulkey稱:“我們正在使用Hadoop做那些以往使用數據倉庫做的事情。更重要的是,我們獲得了以前從未用過的切實有用的分析技術?!崩?,作為一家比較購買網站,Shopzilla每天會積累數太字節的數據。他稱:“以前,我們必須要對數據進行采樣并對數據進行歸類。在處理海量數據時,這一工作量非常繁重?!弊詮牟捎昧?a href='/map/hadoop/' style='color:#000;font-size:inherit;'>Hadoop,Shopzilla能夠分析原始數據,跳過許多中間環節。
Good Samaritan醫院是一家位于印第安納州西南的社區醫院,其處于另一種類型。該醫院的首席信息官Chuck Christian稱:“我們并沒有我認為是大數據的東西?!北M管如此,管理規定要求促使其存儲整如龐大的電子醫療記錄等全新的數據類型。他稱,這無疑要求他們要能夠從數據中收集醫療保健品質信息。不過,這可能將在地區或國家醫療保健協會中實現,而不是在他們這種單個醫院中實現。因此,Christian未必會對這種新技術進行投資。
Island One Resorts公司首席信息官John Ternent稱,其所面臨的分析挑戰取決于大數據中的“大”還是“數據”。不過,目前他正在謹慎地考慮在云上使用Hadoop實例,以作為一種經濟的方式分析復雜的抵押貸款組合。目前公司正在管理著佛羅里達州內的8處分時度假村。他稱:“這種解決方案有可能解決我們目前正遇到的實際問題?!?/span>
2.商業分析速度加快
肯塔基大學首席信息官Vince Kellen認為,大數據技術只是快速分析這一大趨勢中的一個元素。他稱:“我們期待的是一種更為先進的海量數據分析方法?!迸c更為快速地分析數據相比,數據的大小并不重要,“因為你想讓這一過程快速完成”。
由于目前的計算能夠在內存中處理更多的數據,因此與在硬盤中搜索數據相比,其計算出結果的速度要更快。即使你僅處理數G數據,但情況依然與此。
盡管經過數十年的發展,通過緩存頻繁訪問的數據,數據庫性能提升了許多。在加載整個大型數據集至服務器或服務器集群的內存時,這一技術變得更加實用,此時硬盤只是作為備份。由于從旋轉的磁盤中檢索數據是一個機械過程,因此與在內存中處理數據相比,其速度要慢許多。
Rotella稱,他現在幾秒中進行的分析在五年前需要花上一個晚上。Rotella的公司主要是對大型數據集進行前瞻性分析,這經常涉及查詢、尋找模型、下次查詢前的調整。在分析速度方面,查詢完成時間非常重要。他稱:“以前,運行時間比建模時間要長,但是現在建模時間要比運行時間長?!?/span>
列式數據庫服務器改變了關系型數據庫的傳統行與列結構,解決了另一些性能需求。查詢僅訪問有用的列,而不是讀取整個記錄和選取可選列,這極大地提高了組織或測量關鍵列的應用的性能。
Ternent警告稱,列式數據庫的性能優勢需要配合正確的應用和查詢設計。他稱:“為了進行區別,你必須以適當的方式問它適當的問題?!贝舜送瑫r,他還指出,列式數據庫實際上僅對處理超過500G字節數據的應用有意義。他稱:“在讓列式數據庫發揮作用之前,你必須收集一規模的數據,因為它依賴一定水平的重復提升效率?!?/span>
保險與金融服務巨頭John Hancock公司的首席信息官Allan Hackney稱,為了提高分析性能,硬件也需要進行提升,如增加GPU芯片,其與游戲系統中用到的圖形處理器相同。他稱:“可視化需用到的計算方法與統計分析中用到的計算方法非常相似。與普通的PC和服務器處理器相比,圖形處理器的計算速度要快數百倍。我們的分析人員非常喜歡這一設備?!?/span>
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25