熱線電話:13121318867

登錄
首頁職業發展大數據分析的一把利劍_R語言_數據分析
大數據分析的一把利劍_R語言_數據分析
2014-11-04
收藏
大數據分析的一把利劍_R語言

R語言,我把它稱之為大數據分析的一把利劍。

為什么這么說呢?

      先讓我們看一下,什么是大數據分析?所謂大數據分析,就是以商業目的為驅動,所開展的獲取數據、處理數據、分析數據、展示數據和撰寫數據結構報告的一系列科學過程。而R語言都有相應的方法可以較好地處理和完成數據分析所涉及到的內容。

      接下來,讓我們想想這些問題。

      R語言是什么?為什么要使用R語言?怎么學習R語言?

      第一個問題,R是一種免費的、開源軟件環境與平臺,其初衷是為了統計計算和畫圖。但是,R語言現在能夠做的事情已經遠遠地超出了其初衷,可以在諸多領域進行應用,比方說,數據挖掘、機器學習、社交網絡、生物信息、金融數據分析等。

      第二個問題:是否要使用這個工具,首先得看這個工具能否解決問題,也就是對于數據分析 各個環節中的問題,R語言都能夠很好地勝任;其次,考慮這個工具的成本,R語言是免費開源的,R語言易學好用,并且有著非常多的資源和活躍的社區;最后, 思考工具的性能,R語言在不斷發展的同時,性能得到進一步優化和提升,并且可以和其他編程語言進行混合使用。

      第三個問題:我的建議是“三多”精神,一要多學習,學習是永無止境的。學習R的書籍、學習R的資料,學習R的源代碼、學習R的案例等等;二要多實踐,實踐出真知。結合自己的行業背景,針對自己的問題域,積極地嘗試著使用R語言來分析和解答,通過在不斷實踐中認識和應用R;三要多分享,我為人人,人人為我。擁抱一顆分享的心,給他人便利的時候也是給自己便利。

    最近,Claranet針對企業的云遷移方式進行了一項調查。調查結果表明,超過四分之一的受訪者視ROI為決策因素之一,而79%的受訪者認為 ROI計算并不能真實反映業務優勢。雖然該調查主要針對云遷移,但是由此可以合理推測,大數據遷移的情形也不會有太大差別。這二者均代表著一次未來的技術 飛躍。

誤解5:結果不可保證

    大數據是個未知數。您正在做的就是分析無法估量、難以確定的數字。從本質上來說,大數據是不容易理解或者是抽象的。否則,您也就無需大數據技術了。 因此,企業必須認識到他們無法保證結果的準確性。企業試圖獲得結果和找到假設的支持數據是徒勞無益的。在上述示例中,航空公司可能希望飛機每50萬飛行小 時維護一次,但是如果飛機每20萬飛行小時就從空中墜落的話,航空公司的設想就將毫無意義。

    如果說人們對大數據存在一些誤解,那么,有關大數據的一些關鍵事實則需要不太看好大數據的企業去認真理解。

關鍵事實

關鍵事實1:需要不同技能
    多數觀察家都認同數據科學家短缺這一點。麥肯錫公司預測,到2019年,全球將缺少高達19萬可處理大數據的科學家。原因不難發現。處理大數據項目需要完全不同于處理現有數據倉庫
施的技能。而且它還不僅僅限于數據處理,還要求能夠將數據轉換為可執行的建議。

    “Hadoop 中有一個稱為Map Reduce 的工具。它需要Java 編程技能,而這并不是當今很多數據分析師具有的技能?!盤riestley舉例說到。而事情還不止如此。處理大數據的理想人員還需要了解業務流程、Java和統計知識,甚至還可能需要一些SQL技能。這是個大問題,因此很多人也認為數據科學家的短缺將成為大數據技術采用的一個重要阻礙。

關鍵事實2:明確您的目標

    雖然企業不應當試圖探究確定的結果,但是他們應當明確企業目標,一個需要實現的目標。例
如,大數據可提高績效的途徑之一是收集更加準確的信息,包括個人數據、客戶行為和購買決
策等。

    麥肯錫公司發現,數字之大令人震驚。這家企業咨詢公司聲稱,如果美國醫療產業采用大數據
,全美醫療費用將削減8%。另外,麥肯錫公司提到,通過減少詐騙訴訟和增加稅收,歐洲公共
部門在運行效率方面可節省一千億歐元。

關鍵事實3:人是推動因素

    大數據項目需要有人推動。技術并非關鍵問題。這不是指那些具有上述數據科學家技能的一些人,而是指那些能提出明確目標與需求,并能執行決策的一些人。

    這些人并不需要特殊的管理技能。這些責任可能落在首席財務官(CFO)、首席信息(CIO)\甚至首席執行官(CEO)的肩上,但最終,需要有一個人擔 負此重任。正如Priestley所指出的:“大數據不僅僅是技術挑戰,它還是業務挑戰。企業需要了解這一點。對此,使用模式很重要。而在此方面,企業可 以有很多種模式,并以不同方式進行建模?!?br />
關鍵事實4:不僅僅是數據

    大數據分析有三大要素:數據本身,數據分析,以及結果的呈現。擁有數據本身并沒有實際意義。數據本身就已存在。重要的是如何處理、分析數據并呈現重 要信息,以將數據轉變為重要價值。開展大數據項目需要周密規劃。最好是從小規模起步,先實施單個項目,然后逐步擴展規模。數據采集之后需要進行詳細的結果 分析。

關鍵事實5:大數據涉及所有人

    很多關于大數據的討論都聚焦在大型組織上,對于這些龐大的官僚機構來說,令人窒息的海量數據已經制約了組織的有效運行。很多率先采用大數據技術的組織都屬于這一范疇,不過它們并不是唯一的受益者。

    各類企業都希望獲得評估隱藏數據并歸納模式的技能。有些小型企業需要處理大量工業數據。例如,FormulaOne設計公司的規模不大,但是管理的數據量十分龐大,因此即使是很小的企業也可以通過在日常工作中使用大數據而獲益。

    這些公司可能希望超越Excel進行客戶分析,尋找客戶購買模式。例如,如果您的飯店菜單上曾經有一道特色魚,但后來取消了。那么當這道菜再次出現 在菜單上可供顧客點用的時候,您就可以使用電子郵件通知之前曾經點過這道菜的所有顧客?;蛘?,如果您是一個酒商,您的庫存里有某種葡萄酒正在釀造期,當它 們即將出庫時,您可以提醒這種酒的愛好者。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢