熱線電話:13121318867

登錄
首頁精彩閱讀數據分析方法
數據分析方法
2014-09-26
收藏

數據分析方法

數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,將它們加以匯總和理解并消化,以求最大化地開發數據的功能,發揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。數據也稱觀測值,是實驗、測量、觀察、調查等的結果,常以數量的形式給出。

數據是事實,也稱觀測值,是實驗、測量、觀察、調查等的結果,常以數量的形式給出。數據分析的目的是把隱沒在一大批看來雜亂無章的數據中的信息集中、萃取和提煉出來,以找出所研究對象的內在規律。在實用中,數據分析可幫助人們作出判斷,以便采取適當行動。數據分析是組織有目的地收集數據、分析數據,使之成為信息的過程。這一過程是質量管理體系的支持過程。在產品的整個生命周期。(CDA注冊數據分析師協會)
     具體方法
數據分析有極廣泛的應用范圍。典型的數據分析可能包含以下三個步:
1、探索性數據分析:當數據剛取得時,可能雜亂無章,看不出規律,通過作圖、造表、用各種形式的方程擬合,
計算某些特征量等手段探索規律性的可能形式,即往什么方向和用何種方式去尋找和揭示隱含在數據中的規律性。
2、模型選定分析,在探索性分析的基礎上提出一類或幾類可能的模型,然后通過進一步的分析從中挑選一定的模型。
3、推斷分析:通常使用數理統計方法對所定模型或估計的可靠程度和精確程度作出推斷。
分析方法
數據分析方法-【列表法】
將實驗數據按一定規律用列表方式表達出來是記錄和處理實驗數據最常用的方法。表格的設計要求對應關系清楚、簡單明了、有利于發現相關量之間的物理關系;此外還要求在標題欄中注明物理量名稱、符號、數量級和單位等;根據需要還可以列出除原始數據以外的計算欄目和統計欄目等。最后還要求寫明表格名稱、主要測量儀器的型號、量程和準確度等級、有關環境條件參數如溫度、濕度等。
數據分析方法-【作圖法】
作圖法可以最醒目地表達物理量間的變化關系。
從圖線上還可以簡便求出實驗需要的某些結果(如直線的斜率和截距值等),讀出沒有進行觀測的對應點(內插法)或在一定條件下從圖線的延伸部分讀到測量范圍以外的對應點(外推法)。
此外,還可以把某些復雜的函數關系,通過一定的變換用直線圖表示出來。例如半導體熱敏電阻的電阻與溫度關系為,取對數后得到,若用半對數坐標紙,以lgR為縱軸,以1/T為橫軸畫圖,則為一條直線。
數據分析方法-【數據分析主要包含】
1. 簡單數學運算(Simple Math)
2. 統計(Statistics)
3. 快速傅里葉變換(FFT)
4. 平滑和濾波(Smoothing and Filtering)
5.基線和峰值分析(Baseline and Peak Analysis)
數據來源
1、搜索引擎蜘蛛抓取數據;
2、網站IP、PV等基本數據;采用的分析方法如下:
1、描述性統計分析
包括樣本基本資料的描述,作各變量的次數分配及百分比分析,以了解樣本的分布情況。此外,以平均數和標準差來描述市場導向、競爭優勢、組織績效等各個構面,以了解樣本企業的管理人員對這些相關變量的感知,并利用t檢驗及相關分析對背景變量所造成的影響做檢驗。
2、Cronbach’a信度系數分析
信度是指測驗結果的一致性、穩定性及可靠性,一般多以內部一致性(consistency)來加以表示該測驗信度的高低。
信度系數愈高即表示該測驗的結果愈一致、穩定與可靠。針對各研究變量的衡量題項進行Cronbach’a信度分析,
以了解衡量構面的內部一致性。一般來說,Cronbach’a僅大于0.7為高信度,低于0.35為低信度(Cuieford,1965),
0.5為最低可以接受的信度水準(Nunnally,1978)。
3、探索性因素分析(exploratory factor analysis)和驗證性因素分析(confirmatory factor analysis)
用以測試各構面衡量題項的聚合效度(convergent validity)與區別效度(discriminant validity)。
因為僅有信度是不夠的,可信度高的測量,可能是完全無效或是某些程度上無效。所以我們必須對效度進行檢驗。
效度是指工具是否能測出在設計時想測出的結果。收斂效度的檢驗根據各個項目和所衡量的概念的因素的負荷量來決定;而區別效度的檢驗是根據檢驗性因素分析計算理論上相關概念的相關系數,檢定相關系數的95%信賴區間是否包含1.0,若不包含1.0,則可確認為具有區別效度(Anderson,1987)。
4、結構方程模型分析(structural equations modeling)
由于結構方程模型結合了因素分析(factor analysis)和路徑分析(path analysis),并納入計量經濟學的聯立方程式,可同時處理多個因變量,容許自變量和因變量含測量誤差,可同時估計因子結構和因子關系。容許更大彈性的測量模型,可估計整個模型的擬合程度(Bollen和Long,1993),因而適用于整體模型的因果關系。在模型參數的估計上,采用最大似然估計法(Maximum Likelihood,ML);在模型的適合度檢驗上,以基本的擬合標準(preliminary fit criteria)、整體模型擬合優度(overall model fit)以及模型內在結構擬合優度(fit of internal structure of model)(Bagozzi和Yi,1988)三個方面的各項指標作為判定的標準。在評價整體模式適配標準方面,本研究采用x2(卡方)/df(自由度)值、擬合優度指數(goodness.of.f:iJt.in.dex,GFI)、平均殘差平方根(root—mean.square:residual,RMSR)、近似誤差均方根(root-mean—square-error-of-approximation,RMSEA)等指標;模型內在結構擬合優度則參考Bagozzi和Yi(1988)的標準,考察所估計的參數是否都到達顯著水平。
3、網站的HTTP響應時間數據;
4、網站流量來源數據。
     CDA數據分析師協會,舉辦的CDA數據分析師培訓應對現實工作中遇到的種種問題,致力于引領大數據時代潮流。能夠實現以下內容。
數據分析過程的主要活動由識別信息需求、收集數據、分析數據、評價并改進數據分析的有效性組成。
識別需求
識別信息需求是確保數據分析過程有效性的首要條件,可以為收集數據、分析數據提供清晰的目標。
識別信息需求是管理者的職責管理者應根據決策和過程控制的需求,提出對信息的需求。就過程控制而言,
管理者應識別需求要利用那些信息支持評審過程輸入、過程輸出、資源配置的合理性、過程活動的優化方案和過程異常變異的發現。
收集數據
有目的的收集數據,是確保數據分析過程有效的基礎。組織需要對收集數據的內容、渠道、方法進行策劃。策劃時應考慮
數據分析示意圖
①將識別的需求轉化為具體的要求,如評價供方時,需要收集的數據可能包括其過程能力、測量系統不確定度等相關數據;
②明確由誰在何時何處,通過何種渠道和方法收集數據;
③記錄表應便于使用; 
④采取有效措施,防止數據丟失和虛假數據對系統的干擾。
采用的分析方法如下:(CDA注冊數據分析師協會)
1、描述性統計分析
包括樣本基本資料的描述,作各變量的次數分配及百分比分析,以了解樣本的分布情況。此外,以平均數和標準差來描述市場導向、競爭優勢、組織績效等各個構面,以了解樣本企業的管理人員對這些相關變量的感知,并利用t檢驗及相關分析對背景變量所造成的影響做檢驗。
2、Cronbach’a信度系數分析
信度是指測驗結果的一致性、穩定性及可靠性,一般多以內部一致性(consistency)來加以表示該測驗信度的高低。
信度系數愈高即表示該測驗的結果愈一致、穩定與可靠。針對各研究變量的衡量題項進行Cronbach’a信度分析,以了解衡量構面的內部一致性。一般來說,Cronbach’a僅大于0.7為高信度,低于0.35為低信度(Cuieford,1965),0.5為最低可以接受的信度水準(Nunnally,1978)。
3、探索性因素分析(exploratory factor analysis)和驗證性因素分析(confirmatory factor analysis)
用以測試各構面衡量題項的聚合效度(convergent validity)與區別效度(discriminant validity)。因為僅有信度是不夠的,可信度高的測量,可能是完全無效或是某些程度上無效。所以我們必須對效度進行檢驗。效度是指工具是否能測出在設計時想測出的結果。收斂效度的檢驗根據各個項目和所衡量的概念的因素的負荷量來決定;而區別效度的檢驗是根據檢驗性因素分析計算理論上相關概念的相關系數,
檢定相關系數的95%信賴區間是否包含1.0,若不包含1.0,則可確認為具有區別效度(Anderson,1987)。
4、結構方程模型分析(structural equations modeling)
由于結構方程模型結合了因素分析(factor analysis)和路徑分析(path analysis),并納入計量經濟學的聯立方程式,可同時處理多個因變量,容許自變量和因變量含測量誤差,可同時估計因子結構和因子關系。容許更大彈性的測量模型,可估計整個模型的擬合程度(Bollen和Long,1993),因而適用于整體模型的因果關系。在模型參數的估計上,采用最大似然估計法(Maximum Likelihood,ML);在模型的適合度檢驗上,以基本的擬合標準(preliminary fit criteria)、整體模型擬合優度(overall model fit)以及模型內在結構擬合優度(fit of internal structure of model)(Bagozzi和Yi,1988)三個方面的各項指標作為判定的標準。在評價整體模式適配標準方面,本研究采用x2(卡方)/df(自由度)值、擬合優度指數(goodness.of.f:iJt.in.dex,GFI)、平均殘差平方根(root—mean.square:residual,RMSR)、近似誤差均方根(root-mean—square-error-of-approximation,RMSEA)等指標;模型內在結構擬合優度則參考Bagozzi和Yi(1988)的標準,考察所估計的參數是否都到達顯著水平。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢