熱線電話:13121318867

登錄
首頁精彩閱讀R語言-統計學 描述性統計
R語言-統計學 描述性統計
2018-02-26
收藏

R語言-統計學 描述性統計

描述定量數據的數值方法:中心趨勢度量   變異的度量   相對位置的度量。

1.中心趨勢度量 : 算數平均 中位數   眾數

1.1  在R中計算平均數的函數  mean( )
常規的mean() 函數用法                
mean(x, trim = 0, na.rm = FALSE, ...) 
參數說明: x 對象名稱
trim  過濾掉異常值 ,按照距離平均值的遠近距離排除,如對象中含有10個數據,排除最高和最低值,trim=0.2
na.rm  默認為F   表示是否計入空值
實例1: 做一個稍微復雜點的操作,用r做數據透視表并把結果轉換為matrix ,對行列求和。(僅娛樂,無實用價值)

         demo <- mtcars[1:6,] # 調用R自帶函數集,并去前6行
         toushi <- aggregate(mtcars[,5:6] ,by = list(cyl = mtcars$cyl),sum) # 數據透視表求和
         toushi <- as.matrix(toushi)  # 將結果的數據框轉化成矩陣
         #(toushi <- apply(toushi,c(1,2),sum))
         (rowSums(toushi))  # 行求和
         (colSums(toushi))  # 列求和
         toushi <- rbind(toushi,rowSums(toushi))  #將行求和結果并入最后一行
         toushi <- cbind(toushi,colSums(toushi))  #將列求和結果并入最后一列
  1.2 中位數和眾數 
        對于偏度極大的數據集,中位數能更好的描述數據分布的中心。
       很少用眾數作為數據數據趨勢的度量,只有當對y出現的相對頻率感興趣時,才會考慮到眾數。
       R實現中位數  : 
        median(x, na.rm = FALSE)
       R中沒有直接插找眾數的命令
       which.max(table(x))
2.變異的度量 : 極差  方差  標準差
    2.1 .極差 = max()- min()
    2.2  方差標準差
       對一個有n個測量值的有限總體來說,方差計算公式的分母為n。關于樣本方差和總體方差分母的差異原因,可自行百度搜索。
       R語言計算方差的函數: var(x,)
       w<-c(75.0,64.0,47.4,66.9,62.2,62.2,58.7,63,5,66.6,64.0,57.0,69.0,56.9,50.0,72.0)
       var(w)
       # 附加指數點:標準差的兩個有用法則:經驗法則 和 切比雪夫法則,共同說明一個問題,對于任意大于1的正數k,至少有(1-1/k^2)的測試值落在平均值的k個標準值范圍內。
3.變異的度量 : 百分位數  Z得分
 3.1 .最常見的四分位數(一般從大到?。?br />       quantile(x, probs = seq(0, 1, 0.25), na.rm = FALSE,names = TRUE, type = 7, ...)

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢