熱線電話:13121318867

登錄
首頁精彩閱讀使用R進行統計分析—假設檢驗
使用R進行統計分析—假設檢驗
2016-10-01
收藏

使用R進行統計分析假設檢驗

假設檢驗是統計學中的一種推斷方法,用來判斷兩個樣本或總體間的差異是由于抽樣誤差引起的還是本質差別造成的。R語言中提供了很多假設檢驗函數,如F檢驗,t檢驗和卡方檢驗等等。本篇文章介紹如何使用R語言中的這些函數進行假設檢驗。

二項分布檢驗

假設一個廣告的點擊率為0.02,更換新的廣告創意后1000次曝光獲得了23次點擊,新廣告在點擊率上是否明顯優于老廣告?

H0:新廣告與老廣告效果無差異

H1:新廣告效果優于老廣告

#老廣告點擊率0.02,新廣告1000次廣告曝光獲得23次點擊是否明顯優于老廣告binom.test(x =23,n = 1000,p = 0.02,alternative ="greater",conf.level = 0.95 )

p-value = 0.2778>0.05,在0.95的置信區間下接受原假設H0。新廣告與老廣告在點擊率上沒有顯著差異。

#1000次訪問0.02點擊率下差異顯著的臨界值qbinom(p = 0.95,size = 1000,prob = 0.02)

[1] 28

新廣告在1000次廣告曝光中點擊量需要提升到28次以上才能明顯優于老廣告的效果。

泊松分布檢驗

假設一次市場推廣活動中前一個小時有50人注冊,后一個小時有60人注冊,后一小時的注冊人數是否明顯高于前一小時?

H0:前一小時與后一小時注冊人數無差異

H1:后一小時注冊用戶數量高于前一小時

#上一小時50人注冊,下一小時60人注冊,后一小時是否顯著高于前一小時poisson.test(x = 60,T = 50,alternative ="greater",conf.level = 0.95)

p-value = 0.09227>0.05,在0.95的置信區間下接受原假設H0,后一小時注冊人數與前一小時無差異。

#與上一小時50人注冊差異顯著的臨界值

qpois(0.95,lambda=50)

[1] 62

后一小時的注冊用戶數需要提升到62以上才能明顯高于前一小時的注冊用戶數。

單樣本t檢驗

假設某流量渠道的目標是每日帶來150個咨詢,在過去的一周帶來的咨詢用戶數量分別為229,164,121,137,145,127,123,我們是否能認為該渠道已經達到目標,即每日的平均咨詢量大于150?

這里使用單樣本t檢驗,首先建立假設。

H0:每日平均咨詢量不大于153,未達到目標。

H1:每日平均咨詢量大于153,達到目標。

#將過去一周咨詢用戶數量賦給XX=c(229,164,121,137,155,127,143)#計算過去一周咨詢量的均值mean(X)

[1] 153.7143

#過去一周咨詢用戶數量是否達到目標

t.test(X,alternative ="greater",mu=153,conf.level = 0.95)

p-value = 0.4801>0.05,在0.95的置信區間下接受原假設H0,流量渠道的咨詢量沒有達到目標。

雙樣本t檢驗

假設兩個流量渠道在過去的一周分布為網站帶來咨詢用戶,這兩個流量渠道帶來的咨詢用戶數量是否有顯著差異?

這里使用雙樣本t檢驗,首先建立假設。

H0:兩個流量渠道帶來的咨詢用戶數量沒有顯著差異。

H1:兩個流量渠道帶來的咨詢用戶數量存在有顯著差異。

#流量渠道1帶來的咨詢用戶數量賦值給

XX=c(229,164,121,137,155,127,143)

#流量渠道2帶來的咨詢用戶數量賦值給

YY=c(175,120,187,144,117,184,135)

進行雙樣本t檢驗之前先進行方差檢驗,確定兩組樣本方差是否相同。 H0:兩個總體方差相同 H1:兩個總體方差不同

#方差檢驗,確定兩個流量渠道的咨詢量是否相同

var.test(x = X,y = Y,conf.level =0.95)

p-value = 0.6469>0.05,在0.95的置信區間下接受原假設H0,兩個總體方差相同。進行等方差t檢驗。

#等方差t檢驗,兩個流量渠道帶來的咨詢用戶數量是否有差異

t.test(X,Y,var.equal=TRUE,alternative ="two.sided")

p-value = 0.9125>0.05,接受原假設H0,在0.95的置信區間下兩個流量渠道的咨詢用戶量沒有顯著差異。

成對樣本t檢驗

假設網站對咨詢流程進行了優化并進行了測試,那么改版后的效果是否明顯優于改版前?

這里使用成對t檢驗,首先建立假設。

H0:改版后的效果與改版前無差異

H1:改版后的效果明顯優于改版前

#改版前注冊用戶量賦給before

before=c(229,164,121,137,155,127,143)

#改版后注冊用戶量賦給after

after=c(217,284,155,190,158,170,180)

#改版前的咨詢量是否小于改版后的咨詢量

t.test(before-after,alternative ="less",conf.level = 0.95)

p-value = 0.02362<0.05,拒絕原假設H0,接受備擇假設H1。在0.95的置信區間下改版后的效果明顯優于改版前。

卡方檢驗

假設廣告創意A1315次訪問,65次轉化,轉化率4.94%,廣告創意B939次訪問,54次轉化,轉化率5.75%。廣告創意B的效果是否優于廣告創意A?

這里使用卡方檢驗,首先建立假設。

H0:兩個廣告創意的效果無差異

H1:廣告創意B的效果優于廣告創意A

對源數據近整理,廣告創意A1250次未購買,65次購買,廣告創意B885次未購買,54次購買。以此建立列聯表。

#創建列聯表X=c(1250,885,65,54)

dim(X)=c(2,2)

X

#使用卡方檢驗chisq.test(X,correct =FALSE)

p-value = 0.3978>0.05,在0.95的置信區間下接受原假設H0,兩個廣告創意效果沒有顯著差異。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢