R語言之隨機數與抽樣模擬篇 -CDA數據分析師官網

熱線電話：13121318867

登錄

首頁精彩閱讀R語言之隨機數與抽樣模擬篇

R語言之隨機數與抽樣模擬篇

2017-12-06

收藏

R語言之隨機數與抽樣模擬篇

R語言生成均勻分布隨機數的函數是runif（）

句法是：runif(n,min=0,max=1) n表示生成的隨機數數量，min表示均勻分布的下限，max表示均勻分布的上限；若省略參數min、max,則默認生成[0,1]上的均勻分布隨機數。

例1：

> runif(5,0,1) # 生成5個[0,1]的均勻分布的隨機數
[1] 0.5993 0.7391 0.2617 0.5077 0.7199

> runif(5) # 默認生成5個[0,1]上的均勻分布隨機數
[1] 0.2784 0.7755 0.4107 0.8392 0.7455

例2

隨機產生100個均勻分布隨機數，作其概率直方圖，再添加均勻分布的密度函數線，程序如下：

> x=runif(100)
> hist(x,prob=T,col=gray(.9),main="uniform on [0,1]")
> curve(dunif(x,0,1),add=T) #添加均勻分布的密度函數線

3.1.2 正態分布隨機數

正態分布隨機數的生成函數是 rnorm（）

句法是：rnorm（n,mean=0,sd=1）其中n表示生成的隨機數數量，mean是正態分布的均值，默認為0，sd是正態分布的標準差，默認時為1;

例:

隨機產生100個正態分布隨機數，作其概率直方圖，再添加正態分布的密度函數線

> x=rnorm(100)
> hist(x,prob=T,main="normal mu=0,sigma=1")
> curve(dnorm(x),add=T)

3.1.3 二項分布隨機數

二項分布是指n次獨立重復貝努力試驗成功的次數的分布，每次貝努力試驗的結果只有兩個，成功和失敗，記成功的概率為p

生成二項分布隨機數的函數是：rbinom（）

句法是：rbinom(n,size,prob) n表示生成的隨機數數量，size表示進行貝努力試驗的次數，prob表示一次貝努力試驗成功的概率

例：

產生100個n為10,15,50，概率p為0.25的二項分布隨機數：

> par(mfrow=c(1,3))
> p=0.25
> for( n in c(10,20,50))
{ x=rbinom(100,n,p)
hist(x,prob=T,main=paste("n =",n))
xvals=0:n
points(xvals,dbinom(xvals,n,p),type="h",lwd=3)
}
> par(mfrow=c(1,1))

3.1.4 指數分布隨機數

R生成指數分布隨機數的函數是:rexp（）

其句法是：rexp（n,lamda=1） n表示生成的隨機數個數，lamda=1/mean

例：

>x=rexp(100,1/10) # 生成100個均值為10的指數分布隨機數
>hist(x,prob=T,col=gray(0.9),main=“均值為10的指數分布隨機數”)
>curve(dexp(x,1/10),add=T) ＃添加指數分布密度線

3.1.5 常見的分布函數

產生分布的隨機數，只需要在相應的分布前加r就行

表 3-1 常見分布函數表
分布中文名稱 R中的表達參數
Beta 貝塔分布 beta(a,b) shape1, shape2
Binomial 二項分布 binom(n,p) size, prob
Cauchy 柯西分布 cauchy( ) location, scale Chi-square 卡方分布 chisq(df) df Exponential 指數分布 exp(lamda) rate F F分布 f(df1,df2) df1 df2
Gamma 伽瑪分布 gamma() shape rate
Geometric 幾何分布 geom() prob Hypergeometric 超幾何分布 hyper() m,n,k
Logistic 邏輯分布 logis() location scale
Negative binomial 負二項分布 nbinom() size prob
Normal 正態分布 norm() mean, sd Multivariate normal 多元正態分布 mvnorm() mean,cov
Poisson 泊松分布 pois() lambda T t 分布 t() df
Uniform 均勻分布 unif() min, max Weibull 威布兒分布 weibull() shape, scale
Wilcoxon 威爾考可森分布 wilcox() m, n

表 3-2 與分布相關的函數及代號

函數代號函數作用
r- 生成相應分布的隨機數
d- 生成相應分布的密度函數
p- 生成相應分布的累積概率密度函數
q- 生成相應分布的分位數函數

例：

dnorm表示正態分布密度函數
pnorm表示正態分布累積概率密度函數
qnorm表示正態分布分位數函數（即正態累積概率密度函數的逆函數）

3.2 隨機抽樣

3.2.1 放回與無放回抽樣

R可以進行有放回、無放回抽樣

sample（）函數即可以實現

句法為：sample（x,n,replace=F,prob=NULL）

3.3 統計模擬

3.3.1 幾種常見的模擬方法

1 中心極限定理：

2 二項分布模擬中心極限定理

3 用函數進行模擬

指定模擬次數m=100，樣本量n=10，概率=0.25，如果要改變這些參數來重新進行模擬將會很麻煩，下面將展示如何將上面的程序形成一個模擬函數再進行模擬。

> sim.clt <- function (m=100,n=10,p=0.25)
{ z = rbinom(m,n,p)
x = (z-n*p)/sqrt(n*p*(1-p))
hist(x,prob=T,breaks=20,main=paste("n =",n,”p =”,p))
curve(dnorm(x),add=T)
}
> sim.clt() # 默認 m=100，n=10，p=0.25
> sim.clt(1000) # 取 m=1000，n=10，p=0.25
> sim.clt(1000,30) # 取 m=1000，n=30，p=0.25
> sim.clt(1000,30,0.5) # 取 m=1000，n=30，p=0.5

4 正態概率模擬

能比直方圖更好判定隨機數是否近似服從正態分布的是正態概率圖。

其基本思想是：作實際數據的分位數與正態分布數據的分位數的散點圖，也就是作樣本分位數與理論分位數的散點圖。

3.3.2 模擬函數的建立方法

若每次模擬都要編寫一個循環，非常麻煩.

sim.fun（）就是專門用來解決這類問題的

只需要編寫一個用來生成隨機數的函數，剩下的工作就交給sim.fun來完成

sim.fun <-function (m,f,...) # m 模擬樣本次數，f需模擬的函數
{
sample <-1:m
for (i in 1:m) {
sample[i] <-f(...)
}

sample
}

例：

二項分布：

先編寫一個函數用來生成一個二項分布隨機的標準化值

>f<-function(n=10,p=0.5){s=rbinom(1,n,p);(s-n*p)/sqrt(n*p*(1-p)) }

> x=sim.fun(1000,f) # 模擬1000個二項隨機數
> hist(x,prob=T)

均勻分布來模擬中心極限定理：

> f = function(n=10) (mean(runif(n)-1/2)/(1/sqrt(12*n))
> x=sim.fun(1000,f) # 模擬1000個均勻隨機數
> hist(x,prob=T)

正態分布：

>f=function(n=10,mu=0,sigma=1){r=rnorm(n,mu,sigma);(mean(r)-m
u)/(sigma/sqrt(n)) }
> x = sim.fun(1000,f) #模擬1000個樣本量為10的N(0,1)隨機數
> hist(x,breaks=10,prob=T)

> x = sim.fun(1000,f,30,5,2) # 模擬1000個樣本量為30的N(5,4)隨機數
> hist(x,breaks=10,prob=T)

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

正態分布二項分布指數分布中心極限定理直方圖散點圖 R語言幾何分布

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇回歸系列（一）| 怎樣正確地理解線性回歸

下一篇2020美國總統競選大戲開鑼，川普當選的奇跡會再發生嗎？

數據分析師考試動態

考試介紹
考試大綱
考試內容
考試地點

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

更多

Copyright © 2015-2021, www.ruiqisteel.com All Rights Reserved. CDA數據分析師(北京國富如荷網絡科技有限公司) 版權所有京ICP備11001960號-9

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

OK

免費資料
免費試聽
訂制課程
職業規劃
認證考試

客服在線

日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊