R二項分布檢驗與FDR校正-CDA數據分析師官網

熱線電話：13121318867

登錄

首頁精彩閱讀R二項分布檢驗與FDR校正

R二項分布檢驗與FDR校正

2018-03-12

收藏

R二項分布檢驗與FDR校正

R語言二項分布檢驗與FDR校正

二項分布是重復n次的實驗，且每次實驗都是獨立的，只有兩種結果，并且相互對立的，生活中最常見的是投硬幣~~~在生物領域內也有很多符合此類分布的，如二倍體動物等位基因，來源于父本和母本的重組等。具體公式什么的就不寫了，寫個關于ASE的例子吧。

[plain] view plain copy
    # cat binom.r | R --slave --args <file>
    args <- commandArgs()
    fa <- read.table(args[4], header=FALSE, sep="\t")
    n1 = fa$V8
    n2 = fa$V12
    len = length(n1)
    pv = numeric(len)
    for(i in 1:len){
    pv[i] = 0
    if(n1[i] > n2[i]) pv[i]=binom.test(n1[i], n1[i]+n2[i], p=1/2, alternative="greater")$p.value else pv[i]=binom.test(n2[i], n1[i]+n2[i], p=1/2, alternative="greater")$p.value
    }
    qv <- p.adjust(pv, method="fdr")#fdr校正
    fa$pv = formatC(pv, digits=4)
    fa$fdr = formatC(qv, digits=4)
    write.table(fa, file=paste(args[4],".out",sep=""), sep="\t", col.names=FALSE, row.names=FALSE, quote=FALSE)

其實也不算是什么例子，就是把過程寫下來熟悉一下寫法而已。

通過控制FDR(False Discovery Rate)來決定P值的域值。假設你挑選了R個差異表達的基因，其中有S個是真正有差異表達的，另外有V個其實是沒有差異表達的，是假陽性的。實踐中希望錯誤比例Q＝V/R平均而言不能超過某個預先設定的值（比如0.05），在統計學上，這也就等價于控制FDR不能超過5％。對所有候選基因的p值進行從小到大排序，則若想控制fdr不能超過q，則只需找到最大的正整數i，使得 p(i)<= (i*q)/m。然后，挑選對應p(1)，p(2)，……，p(i)的基因做為差異表達基因，這樣就能從統計學上保證fdr不超過q。

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

R語言

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇R語言中執行二項分布檢驗

下一篇R語言之隨機數與抽樣模擬篇

數據分析師考試動態

考試介紹
考試大綱
考試內容
考試地點

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

更多

Copyright © 2015-2021, www.ruiqisteel.com All Rights Reserved. CDA數據分析師(北京國富如荷網絡科技有限公司) 版權所有京ICP備11001960號-9

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

OK

免費資料
免費試聽
訂制課程
職業規劃
認證考試

客服在線

日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊