熱線電話:13121318867

登錄
首頁精彩閱讀基于Hadoop的同源性搜索GO功能注釋平臺的研究
基于Hadoop的同源性搜索GO功能注釋平臺的研究
2014-12-01
收藏

基于Hadoop的同源性搜索GO功能注釋平臺的研究


基于Hadoop的同源性搜索GO功能注釋平臺的研究

南京農業大學 吳浩宇

本文的研究工作主要如下: (1)研究了基因本體的相關理論基礎,以及GO本體論在生物信息學尤其是基因功能注釋中所得到的應用。分析了目前已有的基因數據的注釋手段,以及基于同源性序列相似度的功能注釋所具備的理論基礎。 (2)研究了基于序列相似度比對的基因功能注釋的流程。研究了打分矩陣和序列比對算法在發現同源性序列的過程中所起的作用。研究并實現了點矩陣、Needleman-Wunsch、Smith-Waterman等序列比對算法,并測試比較了它們的性能。 (3)創新性地提出了基于Hadoop的基因功能注釋平臺的體系架構。通過整合GO數據庫以及其他生物數據庫,設計了本地基因注釋的數據中心,并設計了用于功能注釋的概念模型,用來實現本體與注釋信息的關聯通路。 (4)分析了蛋白質數據庫搜索算法BLASTP的算法理論,比較算法各個階段所占的運行時間。結合Hadoop的MapReduce并行處理框架,以及在基因注釋中比對算法的需求,設計了并行的蛋白質比對算法CGABlastP,通過實驗證明其從本質上提高了基因注釋的速度,適應了生物序列指數級增長的需求。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢