功能域和基序通過多序列聯(lián)配等途徑可以獲得它們的聯(lián)配結(jié)果(如圖1-4.4NBS 功能域)。在分子生物學(xué)領(lǐng)域,大量功能基因被克隆,大量功能域被發(fā)現(xiàn);同時,基于序列分析,也可以發(fā)現(xiàn)大量基因共同保守的區(qū)段,這些為未知功能的候選功能域。...[繼續(xù)閱讀]
海量資源,盡在掌握
功能域和基序通過多序列聯(lián)配等途徑可以獲得它們的聯(lián)配結(jié)果(如圖1-4.4NBS 功能域)。在分子生物學(xué)領(lǐng)域,大量功能基因被克隆,大量功能域被發(fā)現(xiàn);同時,基于序列分析,也可以發(fā)現(xiàn)大量基因共同保守的區(qū)段,這些為未知功能的候選功能域。...[繼續(xù)閱讀]
信息量或信息熵的概念來自信息論。當我們說一條信息或消息,我們會問其信息量有多大或它可以提供給我們多少明確的信息。一條消息的信息量越大,其不確定性就越小。例如,我們說“今年將在中國召開G20峰會”和“2016年9月將在杭...[繼續(xù)閱讀]
在生物信息學(xué)領(lǐng)域,信息熵有兩個廣泛應(yīng)用,如計分矩陣信息量的估計和序列保守性的圖形描述等。1.計分矩陣我們構(gòu)建了一個計分矩陣(如PSSM、PAM 和BLOSUM 矩陣)之后,經(jīng)常會問的一個問題是,該矩陣用于序列搜索或保守區(qū)段的搜索效果如...[繼續(xù)閱讀]
1.簡述漸進多序列聯(lián)配算法(ClustalW 算法)。2.什么是功能域和基序(motif)?3.簡述幾種功能域的描述方式(模型)。4.請構(gòu)建多序列聯(lián)配結(jié)果(功能域)的馬爾可夫模型并簡要說明。5.說明PSSM 等矩陣的熵(H)和信息量(IC)的概念。...[繼續(xù)閱讀]
一個生物體的基因組是指一套染色體中完整的DNA 序列。例如,生物個體二倍體體細胞由兩套染色體組成,其中一套DNA 序列就是一個基因組。也就是說,對于單倍體細胞,基因組是指編碼序列和非編碼序列在內(nèi)的全部DNA 分子。對于有性生...[繼續(xù)閱讀]
在完成基因組序列拼接后,可以獲得基因組的主要DNA 序列,甚至可能是整個基因組各條染色體的序列。這些序列中包含許多未知基因,將基因從這些基因組序列中找出來是生物信息學(xué)的一個重要任務(wù)。基因組DNA 序列上,一個蛋白質(zhì)編碼...[繼續(xù)閱讀]
在進行基因組序列注釋過程中,一般會遇到兩種情況:一是僅針對少量目標序列(如若干BAC 克隆序列)進行基因注釋,目的是了解這些序列上可能的功能基因,二是針對一個新測序基因組進行全基因組水平的基因注釋。對于第一種情況,可以...[繼續(xù)閱讀]
馬爾可夫模型,也叫馬爾可夫過程或馬爾可夫鏈(Markov chain),是俄羅斯數(shù)學(xué)家Markov 在研究俄羅斯文學(xué)家普希金《奧涅金》作品不同音的出現(xiàn)規(guī)律時,于1907年提出來的一個數(shù)學(xué)模型,它是研究隨機過程統(tǒng)計特征的一種概率模型。假設(shè)存在一...[繼續(xù)閱讀]
隱馬爾可夫模型在實際應(yīng)用中會涉及3個基本問題,即評估問題(evaluation)、解碼問題(decoding)和學(xué)習(xí)問題(learning)。評估問題是已知觀察序列O 和模型λ,如何計算由此模型產(chǎn)生此觀察序列的概率P(O|λ)? 解碼問題是已知觀察序列O 和模型λ...[繼續(xù)閱讀]
1.HMM 基因預(yù)測模型HMM 是20世紀90年代最早在原核生物上用于基因預(yù)測。當時被用于大腸桿菌E.coli的基因預(yù)測(Krogh 等,1994),而在這之前,馬爾可夫模型已在原核生物上被用于基因預(yù)測(Borodovsky 和McIninch,1993)。而后,HMM 被用于人類等真核生...[繼續(xù)閱讀]