核酸與蛋白質(zhì)序列分析-1.ppt_第1頁
核酸與蛋白質(zhì)序列分析-1.ppt_第2頁
核酸與蛋白質(zhì)序列分析-1.ppt_第3頁
核酸與蛋白質(zhì)序列分析-1.ppt_第4頁
核酸與蛋白質(zhì)序列分析-1.ppt_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2020 2 12 1 鄭連友E mail lianyouzh 吉林大學藥學院基因工程教研室 生物信息學 2020 2 12 2 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 第六章 核酸和蛋白質(zhì)序列分析 2020 2 12 3 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 第一節(jié) 核酸序列分析 三 DNA序列分析基礎(chǔ)四 DNA序列分析方法 2020 2 12 4 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 三 DNA序列分析基礎(chǔ) 1 DNA序列分析內(nèi)容DNA序列分析 基因序列 基因表達調(diào)控信息尋找基因牽涉到兩個方面的工作 識別與基因相關(guān)的特殊序列信息預測基因的編碼區(qū)域結(jié)合兩個方面的結(jié)果確定基因的位置和結(jié)構(gòu)基因表達調(diào)控信息隱藏在基因的上游區(qū)域 在組成上具有一定的特征 可以通過序列分析識別這些特征 2020 2 12 5 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 2 DNA序列功能位點在DNA序列中 除了基因之外 還包含許多其它信息 這些信息大部分與核酸的結(jié)構(gòu)特征相關(guān)聯(lián) 通常決定了DNA與蛋白質(zhì)或者DNA與RNA的相互作用 存放這些信息的DNA片段稱為功能位點 如啟動子 Promoter 基因終止序列 Terminatorsequence 剪切位點 Splicesite 等 2020 2 12 6 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 功能位點 functionalsite 與特定功能相關(guān)的位點 是生物分子序列上的一個功能單元 或者是生物分子序列上一個較短的片段 功能位點又稱為功能序列 functionalsequence 序列模式 motif 信號 signal 等 核酸序列中的功能位點包括轉(zhuǎn)錄因子結(jié)合位點 轉(zhuǎn)錄剪切位點 翻譯起始位點等 在蛋白質(zhì)序列分析中 常使用序列模式這個名詞 蛋白質(zhì)的序列模式往往與蛋白質(zhì)結(jié)構(gòu)域或者作用部位有關(guān) 2020 2 12 7 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 DNA序列功能位點示意圖 2020 2 12 8 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 基因組序列中若干個相鄰的功能位點組合形成功能區(qū)域 functionalregion 功能位點分析的任務(wù) 發(fā)現(xiàn)功能位點特征 識別功能位點 2020 2 12 9 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 利用共有序列搜索功能位點共有序列 consensus 又稱一致性片段共有序列是關(guān)于功能位點特征的描述 它描述了功能位點每個位置上核苷酸進化的保守性例如 NTATN利用共有序列進行功能位點分析牽涉到兩個方面的問題 如何構(gòu)造共有序列如何利用共有序列在給定的核酸序列上搜索尋找功能位點 并計算所找到的功能位點的可靠性 2020 2 12 10 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 3 基因識別 基因識別是生物信息學領(lǐng)域里的一個重要研究內(nèi)容基因識別問題 在近幾年受到廣泛的重視 當人類基因組研究進入一個系統(tǒng)測序階段時 急需可靠自動的基因組序列翻譯解釋技術(shù) 以處理大量已測定的但未知功能或未經(jīng)注釋的DNA序列 2020 2 12 11 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 1 原核基因識別特點 長開放閱讀框 高基因 簡單的基因結(jié)構(gòu) 原核基因組中的GC含量高重點在于識別編碼區(qū)域 2020 2 12 12 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 非翻譯區(qū)域 untranslatedregions UTR 編碼區(qū)域兩端的DNA 有一部分被轉(zhuǎn)錄 但是不被翻譯 這一部分稱為非翻譯區(qū)域5 UTR 基因上游區(qū)域的非翻譯區(qū)域3 UTR 基因下游區(qū)域的非翻譯區(qū)域 2020 2 12 13 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 對于任何給定的核酸序列 單鏈DNA或mRNA 根據(jù)密碼子的起始位置 可以按照三種方式進行解釋 例如 序列ATTCGATCGCAA 1 ATTCGATCGCAA 2 ATTCGATCGCAA 3 ATTCGATCGCAA這三種閱讀順序稱為閱讀框 readingframes 2020 2 12 14 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 一個開放閱讀框 ORF openreadingframe 是一個沒有終止編碼的密碼子序列 原核基因識別任務(wù)的重點是識別開放閱讀框 或者說識別長的編碼區(qū)域 2020 2 12 15 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 基于基因密碼子特性的識別方法辨別編碼區(qū)域與非編碼區(qū)域的一種方法是檢查終止密碼子的出現(xiàn)頻率終止密碼子出現(xiàn)的期望次數(shù)為 每21個 64 3 密碼子出現(xiàn)一次終止密碼子 2020 2 12 16 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 基本思想 如果能夠找到一個比較長的序列 其相應(yīng)的密碼子序列不含終止密碼子 則這段序列可能就是編碼區(qū)域 基本算法 掃描給定的DNA序列 在三個不同的閱讀框中尋找較長的ORF 遇到終止密碼子以后 回頭尋找起始密碼子 這種算法過于簡單 不適合于處理短的ORF或者交疊的ORF 2020 2 12 17 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 真核基因遠比原核基因復雜 一方面 真核基因的編碼區(qū)域是非連續(xù)的 編碼區(qū)域被分割為若干個小片段 另一方面 真核基因具有更加豐富的基因調(diào)控信息 這些信息主要分布在基因上游區(qū)域 2 真核基因識別問題 2020 2 12 18 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 真核基因結(jié)構(gòu)示意圖 真核基因遠比原核基因復雜 一方面 真核基因的編碼區(qū)域是非連續(xù)的 編碼區(qū)域被分割為若干個小片段 另一方面 真核基因具有更加豐富的基因調(diào)控信息 這些信息主要分布在基因上游區(qū)域 2020 2 12 19 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 真核基因識別基本思路找出基因兩端的功能區(qū)域 轉(zhuǎn)錄啟動區(qū) 終止區(qū)在啟動區(qū)下游位置尋找翻譯起始密碼子識別轉(zhuǎn)錄剪切位點剪切給體位點剪切接受體位點 2020 2 12 20 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 真核基因識別的主要方法從頭算方法 或基于統(tǒng)計的方法 根據(jù)蛋白質(zhì)編碼基因的一般性質(zhì)和特征進行識別 通過統(tǒng)計值區(qū)分外顯子 內(nèi)含子及基因間區(qū)域 基于同源序列比較的方法利用數(shù)據(jù)庫中現(xiàn)有與基因有關(guān)的信息 如EST序列 蛋白質(zhì)序列 通過同源比較 幫助發(fā)現(xiàn)新基因 2020 2 12 21 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 四 DNA序列分析方法 2020 2 12 22 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 1 遮蔽重復序列 在進行任何真核生物序列的基因辨識分析之前 最好把散布和簡單的重復序列找出來并從序列中除去 雖然這些重復序列可能正好覆蓋了由RNA聚合酶 轉(zhuǎn)錄的部分區(qū)域 它們幾乎不會覆蓋啟動子和外顯子編碼區(qū) 這樣 這些重復序列的定位能為其它基因特征的定位提供重要的反面信息 重復序列還常常會攪亂其它分析 特別是在數(shù)據(jù)庫搜索中 2020 2 12 23 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 所用程序 1 CENSORhttp www girinst org censor 2 Repeatmaskerhttp www repeatmasker org 2020 2 12 24 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 2 開放閱讀框分析 ORF 1 http www expasy org tools dna html 2 http www ncbi nlm nih gov gorf 3 http exon gatech edu GeneMark 2020 2 12 25 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 3 數(shù)據(jù)庫搜索TBLSTNhttp www ncbi nlm nih gov blast 2020 2 12 26 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 4 啟動子分析 2020 2 12 27 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 1 啟動子查詢http www epd isb sib ch 2020 2 12 28 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 2 啟動子分析http thr cit nih gov molbio proscan 2020 2 12 29 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 5 內(nèi)含子剪接位點 2020 2 12 30 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 1 GRAIL http compbio ornl gov Grail 1 3 5 內(nèi)含子剪接位點 2020 2 12 31 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 2 SIM4 http pbil univ lyon1 fr sim4 php 2020 2 12 32 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 6 CpG島分析 CpG島 是指哺乳動物基因啟動子及其附近大量的CpG位點 CpG表示指C G以磷酸基連接 事實上基因組中60 90 的CpG都被甲基化 未甲基化的CpG成簇地組成CpG島 位于結(jié)構(gòu)基因啟動子的核心序列和轉(zhuǎn)錄起始點 有實驗證明超甲基化阻遏轉(zhuǎn)錄的進行 2020 2 12 33 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 CpG島工具用來查找一條DNA序列中CpG島 使用Gardiner GardenandFrommer 1987 描述的方法 用一個200bp的窗口移過序列 每次移一個堿基對 進行計算 CpG島定義為Y值大于0 6并且GC含量大于50 的200bp序列區(qū)域 只有符合以上標準 才輸入結(jié)果 CpG島經(jīng)常在脊椎動物基因的5 區(qū)域發(fā)現(xiàn) 因此 這個程序可用來在基因組序列中查找潛在的基因 2020 2 12 34 生物信息學 第六章 核酸和蛋白質(zhì)序列分析 1 WEBGENE的CpG分析r it cg

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論