




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、Chapter 6 Analysis of Sequence Alignment and Molecular Evolution of Proteins Part One利用網絡數據庫資源,將用戶所測定的蛋白利用網絡數據庫資源,將用戶所測定的蛋白質序列與已知序列進行相似性比對,是推斷質序列與已知序列進行相似性比對,是推斷該序列的結構、功能以及同源關系的強有力該序列的結構、功能以及同源關系的強有力的手段。的手段。序列相似性比對包括序列相似性比對包括全局序列比對全局序列比對(整體比(整體比對)與對)與局部序列比對局部序列比對。由于局部序列相似性比對更能反映蛋白質片由于局部序列相似性比對更能反映蛋白
2、質片段序列在結構與功能上的同源關系,故更具段序列在結構與功能上的同源關系,故更具有實際意義。有實際意義。序列相似性序列相似性與與序列同源性序列同源性是兩個不同的概念。是兩個不同的概念。序列相似性(序列相似性(similarity)是一量化參數,反映序列之是一量化參數,反映序列之間相似或相同的程度。也可用間相似或相同的程度。也可用序列一致性(序列一致性(identity)來表示。來表示。序列同源性(序列同源性(homology)則是反映序列之間在進化則是反映序列之間在進化上親緣關系的遠近。上親緣關系的遠近。一般說來,序列相似性或一致性越大,則序列之間具一般說來,序列相似性或一致性越大,則序列之間
3、具有同源關系的可能性越大。有同源關系的可能性越大。6.1 6.1 局部序列相似性的局部序列相似性的兩兩比對兩兩比對局部序列相似性的兩兩比對就是將用戶提交的局部序列相似性的兩兩比對就是將用戶提交的一段蛋白質序列,與數據庫中已知的蛋白質序一段蛋白質序列,與數據庫中已知的蛋白質序列進行局部序列相似性比對,以確定二者在序列進行局部序列相似性比對,以確定二者在序列結構與功能上的同源關系。列結構與功能上的同源關系。目前,進行局部序列相似性比對十分有用的網目前,進行局部序列相似性比對十分有用的網絡工具軟件是絡工具軟件是NCBI的的BLAST服務程序和服務程序和EBI的的FASTA服務程序。服務程序。由于二者
4、的實際檢索過程具有許多相似之處,由于二者的實際檢索過程具有許多相似之處,故這里僅介紹故這里僅介紹BLAST服務程序。服務程序。局部比對基本檢索工具局部比對基本檢索工具(Basic Local Alignment Search Tool,BLAST),是由),是由NCBI開發的一種局部序列比對檢索系統,主開發的一種局部序列比對檢索系統,主要用于將用戶所提交的核苷酸或蛋白質序列要用于將用戶所提交的核苷酸或蛋白質序列與已知的數據庫序列資料進行相似性比對。與已知的數據庫序列資料進行相似性比對。6.1.1 BLAST6.1.1 BLAST檢索服務程序檢索服務程序相對于全序列比對而言,相對于全序列比對而言
5、,BLAST采用采用啟發式啟發式比對方式比對方式進行進行局部序列比對局部序列比對,因而能夠檢測出,因而能夠檢測出存在于各個不同區段的、具有相似性的序列。存在于各個不同區段的、具有相似性的序列。直接利用直接利用Web瀏覽器獲得瀏覽器獲得BLAST服務是最便捷服務是最便捷的途徑之一。的途徑之一。用戶在啟動用戶在啟動IE瀏覽器后,在地址欄中輸入瀏覽器后,在地址欄中輸入“/Blast.cgi”并并回車,即可進入回車,即可進入BLAST服務程序的主頁。此時,服務程序的主頁。此時,用戶可以根據自己的檢索目的,選擇不同的用戶可以根據自己的檢索目的,選擇
6、不同的BLAST檢索服務程序。檢索服務程序。允許用戶檢索與特定種屬的生物相關的序列,包括人允許用戶檢索與特定種屬的生物相關的序列,包括人類基因組、大鼠和小鼠基因組、果蠅基因組、微生物類基因組、大鼠和小鼠基因組、果蠅基因組、微生物基因組、植物基因組等。基因組、植物基因組等。主要用于:主要用于:對待檢索序列作圖;對待檢索序列作圖;決定基因組的結構;決定基因組的結構;鑒定新的基因。鑒定新的基因。 BLAST Assembled Refseq Genomes(基(基因組參考序列因組參考序列BLAST)基本基本BLAST檢索服務程序包括:檢索服務程序包括: Nucleotide BLAST(blastn
7、)標準的核苷酸標準的核苷酸-核苷酸比對服務程序,用核苷酸比對服務程序,用于單條待檢索序列的鑒定,或查找與之相于單條待檢索序列的鑒定,或查找與之相似的核苷酸序列。似的核苷酸序列。 Basic BLAST(基本(基本BLAST) Protein BLAST(blastp)標準的蛋白質標準的蛋白質-蛋白質蛋白質BLAST,用于待檢,用于待檢索序列的鑒定,或查找與之相似的蛋白質索序列的鑒定,或查找與之相似的蛋白質序列。序列。序列輸入區序列輸入區數據庫選擇數據庫選擇檢索程序選擇檢索程序選擇運算參數選擇運算參數選擇翻譯的核苷酸檢索序列翻譯的核苷酸檢索序列- -蛋白質數據庫,蛋白質數據庫,即將用戶提交的核苷
8、酸序列全部翻譯為即將用戶提交的核苷酸序列全部翻譯為蛋白質序列,并與蛋白質序列,并與NCBI的蛋白質序列的蛋白質序列數據庫進行比對。數據庫進行比對。 Translated query vs. protein database (blastx)遺傳密碼選擇遺傳密碼選擇蛋白質檢索序列蛋白質檢索序列- -核苷酸序列翻譯數據核苷酸序列翻譯數據庫,即將用戶提交的庫,即將用戶提交的蛋白質序列與蛋白質序列與NCBI核苷酸數據庫按全部讀碼框動態核苷酸數據庫按全部讀碼框動態翻譯的序列進行比對。翻譯的序列進行比對。 Protein query vs. translated database (tblastn)翻譯的
9、核苷酸檢索序列翻譯的核苷酸檢索序列- -核苷酸序列翻譯數核苷酸序列翻譯數據庫,即將用戶提交的核苷酸序列按據庫,即將用戶提交的核苷酸序列按6個個讀碼框翻譯為蛋白質序列,再與讀碼框翻譯為蛋白質序列,再與NCBI核苷核苷酸數據庫的酸數據庫的6個讀個讀碼框翻譯序列進行比對。碼框翻譯序列進行比對。 Translated query vs. translated database(tblastx) Specialized BLAST(特殊的(特殊的BLAST)6.1.2 6.1.2 序列格式序列格式為了將待檢索序列與數據庫序列進行比對,用為了將待檢索序列與數據庫序列進行比對,用戶必須按照一定的格式提交欲比
10、對的序列。戶必須按照一定的格式提交欲比對的序列。即貯存蛋白質或核苷酸序列的文本文件格式,即貯存蛋白質或核苷酸序列的文本文件格式,首行為描述行。首行為描述行。 FASTA Format純序列格式是不帶有純序列格式是不帶有FASTA格式描述行定義格式描述行定義的序列數據,不允許出現空行,但可嵌入空格的序列數據,不允許出現空行,但可嵌入空格和和/或數字。或數字。 Net Sequence Format序列標識格式即只輸入注冊號或序列標識格式即只輸入注冊號或GI,不允許出,不允許出現空格符。現空格符。 Sequence Identifier Format6.1.3 BLAST6.1.3 BLAST比對
11、數據庫的選擇比對數據庫的選擇用戶應根據自己的檢索目的,選擇不同的用戶應根據自己的檢索目的,選擇不同的NCBI數據庫以用于待檢索序列的比對分析。數據庫以用于待檢索序列的比對分析。可供用戶選擇的數據庫包括核苷酸序列數據庫、可供用戶選擇的數據庫包括核苷酸序列數據庫、多肽序列數據庫及人類基因組序列數據庫等。多肽序列數據庫及人類基因組序列數據庫等。需注意某些數據庫對蛋白質或核苷酸序列是有需注意某些數據庫對蛋白質或核苷酸序列是有選擇的,不能與某一特定的選擇的,不能與某一特定的BLAST檢索服務檢索服務程序相結合使用。程序相結合使用。例如,不能使用例如,不能使用BLASTN程序檢索程序檢索UniProt蛋蛋
12、白質序列數據庫。白質序列數據庫。6.1.4 6.1.4 遺傳密碼表遺傳密碼表對于需進行翻譯的序列,可供選對于需進行翻譯的序列,可供選擇的遺傳密碼表及其相關聯的值擇的遺傳密碼表及其相關聯的值有:有:1 Standard(標準密碼);(標準密碼);2 Vertebrate Mitochondrial(脊椎動物線(脊椎動物線粒體密碼);粒體密碼);3 Yeast Mitochondrial(酵母線粒體密碼);(酵母線粒體密碼);4 Mold Mitochondrial and Mycoplasma/ Spiroplasma(霉菌線粒體和(霉菌線粒體和支原體支原體/螺旋體密碼)等。螺旋體密碼)等。6.
13、1.5 6.1.5 評分系統評分系統BLASTP、BLASTX、TBLASTN 和和TBLASTX程序所使用的評分系統為評分矩陣,主要有兩大程序所使用的評分系統為評分矩陣,主要有兩大類:類:第一類為第一類為模塊替換矩陣模塊替換矩陣(blocks substitution matrix,BLOSUM),該矩陣),該矩陣是由是由Henikoff夫婦于夫婦于1992年建立的,它以序年建立的,它以序列片段為基礎,基于蛋白質模塊數據庫列片段為基礎,基于蛋白質模塊數據庫BLOCKS,考慮了序列片段中相鄰殘基之間,考慮了序列片段中相鄰殘基之間的關系。的關系。BLOSUM Score Matrix在進行相似性
14、比對時,如在進行相似性比對時,如相相同殘基的分值越高同殘基的分值越高,則表示,則表示其其越保守越保守,越不易發生突變;,越不易發生突變;如如不同殘基的分值越高不同殘基的分值越高,則,則表示其在進化過程中越容易表示其在進化過程中越容易發生相互突變,發生相互突變,相似性越高相似性越高;如如不同殘基的分值為負數不同殘基的分值為負數,則表示其在進化過程中不易則表示其在進化過程中不易發生相互替換,發生相互替換,相似性較低相似性較低。第二類為第二類為突變數據矩陣突變數據矩陣(mutation data matrix,MD),主要來自于單個殘基之間),主要來自于單個殘基之間的相似性,它是基于可接受突變點(的
15、相似性,它是基于可接受突變點(point accepted mutation,PAM)的概念。)的概念。1個個PAM表示在一定進化距離中,表示在一定進化距離中,1%的殘的殘基發生突變的頻數。基發生突變的頻數。Relationship of BLOSUM with PAM Matrixes6.1.6 6.1.6 檢索策略檢索策略BLAST比對結果輸出的基本單位是高分值片比對結果輸出的基本單位是高分值片段對(段對(High-scoring Segment Pair,HSP)。)。HSP由兩段任意的、長度相等的序列片段構成,由兩段任意的、長度相等的序列片段構成,這兩段序列的局部比對程度最大,且比對分
16、值這兩段序列的局部比對程度最大,且比對分值達到或超過界值(或截止分值)。達到或超過界值(或截止分值)。在在BLAST比對分析中,每對比對分析中,每對HSP由一來自于由一來自于待檢索序列的片段與一來自于數據庫序列的片待檢索序列的片段與一來自于數據庫序列的片段構成。段構成。BLAST程序所采用的相似性檢索過程,首先程序所采用的相似性檢索過程,首先是在待檢索序列與數據庫序列之間查找相似的是在待檢索序列與數據庫序列之間查找相似的片段(片段(HSP),然后對任何找到的匹配片段進),然后對任何找到的匹配片段進行統計學意義的評估(期望值行統計學意義的評估(期望值E),最后只報),最后只報告滿足用戶所選擇的統
17、計學界值的匹配片段。告滿足用戶所選擇的統計學界值的匹配片段。6.1.7 6.1.7 運算參數運算參數在進行在進行BLAST檢索比對時,用戶可根據自己檢索比對時,用戶可根據自己的檢索目的,按一定的格式輸入待檢索序列,的檢索目的,按一定的格式輸入待檢索序列,選擇并設定必要的參數。選擇并設定必要的參數。需要注意的是,相關的運算參數可因需要注意的是,相關的運算參數可因BLAST程序不同,或因程序或網頁的更新而改變。程序不同,或因程序或網頁的更新而改變。Blastp程序的運算參數(可選)程序的運算參數(可選)顯示目標序列最大值顯示目標序列最大值(可改為(可改為10)期望值閾值期望值閾值啟發式檢索最小初始
18、值啟發式檢索最小初始值評分矩陣系統評分矩陣系統缺口值(終止缺口值(終止/延伸)延伸)6.1.8 6.1.8 檢索結果檢索結果所有所有BLAST程序以大致相同的格式輸出檢索程序以大致相同的格式輸出檢索結果,其內容依次為:結果,其內容依次為: 檢索程序簡介及一般信息;檢索程序簡介及一般信息; 匹配序列的圖形化總結;匹配序列的圖形化總結; 匹配序列的在線描述;匹配序列的在線描述; 實際的序列比對結果;實際的序列比對結果; 檢索參數及其他統計學資料。檢索參數及其他統計學資料。Blastp蛋白質序列比對操作實例蛋白質序列比對操作實例1.用瀏覽器打開用瀏覽器打開Blastp檢索界面:檢索界面: /Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=blastp&a
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 章節Visual Foro課件第03章
- 汽車課件9-1-3章節
- 統編版五年級下冊語文期末專題訓練:文言文閱讀(含答案)
- 孔子游春講課件
- 巷道掘進與支護 采區巷道施工 交叉點施工
- 單片機應用教程課件項目四 單片機串口通信
- 數字智慧方案5851丨智慧化工園區解決方案
- DB43-T 2725-2023 八月瓜種植技術規程
- 灌注樁施工講課件
- 南藥種植技術講課件
- 創業基礎理論與實務(寧波財經學院)知到智慧樹章節答案
- 《燃氣分布式能源站調試及驗收規程》
- 土地租賃協議書樣本
- 《某飛機場物業管理服務方案》
- 移動OA系統建設方案
- 2024年重慶高考化學試題卷(含答案解析)
- 人體器官講解課件
- DB3301-T 0256-2024 城市生態河道建設管理規范
- 2023年南京市衛健委所屬部分事業單位招聘考試試題及答案
- 《管理會計》說課及試講
- 二手農機買賣合同協議書
評論
0/150
提交評論