




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
#/12構建系統進化樹的詳細步驟1.建樹前的準備工作1.1相似序列的獲得——BLASTBLAST是目前常用的數據庫搜索程序,它是BasicLocalAlignmentSearchTool的縮寫,意矚慫潤厲釤瘞睞櫪廡賴賃軔朧。為“基本局部相似性比對搜索工具"(Altschuletal.,1990[62];1997[63])。國際著名生物信息中心聞創溝燴鐺險愛氌譴凈禍測樅。都提供基于Web的BLAST服務器。BLAST算法的基本思路是首先找出檢測序列和目標序列之間相似性程度最高的片段,并作為內核向兩端延伸,以找出盡可能長的相似序列片段。首先登錄到提供BLAST服務的常用網站,比如國內的CBI、美國的NCBI、歐洲的EBI和日本的DDBJ。這些網站提供的BLAST服務在界面上差不多,但所用的程序有所差異。它們都有一個大的文本框,用于粘貼需要搜索的序列。把序列以FASTA格式(即第一行為說明行,以“>”符號開始,后面是序列的名稱、說明等,其中“>”是必需的,名稱及說明等可以是任意形式,換行之后是序列)粘貼到那個大的文本框,選擇合適的BLAST程序和數據庫,就可以開始搜索了。如果是DNA序列,一般選擇BLASTN搜索DNA數據庫。這里以NCBI為例。登錄NCBI主頁-點擊BLAST-點擊Nucleotide-nucleotideBLAST(blastn)-在Search文本框中粘貼檢測序列-點擊BLAST!-點擊Format-得至UresultofBLASTo殘騖樓諍錈瀨濟溆塹籟婭驟東。BLASTN結果如何分析(參數意義):>gi|28171832|gb|AY155203.1|Nocardiasp.ATCC4987216SribosomalRNAgene,complete釅錒極額閉鎮檜豬訣錐顧葒鈀,sequenceScore=2020bits(1019),Expect=0.0Identities=1382/1497(92%),Gaps=8/1497(0%)Strand=Plus/Plus彈貿Query:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt60謀蕎||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc--ggggt58廈礴Query:61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc120煢|||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct:59acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc118鵝Score:指的是提交的序列和搜索出的序列之間的分值,越高說明越相似;Expect:比對的期望值。比對越好,expect越小,一般在核酸層次的比對,expect小于1e-10,籟叢媽羥為贍僨蟶練淨櫧撻曉。就比對很好了,多數情況下為0;Identities:提交的序列和參比序列的相似性,如上所指為1497個核苷酸中二者有1382個相同;Gaps:—般翻譯成空位,指的是對不上的堿基數目;Strand:鏈的方向,Plus/Minus意味著提交的序列和參比序列是反向互補的,如果是Plus/預頌圣鉉儐歲齦訝驊糴買闥齙。Plus則二者皆為正向。1.2序列格式:FASTA格式由于EMBL和GenBank數據格式較為復雜,所以為了分析方便也出現了十分簡單的FASTA數據格式。FASTA格式又稱為Pearson格式,該種序列格式要求序列的標題行以大于號“>”開頭,下—行起為具體的序列。—般建議每行的字符數不超過60或80個,以方便程序處理。多條核酸和蛋白質序列格式即將該格式連續列出即可,如下所示:>E.coli1aaattgaagagtttgatcatggctcagattgaacgctggcggcaggcctaacacatgcaa滲61gtcgaacggtaacaggaagaagcttgcttctttgctgacgagtggcggac……鐃誅臥瀉噦>AY631071JiangellagansuensisYIM0021gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt擁締鳳襪備訊顎輪爛薔報贏無。61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc其中的?>為ClustalX默認的序列輸入格式,必不可少。其后可以是種屬名稱,也可以是序列在Genbank中的登錄號(AccessionNo.),自編號也可以,不過需要注意名字不能太長,一般由英文字母和數字組成,開首幾個字母最好不要相同,因為有時ClustalX程序只默認前幾位為該序列名稱。回車換行后是序列。將檢測序列和搜索到的同源序列以FASTA格式編輯成為一個文本文件(例:C:\temp\jc.txt),即可導入ClustalX等程序進行比對建樹。2.構建系統樹的相關軟件和操作步驟壇摶鄉囂懺蔞鍥鈴氈淚躋馱釣。構建進化樹的主要步驟是比對,建立取代模型,建立進化樹以及進化樹評估。鑒于以上對于構建系統樹的評價,結合本實驗室實際情況,以下主要介紹N-JTree構建的相關軟件和操作步驟。蠟變黲癟報倀鉉錨鈰贅籜葦繯。2.1用ClustalX構建N-J系統樹的過程⑴打開ClustalX程序,載入源文件.File-Loadsequences-C:\temp\jc.txt.(2)序列比對Alignment-Outputformatoptions-?Clustalformat;CLUSTALWsequencenumbers:ON買鯛鴯譖曇膚遙閆擷凄屆嬌擻。Alignment-Docompletealignment(OutputGuideTreefile,C:\temp\jc.dnd;OutputAlignmentfile,C:\temp\jc.aln;)Align?waiting等待時間與序列長度、數量以及計算機配置有關。掐頭去尾File-SaveSequenceas...Format:?CLUSTALGDEoutputcase:LowerCLUSTALWsequencenumbers:ONSavefromresidue:39to1504(以前后最短序列為準)Savesequenceas:C:\temp\jc-a.alnOK將開始和末尾處長短不同的序列剪切整齊。這里,因為測序引物不盡相同,所以比對后序列參差不齊。一般來說,要“掐頭去尾”,以避免因序列前后參差不齊而增加序列間的差異。剪切后的文件存為ALN格式。File-Loadsequences-Replaceexistingsequences?-Yes-C:\temp\jc-a.aln重新載入剪切后的序列。Trees-OutputFormatOptionsOutputFiles:?CLUSTALformattree?Phylipformattree?PhylipdistancematrixBootstraplabelson:NODE鍬籟CLOSETrees-ExcludepositionswithgapsTrees-BootstrapN-JTree:構氽頑黌碩飩薺齦話騖Randomnumbergeneratorseed(1-1000):111Numberofbootstraptrails(1-1000):1000SAVECLUSTALTREEAS:C:\temp\jc-a.njbSAVEPHYLIPTREEAS:C:\temp\jc-a.njbphbOK?waiting輒峰陽檉籪癤網儂號澩蠐鑭釃等待時間與序列長度、數量以及計算機配置有關。在此過程中,生成進化樹文件*.njbphb,可以用TreeView打開查看。堯側閆繭絳闕絢勵蜆贅瀝紕縭。Trees-DrawN-JTreesSAVECLUSTALTREEAS:C:\temp\jc-a.njSAVEPHYLIPTREEAS:C:\temp\jc-a.njphSAVEDISTANCEMATRIXAS:C:\temp\jc-a.njphdstOK識饒鎂錕縊灩筧嚌此過程中生成的報告文件*.nj比較有用,里面列出了比對序列兩兩之間的相似度,以及轉換和顛換分別各占多少。凍鈹鋨勞臘鍇癇婦脛糴鈹賄鶚。TreeViewFile-Open-C:\temp\jc-a.njbphbTree-phylogram(unrooted,slantedcladogram,Rectangularcladogram多種樹型)Tree-Showinternaledgelabels(Bootstrapvalue)(顯示數值)恥諤銪滅Tree-Defineoutgroup...?ingroup>>outgroup?OK(定義外群)鯊腎鑰詘褳鉀溈Tree-Rootwithoutgroup通常需要對進化樹進行編輯,這時首先要Edit-Copy至PowerPoint上,然后Copy至Word上,再進行圖片編輯。如果直接Copy至Word則顯示亂碼,而進化樹不能正確顯示。2.2Mega建樹碩癘鄴頏謅攆檸攜驤蘞鷥膠據。雖然ClustalX可以構建系統樹,但是結果比較粗放,現在一般很少用它構樹,Mega因為操作簡單,結果美觀,很多研究者選擇用它來建樹。閿擻輳嬪諫遷擇楨秘騖輛⑴首先用ClustalX進行序列比對,剪切后生成C:\temp\jc-a.aln文件;(同上)⑵打開BioEdit程序,將目標文件格式轉化為FASTA格式,氬嚕躑竄貿懇彈濾頷漿紛釓鄧.File-Open-C:\temp\jc-a.aln,File-SaveAs-C:\temp\jc-b.fas;⑶打開Mega程序,轉化為mega格式并激活目標文件,File-ConvertToMEGAFormat-C:\temp\jc-b.fas?C:\temp\jc-b.meg,釷鵒關閉TextEditor窗口-(Doyouwanttosaveyourchangesbeforeclosing?-Yes);Clickmetoactivateadatafile-C:\temp\jc-b.meg-OK-慫闡譜鯪逕導嘯畫長涼(Protein-codingnucleotidesequencedata?-No);Phylogeny-Neighbor-Joining(NJ)DistanceOptions-Models-Nucleotide:Kimura2-parameter;諺辭調擔鈧諂動禪瀉類?d:Transitions+Transversions;IncludeSites-?PairwiseDeletionTestofPhylogeny-?Bootstrap;Replications1000;RandomSeed64238嘰覲OK;開始計算,得到結果;(4)Image-CopytoClipboard-粘貼至Word文檔進行編輯。此外,Subtree中提供了多個命令可以對生成的進化樹進行編輯,Mega窗口左側提供了很多快捷鍵方便使用;View中則給出了多個樹型的模式。下面只介紹幾種最常用的:Subtree-Swap:任意相鄰兩個分支互換位置;熒紿譏鉦鏌觶鷹緇機庫圓鍰緘。-Flip:所選分支翻轉180度-Compress/Expand:合并/展開多個分支;-Root:定義外群;View-Topology:只顯示樹的拓扌卜結構;-Tree/BranchStyle:多種樹型轉換;-Options:關于樹的諸多方面的改動。2.3TREECON打開ClustalX,File-Loadsequences-jc-a.aln,File-SaveSequenceas...(Format-PHYLIP;Savefromresidue-1to末尾尾;Savesequenceas:C:\temp\jc.phy);鶼漬螻偉閱劍鯫腎邏蘞闋簣擇。打開TREECON程序,Distanceestimation點擊Distanceestimation-Startdistanceestimation,打開上面保存的jc.phy文件,SequenceType-NuleicAcidSequence,Sequenceformat-PHYLIPinterleaved,SelectALL,OK;DistanceEstimation-Jukes&Cantor(orKimura),Alignmentpositions-All,Bootstrapanalysis-Yes,Insertions&Deletions-Nottakenintoaccount,OK;紂憂蔣氳頑薟驅藥憫騖覲僨鴛。Bootstrapsamples-1000,OK;運算,等待Finished-OK。Infertreetopology點擊Infertreetopology-Startinferringtreetopology,Method-Neighbor-joining,Bootstrap穎芻莖蛺餑億頓裊賠瀧漲負這。analysis-Yes,OK.;運算,等待Finished-OK。Rootunrootedtrees點擊Rootunrootedtrees-Startrootingunrootedtrees,Outgroupopition-singl
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公示牌安裝合同協議書
- 陳列活動方案協議書
- 拔出指甲治療
- 郵政掛號寄遞協議書
- 高空吊裝免責協議書
- 兒童俱樂部安全協議書
- 交行信用卡減免協議書
- csc留學資助協議書
- 農村搬遷房轉讓協議書
- 飯店著火賠償協議書
- 肥胖癥診療指南(2024年版)解讀
- 麥收消防安全培訓課件
- 《科普技巧常識》課件
- 2025年中國全電腦橫機市場現狀分析及前景預測報告
- 大型活動場館停車管理方案與技術措施
- 醫院基建管理試題及答案
- 2025年全國保密教育線上培訓考試試題庫及答案(奪冠)帶答案詳解
- 滬教牛津版(深圳用)英語五年級下冊Unit-11-Chinese-festivals課件
- DBJ50-T-078-2016重慶市城市道路工程施工質量驗收規范
- MOOC 跨文化交際通識通論-揚州大學 中國大學慕課答案
- GA 1283-2015住宅物業消防安全管理
評論
0/150
提交評論