




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、基因組序列的差異分析mVISTA的在線使用說明當然,除了在線版的,我們還可以在網站上填寫信息中請離線的軟件。但我試用了一下,需要先自己比對,然后要按照一定的格式來制作文 件,當然你還必須得安裝java才能運行軟件;總之,我感覺沒有在線 版的方便。1將數據放入服務器中在首頁,你將被要求確龍你想要分析的基因組序列的數量。輸入這個數字之后,點擊“提 交”,將帶你到主提交頁面。mVISTA服務器最多可以同時處理100條序列。mVISTA SubmissionRankVISTA regions are now autoinaiically computed for all mVISTA submissi
2、ons. Add die rankVISTA curve in the VISTABrov/ser io view them. or click the rankVISTA link in the Text Browser to download the results of the coinputationPlease enter the number of species you would like to compare and click the Submit button. This will take you to a form where you may input your s
3、pecie Sequences.Total number of I I fJ要求你填入需要分忻的序列骸量sequences: w (2 -100 ) SubmitRsuipd fields are forked1.1主提交頁面必填的內容E-mail地址通過ErnaiL我們可以提示你的在線處理已經得到結果。序列你可以用2種方式來上傳你的序列:使用“Browse按鈕從你的電腦上,上傳純文本的Fasta格式文件。如果是一個作為參考的 生物體的DNA序列必須作為一個contig提交(可以進行一泄的左向排列將多個片段合并為 一個cont回,而英他非參考序列可以在一個或多個contig中提交(draft)
4、。Fasta格式的示例序列(您可以在NCBI站點上找到關于該格式的更多細節):mouse ATCACGCTCTTTGTACACTCCGCCATCTCTCTCT注意:序列里而我們只接受字母CAGTN和X。請確保提交序列是作為一種純文本格 式,而不是Word或HTML文件格式。如果您以FASTA格式提交序列,我們建議您為它取一個有意義的名稱(比如直接是你 的物種名之類的),因為這些需稱將出現在我們生成的圖形中。如果您使用的是一個draft 草圖序列,那么結果中每個contigs的命需都將按照您在“”符號后指示的命名進行。您可以給出它的GenBank登錄號,系統將自動從GenBank數據庫里進行檢索
5、序列。在這兩種情況下,序列的總大小都不應超過10M,而且任何一條序列都不應超過2M。1.2主提交頁面選填的內容這些選項允許您自定義您的VISTA分析。您可以使用獨立獲得的基因注釋,選擇合適的Repeat Masker選項,給分析的序列指泄爻且稱,并改變序列保存分析的參數。如果您沒有填寫這些選填 選項,我們將使用它們的默認值。比對程序根據您分析的具體內容(參見“about”-鏈接中的詳細信息),您可以選擇以下比對程序之一:1、AVID-全局兩兩比對。如果您選擇使用這個程序,其中一個序列應該被完成比對,其他所 有序列可以完成或以草圖draft格式完成。對于集合中所有已完成的序列,AVID生成所有
6、相對所有成對的比對結果,可以使用任何序列作為基礎(參考)來顯示。如果某些序列是 草圖格式,AVID將生成它們與最終序列的比對,這將被用作基礎(參考)。這是該服務器 上唯一可以處理草圖序列的比對程序。(小知識:草圖序列與完整序列 DNA sequence, draft: Sequence of a DNA with less accuracy than a finished sequenee. In a draft sequenee, some segments are missing or are in the wrong order or are oriented incorrectly.
7、A draft sequenee is as opposed to a finished DNA sequence)2、LAGAN-完成完整序列的全局兩兩比對和多重比對。如果某些序列是草圖格式,您的查詢 將被重泄向到AVID以獲得兩兩比對。多重比對將由VISTA可視化,它將計算并顯示序列的 保守區,以您指示的任何序列作為參考。這是該服務器上唯一能夠產生真正的多重比對的程序。3、Sheffle-LAGAN-完整序列的全局比對。它檢測序列中的重排和逆序,同時產生一個全局的端 到端映射圖。如果你輸入幾個序列,所有成對的組合將被處理,結果將在VISTA中可視 化。這是該服務器上唯一可用于檢測重排和逆序
8、的比對程序。(葉綠體基因組差異分析論 文中好像一般都選這個)對每條序列你可以選擇:名字你選擇的物種統字將會顯示在圖例中。我們建議您使用一些有意義的內容,例如這個生物 體的爻且稱、您的實驗編號或數據庫標識。當您使用GenBank標識符來輸入序列時,默認情況下 我們將使用它作為序列的名稱。(頁面默認的是sequencel, sequence2, sequence3.)注釋如果有序列的基因注釋信息,您可以將其以簡單的純文本格式提交,以便在繪圖中顯示。 每個基因由其在序列上的起始和結束坐標以及列在一行上的需稱來左義。一行前應放置大于 ()或小于(V)的符號,以表示正鏈或負鏈,但編號應根據正鏈來排列。在
9、每個外顯子的開始和 結束坐標之后,外顯子以單詞“exon”單獨列出。UTRs的注釋方式與外顯子相同,用utr代替 “外顯子”。例如:le ge*n shownFil?OCkpbAid0Calt?c1iaft3 . Analpii Tac:匚5|網d 1 ng矣 jmjlGcliBtati 廠SummaryiqucnccGeriBwhGerCank (til)FASTAASH 1XMLIMSDS制 XM.TinySeq MLFeature TaMeAccession LotGl WGFF3OtionBicRojoctBwSsrrpkTAxonoiACompcncrts (Coro)OencmeR
10、ecent activity目 Panax notoginscng iso 匕cvosome 9. whole 滬Q Panax(123355)注意:但是我下載后導入mVISTA,結果顯示只注釋了前而一半的基因,后一半序列沒有注釋,我 也暫時沒搞懂,所以,后來就在網上下了一個perl腳本,來自于簡書的mVISTA格式文件:由 Perl腳本處理GenBank注釋文件而來,然后把NCBI上下載的參考序列的gb文 件轉換成了 mVISTA格式文件。重復序列(RepeatMasker的選擇)我們建議掩蔽一個堿基序列以獲得更好的比對結果。您可以提交掩碼或非掩碼序列。如果 提交了一個掩碼序列,英重復的堿基
11、序列被替換為字母“N”,請在下拉菜單中選擇“one- celled/do not maskn選項。我們還接受輕度掩蔽序列,其中重復的元素以小寫字母顯示,而序列的苴余部 分以大寫字母顯示。在這種情況下,你需要在菜單中選擇 softmasked 選項。如果你的序列是非掩碼的,我們的服務器將用RepeatMasker來掩蓋重復序列。請在菜單中 為您的具體序列選擇一個特任的掩碼。如果你不希望你的序列被掩碼,選擇“one- celled/do not mask”。反向互補選擇您想要對第二個序列進行反向互補的比對(如果沒有同源性,請嘗試這樣做)。監管 VISTA(rVISTA)訪問 RegulatoryV
12、ISTA(rVISTA)access我們的服務器可以預測轉錄因子結合位點,通過對結果序列運行Regulatory VISTA (rVISTA)o rVISTA的最大尺寸限制是20IG有關此工具的信息,請參閱rVISTA說明。結果在提交你的序列幾分鐘后,你將收到來自vista的電子郵件,提供給你一個個人 網 絡鏈接,從那里你可以訪問你的分析結果。下而是結果頁。它列出了您提交的每個生物體,并為您提供了三個查看選項。這三個選項 是:文本瀏覽器(TextBrowser):提供所有詳細信息一一序列、比對、保守序列統汁等;VISTA瀏覽器 (Vista Browser):是一個交互式可視化工具,可以動態瀏
13、覽結果的比對,調整VISTA曲線和保存序 列參數;和一個PDF文件(PDF):這是一個靜態的VISTA比對結果圖。Base (reference)Input and output files DynamicVistaorganism(sequences八 alignments, etc.)VisualizationImagesequencelTextBrowse rVista BrowserPDFsequence2TextBrowserVista BrowserPDFsequenc&3TextBrowserVista BrowserPDF在表的底部有一個鏈接,允許您凋整保存和可視化參數。通過點
14、擊它,用戶可以改變某些 參數,這些參數用于計算保守區域和顯示每對提交序列的VISTA圖。諳注意,這些參數也可以在 使用VISTA瀏用器(VISTA Browser)時動態調整。TextBrowser這個鏈接將以文本格式顯示分析的結果。You are browsing diiinp_r Chimp is the basealigned with:galagomouseother organismsInunanratusing the SLAG AN alignment pm gram Al 1 gnment prog ram在頁而的頂部是一個橫幅,顯示比對好的生物體。在較暗的標題區域中列出的序列
15、充當基礎或 叫參考(要選擇一個不同的參考,返回到結果頁而并單擊所需的參考序列劃稱旁邊的文本瀏覽器 鏈接L這個橫幅還列出了用于比對序列的程序。Coordinates on base sequeneo/sequence 1 ligl7_liia: 1-504513ATi?taBrowser-view region in vista BrowserGet CNS: seauence 1Get Dotplots: seau 如 e 1 七 eauencJcns & dotplots for all displayed alignments下面是導航區域,它顯示了當前顯示區域的坐標,提供了一個到Vist
16、a瀏覽器的鏈接(見下面). 以及一個到所有保守區域列表的鏈接。此外,如果使用Shuffle-Lagan作為比對程序,將會有一 個鏈接來下載生成的比對結果的點狀圖0:hgL7 dna:l 30626L (+)mm5_dna:101829-347929 (-)Sequence length: 246.10Kbp Vista BrowserScore: 81754 alignment: sequencel- sequence2 irifa:length: 306.26Kbp抨 17 dna:293043 . 32f973 (+)cns:pdf:sequencel-sequenceQsequetice
17、l-sequeticeQseqmcel-sequenceQSequence length: 31.93KbpOverlap=13218bp1115人:101859.133436 (+)Sequencelength: 31.58KbpVista ErowsetScore: 425alignment: sequencel- sequence2mfa:sequencel- sequence2cns:s e queue e 1 - s e接下來是主表,其中列出了相對參考生物體生成的每次比對。每一行都是一個單獨的比 對 結果。除最后一列外,每一列都是指提交分析的序列。最后一列包含與整個比對有關的信息。每
18、一行的第一個單元格還包含這個特泄比對的VISTA圖的預覽,這允許你快速評估這個比 對的質量,并看到重合部分。通過觀察表格中的一行,你可以看到每個生物體的哪個部分與哪個部分比對上了。“Sequence鏈接將返回一個參與比對的fasta格式的生物體序列片段。單擊VISTABrowser”鏈接將 啟動設置為以所選有機體為參考的VISTA瀏覽器,并將坐標設亶為所選比對的坐標。最后一列提供了一些關于人類可讀的、MFA (multi-fasta對齊)格式的鏈接,一個單獨使用 這種比對的保守區域列表,以及單獨使用這種比對的pdf圖的鏈接。如果被檢查的區域是20K或 更少,可以執行rVISTA分析,并且rVI
19、STA的鏈接也會顯示在這里。最新! !最后一欄還提供了對比對rankVISTA分析結果的鏈接。點擊這里閱讀更多關于 RankVISTA 的信息。VISTA Browser單擊VISTA瀏覽器鏈接將啟動程序,并選擇相應的生物體作為基礎/參考序列。VISTA瀏 覽 器是一個交互式的Java程序,設計來可視化多個比對結果。瀏覽器清晰的顯示界而可以 很容易 地跨多個物種識別高度保守的區域。詳細的幫助和說明可以在這里獲得: HYPERLINK /vgb2help.shtmL /vgb2help.shtmLPDFPDF文件是比對結果和找到的保守區域的可視化顯示方式。mVISTA圖片最明顯的特征是 “峰谷”
20、圖。這張圖顯示了在任何給左的坐標下,兩種生物之間的保守區域百分比(或者是差異 百分比,如果你使用cVISTA選項)。頂部和底部百分比界限顯示在每一行的右邊。不同保存區域的顏色對應于該區域的注釋。默認情況下,粉色區域是保守的非編碼序列” (“CNS” ),深藍色區域是外顯子exons,淺藍色區域是非翻譯區UTRs。堿基序列中的空格由圖下 面的紅色線條部分表示。顏色圖例匯總在顯示器的左上角。表示基因的箭頭畫在圖的上方,指向基因的方向。外顯子和非翻譯區在mVISTA主圖上都是 彩色的。如果有足夠的空間,基因名稱都會出現在箭頭下方。重復直接顯示在圖的正上方,根據 圖左側的方案著色。圖下的灰色線顯示contigs,在草圖draft序列的情況下,contigs會被編號。注意:最后得到的結果都是一個pdf的文件,pdf格式是矢量圖格式,因此你就可以盡情編借啦, 只要你用的pdf編借器有編輯功能(如下圖所示),你就能隨意調動那些基因注釋的大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 政治訴訟題目大全及答案
- 2025年中國1-羥基苯并三氮唑行業投資前景及策略咨詢研究報告
- 2025年中國消渴平片行業投資前景及策略咨詢研究報告
- 2025年中國方坯、板坯連鑄機成套設備行業投資前景及策略咨詢研究報告
- 2025年中國小圓瓶貼標機行業投資前景及策略咨詢研究報告
- 2025年中國雙缸油冷發動機行業投資前景及策略咨詢研究報告
- 單招食品專業考試題庫及答案
- 超聲科實訓考試題庫及答案
- 本科c語言期末考試題及答案
- 包河區社工考試題及答案
- 濕疹護理課件教學課件
- 相關方需求和期望表
- 胃腸內鏡護士進修匯報
- 23J916-1 住宅排氣道(一)
- 生物基復合材料的LCA(生命周期評估)
- 【核心素養目標】人教版物理九年級 13.1分子熱運動 教案
- 第四課 拗音 課件初中日語人教版七年級第一冊
- 廣東省廣州市天河區2023-2024學年八年級下學期期末物理模擬試卷
- 甲乙方施工合同范本
- 嬰幼兒配方乳粉市場銷售管理規范
- 教科版四年級下冊科學期末測試卷含完整答案(各地真題)
評論
0/150
提交評論