生物信息學實驗教學大綱20141_第1頁
生物信息學實驗教學大綱20141_第2頁
生物信息學實驗教學大綱20141_第3頁
生物信息學實驗教學大綱20141_第4頁
生物信息學實驗教學大綱20141_第5頁
已閱讀5頁,還剩4頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、一實驗項目名稱:核酸和蛋白質序列數據的使用實驗目的:了解常用的序列數據庫,掌握基本的序列數據信息的查詢方法。教學基本要求:了解和熟悉NCBI核酸和蛋白質序列數據庫,可以使用BLAST進行序列搜索,解讀BLAST搜索結果,可以對蛋白質序列的結構域搜索,解讀蛋白質序列信息,可以在蛋白質三維數據庫中查詢相關結構信息并進行顯示。實驗內容提要:在序列數據庫中查找某條基因序列(insulin),通過相關一系列數據庫的搜索、比對與結果解釋,回答以下問題:1. 該基因的基本功能?2. 編碼的蛋白質序列是怎樣的?3. 該蛋白質有沒有保守的功能結構域 (NCBI CD-search)? 4. 該蛋白質的功能是怎樣

2、的?5. 該蛋白質的三級結構是什么?如果沒有的話,和它最相似的同源物的結構是什么樣子的?給出示意圖。實驗類型:綜合性必修或選修:必修使用的主要儀器:可以訪問國際互聯網的計算機。二實驗項目名稱:雙序列比對實驗目的:練習使用動態規劃算法進行雙序列比對;理解打分矩陣和參數對雙序列比對結果的影響;理解動態規劃算法的原理。教學基本要求:動態規劃算法是序列比對最基本的算法,可以確保找到最優比對。分為全局比對(Needleman-Wunch algorithm)和局部比對算法(Smith-Waterman algorithm)。通過本實驗的練習,更好的理解動態規劃算法。實驗內容提要:對如下的兩條序列進行雙序

3、列比對分析: Drosophila Sex-lethal proteinASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAFVDFTSEMDSQRAIKVLNG Mouse Huc RBDMDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGFVNYSDPNDADKAINTLNGL這些蛋白質包含一個RNA識別模體(RNA Recognition Motif,RRM)。該模體包含兩個高度保守的兩個功能區RNP1和RNP2(已用紅色標記)。通過ebi網站的在線工具完成練習()。1. RNP1和RNP2是否得到

4、比對? 選擇至少三個(差別大的)空位罰分和延伸值來進行比對,2a. 算法是否找到RNP1和 RNP2的正確比對?b. 當空位開啟罰分高時,結果發生什么變化?c. 當空位延伸罰分高時,結果發生什么變化? d. 為什么k個連續的空位罰分要小于k個間隔的空位罰分?使用PAM250矩陣重復上述過程。3. 比對結果是否發生變化?繼續進行這兩條序列的局部比對,通過ebi網站的在線工具完成練習,網址:()4a. RNP1和RNP2是否在局部比對中得到比對?b. 局部比對的生物學意義是什么?c. 為什么在這種比對中我們選擇局部比對而不是全局比對? 采用不同的打分參數和其它打分矩陣。5. 比對結果發生了什么變化

5、? 實驗類型:綜合性必修或選修:必修使用的主要儀器:可以訪問國際互聯網的計算機。三實驗項目名稱:序列的點陣分析實驗目的:點陣分析是雙序列分析最直觀的工具,通過本實驗了解點陣分析的原理和方法。教學基本要求:了解和熟悉點陣分析的原理和參數對分析結果的影響,可以對結果進行解讀和解釋。實驗內容提要:本實驗在如下網址完成:首先學習根據dotlet的在線教程,快速學習其基本使用方法和參數設置。然后進行如下的序列分析。回答問題:點陣分析的基本原理是什么?1. 重復序列通過點陣分析可以很容易的發現序列中的重復,果蠅的一個蛋白質(索引號碼:P24014)中具有幾個重復片段,請通過dotlet分析,找到這些序列重

6、復的片段。SLIT_DROME (P24014):MAAPSRTTLMPPPFRLQLRLLILPILLLLRHDAVHAEPYSGGFGSSAVSSGGLGSVGIHIPGGGVGVITEARCPRVCSCT GLNVDCSHRGLTSVPRKISADVERLELQGNNLTVIYETDFQRLTKLRMLQLTDNQIHTIERNSFQDLVSLERLDISNNVI TTVGRRVFKGAQSLRSLQLDNNQITCLDEHAFKGLVELEILTLNNNNLTSLPHNIFGGLGRLRALRLSDNPFACDCHLSW LSRFLRSATRLAPYTRCQSPSQLKGQNVADLH

7、DQEFKCSGLTEHAPMECGAENSCPHPCRCADGIVDCREKSLTSVPVTL PDDTTDVRLEQNFITELPPKSFSSFRRLRRIDLSNNNISRIAHDALSGLKQLTTLVLYGNKIKDLPSGVFKGLGSLRLLL LNANEISCIRKDAFRDLHSLSLLSLYDNNIQSLANGTFDAMKSMKTVHLAKNPFICDCNLRWLADYLHKNPIETSGARCE SPKRMHRRRIESLREEKFKCSWGELRMKLSGECRMDSDCPAMCHCEGTTVDCTGRRLKEIPRDIPLHTTELLLNDNELGR ISSDGLFG

8、RLPHLVKLELKRNQLTGIEPNAFEGASHIQELQLGENKIKEISNKMFLGLHQLKTLNLYDNQISCVMPGSFE HLNSLTSLNLASNPFNCNCHLAWFAECVRKKSLNGGAARCGAPSKVRDVQIKDLPHSEFKCSSENSEGCLGDGYCPPSCT CTGTVVACSRNQLKEIPRGIPAETSELYLESNEIEQIHYERIRHLRSLTRLDLSNNQITILSNYTFANLTKLSTLIISYN KLQCLQRHALSGLNNLRVVSLHGNRISMLPEGSFEDLKSLTHIALGSNPLYCDCGLKWFSDWIKL

9、DYVEPGIARCAEPEQ MKDKLILSTPSSSFVCRGRVRNDILAKCNACFEQPCQNQAQCVALPQREYQCLCQPGYHGKHCEFMIDACYGNPCRNNAT CTVLEEGRFSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFCSPEFNPCANGAK CMDHFTHYSCDCQAGFHGTNCTDNIDDCQNHMCQNGGTCVDGINDYQCRCPDDYTGKYCEGHNMISMMYPQTSPCQNHEC KHGVCFQPNAQGSDYLCRCHPGYTGKWCEYLTSISFVHNNS

10、FVELEPLRTRPEANVTIVFSSAEQNGILMYDGQDAHLAV ELFNGRIRVSYDVGNHPVSTMYSFEMVADGKYHAVELLAIKKNFTLRVDRGLARSIINEGSNDYLKLTTPMFLGGLPVDP AQQAYKNWQIRNLTSFKGCMKEVWINHKLVDFGNAQRQQKITPGCALLEGEQQEEEDDEQDFMDETPHIKEEPVDPCLEN KCRRGSRCVPNSNARDGYQCKCKHGQRGRYCDQGEGSTEPPTVTAASTCRKEQVREYYTENDCRSRQPLKYAKCVGGCGN QCCAAKIVRRRKVRMVC

11、SNNRKYIKNLDIVRKCGCTKKCY從uniprot或者genbank數據庫中的注釋信息進行進一步確認你所發現的結果。2. 低復雜度區域惡性瘧原蟲抗原蛋白前體(索引號碼:P69192)具有一段低復雜度區域的序列,通過點陣分析找到這個特點。SERA_PLAFG (P69192):MKSYISLFFILCVIFNKNVIKCTGESQTGNTGGGQAGNTVGDQAGSTGGSPQGSTGASQPGSSEPSNPVSSGHSVSTVSVSQTSTSSEKQDTIQVKSALLKDYMGLKVTGPCNENFIMFLVPHIYIDVDTEDTNIELRTTLKETNNAISFESNSGS

12、LEKKKYVKLPSNGTTGEQGSSTGTVRGDTEPISDSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSESLPANGPDSPTVKPPRNLQNICETGKNFKLVVYIKENTLIIKWKVYGETKDTTENNKVDVRKYLINEKETPFTSILIHAYKEHNGTNLIESKNYALGSDIPEKCDTLASNCFLSGNFNIEKCFQCALLVEKENKNDVCYKYLSEDIVSNFKEIKAETEDDDEDDYTEYKLTESIDNILVKMFKTNENNDKSELIKLEEVDDSLKLELMNYCSLLKDVDTTGTLDNYGMGN

13、EMDIFNNLKRLLIYHSEENINTLKNKFRNAAVCLKNVDDWIVNKRGLVLPELNYDLEYFNEHLYNDKNSPEDKDNKGKGVVHVDTTLEKEDTLSYDNSDNMFCNKEYCNRLKDENNCISNLQVEDQGNCDTSWIFASKYHLETIRCMKGYEPTKISALYVANCYKGEHKDRCDEGSSPMEFLQIIEDYGFLPAESNYPYNYVKVGEQCPKVEDHWMNLWDNGKILHNKNEPNSLDGKGYTAYESERFHDNMDAFVKIIKTEVMNKGSVIAYIKAENVMGYEFSGKKVQNLCGDDTADHAV

14、NIVGYGNYVNSEGEKKSYWIVRNSWGPYWGDEGYFKVDMYGPTHCHFNFIHSVVIFNVDLPMNNKTTKKESKIYDYYLKASPEFYHNLYFKNFNVGKKNLFSEKEDNENNKKLGNNYIIFGQDTAGSGQSGKESNTALESAGTSNEVSERVHVYHILKHIKDGKIRMGMRKYIDTQDVNKKHSCTRSYAFNPENYEKCVNLCNVNWKTCEEKTSPGLCLSKLDTNNECYFCYV四實驗項目名稱:多序列比對實驗目的:在序列分析中,多序列比對具有廣泛的應用,是許多其他分析的基礎和前提,比如進化發生分析、構建位置特異

15、性打分矩陣、找到一致序列等,本實驗的目的是熟悉多序列比對相關的操作和編輯方法。教學基本要求:了解和熟悉多序列比對的原理和基本方法。實驗內容提要:1. 使用CLUSTALW 算法,比對一組蛋白質序列,該序列屬于RAD51-RECA,在DNA的復制階段起重要作用,這些序列可以從NCBI genbank、Uniprot等序列服務器獲取,序列的索引號碼為:P25454,P25453,P0A7G6,P48295。將這些序列保存在一個文本文件。如果查詢到的序列不止一個的話,選擇第一個。P25454.1 Full=DNA repair protein RAD51MSQVQEQHISESQLQYGNGSLMS

16、TVPADLSQSVVDGNGNGSSEDIEATNGSGDGGGLQEQAEAQGEMEDEAYDEAALGSFVPIEKLQVNGITMADVKKLRESGLHTAEAVAYAPRKDLLEIKGISEAKADKLLNEAARLVPMGFVTAADFHMRRSELICLTTGSKNLDTLLGGGVETGSITELFGEFRTGKSQLCHTLAVTCQIPLDIGGGEGKCLYIDTEGTFRPVRLVSIAQRFGLDPDDALNNVAYARAYNADHQLRLLDAAAQMMSESRFSLIVVDSVMALYRTDFSGRGELSARQMHLAKFMRALQRLADQFGVAVVV

17、TNQVVAQVDGGMAFNPDPKKPIGGNIMAHSSTTRLGFKKGKGCQRLCKVVDSPCLPEAECVFAIYEDGVGDPREEDEP25453.1 Full=Meiotic recombination protein DMC1MSVTGTEIDSDTAKNILSVDELQNYGINASDLQKLKSGGIYTVNTVLSTTRRHLCKIKGLSEVKVEKIKEAAGKIIQVGFIPATVQLDIRQRVYSLSTGSKQLDSILGGGIMTMSITEVFGEFRCGKTQMSHTLCVTTQLPREMGGGEGKVAYIDTEGTFRPERIKQIAEGYELD

18、PESCLANVSYARALNSEHQMELVEQLGEELSSGDYRLIVVDSIMANFRVDYCGRGELSERQQKLNQHLFKLNRLAEEFNVAVFLTNQVQSDPGASALFASADGRKPIGGHVLAHASATRILLRKGRGDERVAKLQDSPDMPEKECVYVIGEKGITDSSDP0A7G6.2 Full=Protein RecA; AltName: Full=Recombinase AMAIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGRIVEIYGPESSGKTTLTLQVIAAAQR

19、EGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPDTGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAGNLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGSETRVKVVKNKIAAPFKQAEFQILYGEGINFYGELVDLGVKEKLIEKAGAWYSYKGEKIGQGKANATAWLKDNPETAKEIEKKVRELLLSNPNSTPDFSVDDSEGVAETNEDFP48295.2 Full=Protein RecA; AltNa

20、me: Full=Recombinase AMAGTDREKALDAALAQIERQFGKGAVMRMGDRTQEPIEVISTGSTALDIALGVGGLPRGRVVEIYGPESSGKTTLTLHAVANAQKAGGQVAFVDAEHALDPEYAKKLGVDIDNLILSQPDNGEQALEIVDMLVRSGALDLIVIDSVAALVPRAEIEGEMGDSHVGLQARLMSQALRKITSALNQSKTTAIFINQLREKIGVMFGSPETTTGGRALKFYASVRLDIRRIETLKDGTDAVGNRTRVKVVKNKVAPPFKQAEFDILYGQGISREGGLIDMG

21、VEHGFVRKAGAWYTYEGDQLGQGKENARNFLKDNPDLADEIERKIKEKLGVGVRPDAAKAEAATDAAAAADTAGTDDAAKSVPAPASKTAKATKATAVKSa. 練習使用EBI CLUSTALW();b. 將序列數據拷貝復制到窗口中;c. 采用默認參數進行比對;回答:clustalw算法的基本原理?2. 在BAliBASE網站查找一組蛋白質:1csy。這些蛋白質的一致性為20-40%,屬于BAliBASE參考序列1。正確的比對結果網址如下:主要的比對信息截圖如下所示:注意:這里的比對是基于結構信息的,所以是正確的。是序列的部分比對,為什么?這五條序列

22、的名稱和索引號碼如下:Sequence Name SWISSPROT Accession1csy P43405 1gri P29354(已被分為P62993和P62994,序列完全一致,任選一條即可。)1aya P35235 2pna P23727 1bfi P27986 sp|P43405|KSYK_HUMAN Tyrosine-protein kinase SYK OS=Homo sapiens GN=SYK PE=1 SV=1MASSGMADSANHLPFFFGNITREEAEDYLVQGGMSDGLYLLRQSRNYLGGFALSVAHGRKAHHYTIERELNGTYAIAGGRTH

23、ASPADLCHYHSQESDGLVCLLKKPFNRPQGVQPKTGPFEDLKENLIREYVKQTWNLQGQALEQAIISQKPQLEKLIATTAHEKMPWFHGKISREESEQIVLIGSKTNGKFLIRARDNNGSYALCLLHEGKVLHYRIDKDKTGKLSIPEGKKFDTLWQLVEHYSYKADGLLRVLTVPCQKIGTQGNVNFGGRPQLPGSHPATWSAGGIISRIKSYSFPKPGHRKSSPAQGNRQESTVSFNPYEPELAPWAADKGPQREALPMDTEVYESPYADPEEIRPKEVYLDRKLLTLEDKELGSGNF

24、GTVKKGYYQMKKVVKTVAVKILKNEANDPALKDELLAEANVMQQLDNPYIVRMIGICEAESWMLVMEMAELGPLNKYLQQNRHVKDKNIIELVHQVSMGMKYLEESNFVHRDLAARNVLLVTQHYAKISDFGLSKALRADENYYKAQTHGKWPVKWYAPECINYYKFSSKSDVWSFGVLMWEAFSYGQKPYRGMKGSEVTAMLEKGERMGCPAGCPREMYDLMNLCWTYDVENRPGFAAVELRLRNYYYDVVNsp|P62993|GRB2_HUMAN Growth factor receptor-bou

25、nd protein 2 OS=Homo sapiens GN=GRB2 PE=1 SV=1MEAIAKYDFKATADDELSFKRGDILKVLNEECDQNWYKAELNGKDGFIPKNYIEMKPHPWFFGKIPRAKAEEMLSKQRHDGAFLIRESESAPGDFSLSVKFGNDVQHFKVLRDGAGKYFLWVVKFNSLNELVDYHRSTSVSRNQQIFLRDIEQVPQQPTYVQALFDFDPQEDGELGFRRGDFIHVMDNSDPNWWKGACHGQTGMFPRNYVTPVNRNVsp|P62994|GRB2_RAT Growth factor rece

26、ptor-bound protein 2 OS=Rattus norvegicus GN=Grb2 PE=1 SV=1MEAIAKYDFKATADDELSFKRGDILKVLNEECDQNWYKAELNGKDGFIPKNYIEMKPHPWFFGKIPRAKAEEMLSKQRHDGAFLIRESESAPGDFSLSVKFGNDVQHFKVLRDGAGKYFLWVVKFNSLNELVDYHRSTSVSRNQQIFLRDIEQVPQQPTYVQALFDFDPQEDGELGFRRGDFIHVMDNSDPNWWKGACHGQTGMFPRNYVTPVNRNVsp|P35235|PTN11_MOUSE Ty

27、rosine-protein phosphatase non-receptor type 11 OS=Mus musculus GN=Ptpn11 PE=1 SV=2MTSRRWFHPNITGVEAENLLLTRGVDGSFLARPSKSNPGDFTLSVRRNGAVTHIKIQNTGDYYDLYGGEKFATLAELVQYYMEHHGQLKEKNGDVIELKYPLNCADPTSERWFHGHLSGKEAEKLLTEKGKHGSFLVRESQSHPGDFVLSVRTGDDKGESNDGKSKVTHVMIRCQELKYDVGGGERFDSLTDLVEHYKKNPMVETLGTVLQLKQPLN

28、TTRINAAEIESRVRELSKLAETTDKVKQGFWEEFETLQQQECKLLYSRKEGQRQENKNKNRYKNILPFDHTRVVLHDGDPNEPVSDYINANIIMPEFETKCNNSKPKKSYIATQGCLQNTVNDFWRMVFQENSRVIVMTTKEVERGKSKCVKYWPDEYALKEYGVMRVRNVKESAAHDYTLRELKLSKVGQALLQGNTERTVWQYHFRTWPDHGVPSDPGGVLDFLEEVHHKQESIVDAGPVVVHCSAGIGRTGTFIVIDILIDIIREKGVDCDIDVPKTIQMVRSQRSGMVQTEAQYRF

29、IYMAVQHYIETLQRRIEEEQKSKRKGHEYTNIKYSLVDQTSGDQSPLPPCTPTPPCAEMREDSARVYENVGLMQQQRSFRsp|P23727|P85A_BOVIN Phosphatidylinositol 3-kinase regulatory subunit alpha OS=Bos taurus GN=PIK3R1 PE=1 SV=1MSAEGYQYRALYDYKKEREEDIDLHLGDILTVNKGSLVALGFSDGQEAKPEEIGWLNGYNETTGERGDFPGTYVEYIGRKKISPPTPKPRPPRPLPVAPGPSKTEADSEQQ

30、ASTLPDLAEQFAPPDVAPPLLIKLVEAIEKKGLECSTLYRTQSSSNPAELRQLLDCDTASLDLEMFDVHVLADAFKRYLLDLPNPVIPVAVSSELISLAPEVQSSEEYIQLLKKLIRSPSIPHQYWLTLQYLLKHFFKLSQTSSKNLLNARVLSELFSPLLFRFPAASSENTEHLIKIIEILISTEWNERQPAPALPPKPPKPTTVANNGMNNNMSLQDAEWYWGDISREEVNEKLRDTADGTFLVRDASTKMHGDYTLTLRKGGNNKLIKIFHRDGKYGFSDPLTFNSVVELINHYRNE

31、SLAQYNPKLDVKLLYPVSKYQQDQVVKEDNIEAVGKKLHEYNTQFQEKSREYDRLYEDYTRTSQEIQMKRTAIEAFNETIKIFEEQCQTQERYSKEYIEKFKREGNETEIQRIMHNYEKLKSRISEIVDSRRRLEEDLKKQAAEYREIDKRMNSIKPDLIQLRKTRDQYLMWLTQKGVRQKKLNEWLGNENTEDQYSLVEDDEDLPHHDEKTWNVGSSNRNKAENLLRGKRDGTFLVRESSKQGCYACSVVVDGEVKHCVINKTATGYGFAEPYNLYSSLKELVLHYQHTSLVQHNDSLN

32、VTLAYPVYAQQRRsp|P27986|P85A_HUMAN Phosphatidylinositol 3-kinase regulatory subunit alpha OS=Homo sapiens GN=PIK3R1 PE=1 SV=2MSAEGYQYRALYDYKKEREEDIDLHLGDILTVNKGSLVALGFSDGQEARPEEIGWLNGYNETTGERGDFPGTYVEYIGRKKISPPTPKPRPPRPLPVAPGSSKTEADVEQQALTLPDLAEQFAPPDIAPPLLIKLVEAIEKKGLECSTLYRTQSSSNLAELRQLLDCDTPSVDLEM

33、IDVHVLADAFKRYLLDLPNPVIPAAVYSEMISLAPEVQSSEEYIQLLKKLIRSPSIPHQYWLTLQYLLKHFFKLSQTSSKNLLNARVLSEIFSPMLFRFSAASSDNTENLIKVIEILISTEWNERQPAPALPPKPPKPTTVANNGMNNNMSLQDAEWYWGDISREEVNEKLRDTADGTFLVRDASTKMHGDYTLTLRKGGNNKLIKIFHRDGKYGFSDPLTFSSVVELINHYRNESLAQYNPKLDVKLLYPVSKYQQDQVVKEDNIEAVGKKLHEYNTQFQEKSREYDRLYEEYTRTSQE

34、IQMKRTAIEAFNETIKIFEEQCQTQERYSKEYIEKFKREGNEKEIQRIMHNYDKLKSRISEIIDSRRRLEEDLKKQAAEYREIDKRMNSIKPDLIQLRKTRDQYLMWLTQKGVRQKKLNEWLGNENTEDQYSLVEDDEDLPHHDEKTWNVGSSNRNKAENLLRGKRDGTFLVRESSKQGCYACSVVVDGEVKHCVINKTATGYGFAEPYNLYSSLKELVLHYQHTSLVQHNDSLNVTLAYPVYAQQRR 從序列數據庫獲取這五條序列的fasta格式,放在一個文本文件中,選擇ebi網站上(/)的至少四個多序列

35、比對工具(如MAFFT、MUSCLE、CLUSTALW2、Clustal Omega、T-Coffee、DbClustal等)進行分析,將結果保存(Download Alignment File)。擴展名為.fasta。現在用一個多序列比對軟件,比如bioedit、seaview或者jalview(下載安裝windows版本的比較快速)導入剛才保存的多序列比對結果文件(擴展名為.fasta的)。比較各個算法的比對結果(BAliBASE數據只是這些多序列比對的一部分,而我們得到的是這幾條序列全長上的比對),所以需要將不相關的列刪除掉或者用其它符號替代,或者也可以不作處理,找到相關部分就可以了。比

36、較多序列比對的結果,與BAliBASE上的相比,那個的結果更好些?你是如何評價結果的?3. 序列徽標序列徽標(sequence logo)是一個常用的直觀的多序列比對的圖示工具,對如下的一些序列,創建其序列徽標。網址:。dinD 32-52aactgtatataaatacagttdinG 15-35 tattggctgtttatacagtadinH 77-97tcctgttaatccatacagcadinI 19-39acctgtataaataaccagtalexA-1 28-48tgctgtatatactcacagcalexA-2 7-27aactgtatatacacccagggpolB(d

37、inA) 53-73gactgtataaaaccacagccrecA 59-79tactgtatgagcatacagtarecN-1 49-69tactgtatataaaaccagttrecN-2 27-47tactgtacacaataacagtarecN-3 9-29TCCTGTATGAAAAACCATTAruvAB 49-69cgctggatatctatccagcasosC 18-38tactgatgatatatacaggtsosD 14-34cactggatagataaccagcasulA 22-42tactgtacatccatacagtaumuDC 20-40tactgtatataaa

38、aacagtauvrA 83-103 tactgtatattcattcaggtuvrB 75-95aactgtttttttatccagtauvrD 57-77atctgtatatatacccagct將結果保存,簡單的解釋一下。sequence logo圖中包含的意義有什么?五實驗項目名稱:序列數據庫的搜索比對實驗目的:通過該實驗理解BLAST和PSI-BLAST的基本原理。教學基本要求:可通過BLAST和PSI-BLAST進行數據庫的搜索比對,對結果進行恰當的解釋。可利用BLAST進行相關序列的檢索,利用PSI-BLAST進行遠相關序列的檢索。理解兩個工具的原理。實驗內容提要:本實驗中,查詢下

39、面這條序列在細菌(bacterial)中的同源序列。gi|76828014|gb|BC107078.1| Homo sapiens G protein-coupled receptor, family C, group 5, member D, mRNA (cDNA clone MGC:129714 IMAGE:40027066), complete cds ATGTACAAGGACTGCATCGAGTCCACTGGAGACTATTTTCTTCTCTGTGACGCCGAGGGGCCATGGGGCATCATTCTGGAGTCCCTGGCCATACTTGGCATCGTGGTCACAATTCTGCT

40、ACTCTTAGCATTTCTCTTCCTCATGCGAAAGATCCAAGACTGCAGCCAGTGGAATGTCCTCCCCACCCAGCTCCTCTTCCTCCTGAGTGTCCTGGGGCTCTTCGGACTCGCTTTTGCCTTCATCATCGAGCTCAATCAACAAACTGCCCCCGTACGCTACTTTCTCTTTGGGGTTCTCTTTGCTCTCTGTTTCTCATGCCTCTTAGCTCATGCCTCCAATCTAGTGAAGCTGGTTCGGGGTTGTGTCTCCTTCTCCTGGACGACAATTCTGTGCATTGCTATTGGTTGCAGTCTGTTGCA

41、AATCATTATTGCCACTGAGTATGTGACTCTCATCATGACCAGAGGTATGATGTTTGTGAATATGACACCCTGCCAGCTCAATGTGGACTTTGTTGTACTCCTGGTCTATGTCCTCTTCCTGATGGCCCTCACATTCTTCGTCTCCAAAGCCACCTTCTGTGGCCCGTGTGAGAACTGGAAGCAGCATGGAAGGCTCATCTTTATCACTGTGCTCTTCTCCATCATCATCTGGGTGGTGTGGATCTCCATGCTCCTGAGAGGCAACCCGCAGTTCCAGCGACAGCCCCAGTGGGACGACCC

42、GGTCGTCTGCATTGCTCTGGTCACCAACGCATGGGTTTTCCTGCTGCTGTACATCGTCCCTGAGCTCTGCATTCTCTACAGATCGTGTAGACAGGAGTGCCCTTTACAAGGCAATGCCTGCCCCGTCACAGCCTACCAACACAGCTTCCAAGTGGAGAACCAGGAGCTCTCCAGAGCCCGAGACAGTGATGGAGCTGAGGAGGATGTAGCATTAACTTCATATGGTACTCCCATTCAGCCGCAGACTGTTGATCCCACACAAGAGTGTTTCATCCCACAGGCTAAACTAAGCCCCCAGCA

43、AGATGCAGGAGGAGTATAA1a. 在NCBI中采用blastn程序,搜索上述序列,將物種限制在“Bacteria”,其它參數默認,得到幾個結果命中?E值小于0.1的有幾條?1b. 為了擴大搜索,可以對參數進行調整,將BLASTN的word size換為7,其它同上次,得到幾個命中?E值小于0.1的有幾條?1c. 選擇BLASTX,將物種限制在“Bacteria”,其它參數默認,得到幾個結果命中?E值小于0.1的有幾條?1d. 在BLASTX中,將word size調整為2,選擇BLOSUM45打分矩陣,Gap Existence 10,Gap Extension 3,將物種限制在“

44、Bacteria”,其它參數默認,得到幾個結果命中?E值小于0.1的有幾條?2. 如下序列是剛才所檢索的核酸序列對應的蛋白質序列:gi|76828015|gb|AAI07079.1| G protein-coupled receptor, family C, group 5, member D Homo sapiens MYKDCIESTGDYFLLCDAEGPWGIILESLAILGIVVTILLLLAFLFLMRKIQDCSQWNVLPTQLLFLLSVLGLFGLAFAFIIELNQQTAPVRYFLFGVLFALCFSCLLAHASNLVKLVRGCVSFSWTTILCIAIGCSLL

45、QIIIATEYVTLIMTRGMMFVNMTPCQLNVDFVVLLVYVLFLMALTFFVSKATFCGPCENWKQHGRLIFITVLFSIIIWVVWISMLLRGNPQFQRQPQWDDPVVCIALVTNAWVFLLLYIVPELCILYRSCRQECPLQGNACPVTAYQHSFQVENQELSRARDSDGAEEDVALTSYGTPIQPQTVDPTQECFIPQAKLSPQQDAGGV2a. 利用著條序列進行PSI-BLAST檢索,第一輪PSI-BLAST的參數與上述最后一次的BLASTX參數一致,即word size調整為2,選擇BLOSUM45打分矩陣,Gap Existence 10,Gap Extension 3,將物種限制在“Bacteria”,得到幾個匹配?E值小于0.1的有幾條?2b. 選擇E值小于2的序列進行下一步的PSI-BLAST迭代。得到幾個匹配?E值小于0.1的有幾條?2c. 大多數你所發現的蛋白質都具有相同的功能,是什么功能?如何進一步確定你的查詢序列與結果中的序列相關?實驗類型:綜合性必修或選修:必修使用的主要儀器:可以訪問國際互聯網的計算機。六. 實驗項目名稱:HIV病毒的進化分析實驗目的:了解和學習系統發生分析的步驟和基本方法。教學

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論