生物信息學實驗指導書_第1頁
生物信息學實驗指導書_第2頁
生物信息學實驗指導書_第3頁
生物信息學實驗指導書_第4頁
生物信息學實驗指導書_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學實驗指導書生物技術教學部 譚軍 編重慶郵電學院生物信息學院2005年08月20日前 言生物信息學是上世紀90年代初人類基因組計劃(HGP)以來,隨著基因組學、蛋白組學等新興學科的建立,逐漸發展起來的生物學、數學和計算機信息科學的一門交叉應用學科。目前生物信息學的研究領域主要包括基于生物序列數據的整理和注釋、生物信息挖掘工具開發及利用這些工具揭示生物學基礎理論知識等領域。生物信息學作為新型交叉應用學科,可以依托本校已有的計算機科學、信息學、生物學和數學等學科優勢,充分展現投入少、見效快、起點高的特色,推動學校學科建設和本科教學水平。本實驗指導書中的8個實驗均設計為綜合性開放實驗,面向生

2、物信息學院全體本科學生和研究生,以及全校對生物信息學感興趣的其他專業學生開放。生物信息學實驗室將提供系統的保障,包括采用mail服務器和Linux帳號管理等進行實驗過程管理和支持。限選生物信息學及試驗的生物技術專業本科生至少選擇其中5個實驗,并不少于8個學時,即為課程要求的0.5個學分。其他選修者按照課時和學校相關規定計算創新學分。目 錄前言 1目錄 2實驗一 熟悉生物信息學網站及其數據的生物學意義 3實驗二 應用BLAST進行序列比對 4實驗三 應用ClustalX(W)進行多序列聯配 5實驗四 ESTs分析 6實驗五 應用Primer3設計RACE引物 7實驗六 ORF預測 8實驗七 蛋白

3、質結構功能分析 9實驗八Emboss工具包的熟悉和使用 10實驗一 熟悉生物信息學網站及其數據的生物學意義實驗目的:培養學生利用互聯網資源獲取生物信息學研究狀況和相關數據的能力,熟悉生物信息學相關的一些重要國內外網站,及其核酸序列、蛋白質序列及代謝途徑等功能相關數據庫,學會下載生物相關的信息數據,了解不同的數據文件格式和其中重要的生物學意義。實驗原理:利用互連網資源檢索相關的國內外生物信息學相關網站:如NCBI、SANGER、TIGR、KEGG、SWISSPROT、Ensemble、中科院北京基因組研究所、北大生物信息學中心等,下載其中的相關數據,如fasta、genbank格式的核酸和蛋白質

4、序列、pathway等數據,理解其重要的生物學意義。實驗內容:1瀏覽和搜索至少10個國外和至少5個國內生物信息學相關網站,并描述網站特征;2下載各網站的代表性數據各10條(組)以上,并說明其生物學意義;3討論各網站適合做何種生物信息學研究的平臺,并設計一個研究設想。實驗報告:1各網站網址及特征描述;2代表性數據的下載和生物學意義的描述;3討論:這些生物信息學相關網站的信息資源,可以被哪些生物信息學研究所利用。參考書目:生物信息學概論羅靜初 等譯,北京大學出版社,2002;生物信息學手冊郝柏林 等著,上海科技出版社,2004;生物信息學實驗指導胡松年 等著,浙江大學出版社,2003。實驗二 利用

5、BLAST進行序列比對實驗目的:了解BLAST及其子程序的原理和基本參數,熟練地應用網絡平臺和Linux計算平臺進行本地BLAST序列比對,熟悉BLAST結果的格式和內容并能描述其主要意義,同時比較網上平臺和本地平臺的優缺點。實驗原理:利用試驗一下載的核酸和蛋白質序列,提交到NCBI或者其他擁有BLAST運算平臺的網頁上,觀察其基本參數設定庫文件類型,并得到計算結果;同時在本地服務器上學會用formatdb格式化庫文件,并輸入BLAST命令進行計算,獲得結果文件。實驗內容:1向網上BLAST服務器提交序列,得到匹配結果;2本地使用BLAST,格式化庫文件,輸入命令行得到匹配結果;3對結果文件進

6、行簡要描述,闡述生物學意義。實驗報告:1闡述BLAST原理和比對步驟;2不同類型BLAST的結果及其說明;3討論:不同平臺運行BLAST的需求比較。參考書目和網頁:生物信息學概論羅靜初 等譯,北京大學出版社,2002;生物信息學實驗指導胡松年 等著,浙江大學出版社,2003; /Education/BLASTinfo/information3.html。實驗三 利用ClustalX(W)進行多序列聯配實驗目的:掌握用Clustal X(W)工具及其基本參數,對具有一定同源性和相似性的核酸與蛋白質序列進行聯配和聚類分析,由此對這些物種的親緣關系

7、進行判斷,并且對這些序列在分子進化過程中的保守性作出估計。實驗原理:首先對于輸入的每一條序列,兩兩之間進行聯配,總共進行n*(n-1)/2次聯配,這一步是通過一種快速的近似算法實現的,其得分用來計算指導樹,系統樹圖能用于指導后面進行的多序列聯配的過程。系統樹圖是通過UPGMA方法計算的。在系統樹圖繪制完以后,輸入的所有序列按照得分高低被分成n-1個組,然后再對組與組之間進行聯配,這一步用的是Myers和Miller算法。實驗內容:1明確軟件所支持的輸入文件格式,搜集整理出合適的數據;2在windows環境運行Clustal X,在Linux環境運行Clustal W;3實驗結果及分析,用TRE

8、EV32或NjplotWIN95生成NJ聚類圖。 實驗報告:1整理好的符合Clustal的序列數據;2提交數據網頁記錄和各步驟記錄;3提供聚類圖和多序列聯配圖,并說明意義。參考書目:生物信息學概論羅靜初 等譯,北京大學出版社,2002;生物信息學實驗指導胡松年 等著,浙江大學出版社,2003。實驗四 ESTs分析實驗目的:熟悉使用一系列生物信息學分析工具對測序得到的ESTs序列數據進行聚類處理,由此對獲得表達基因的豐度等相關信息,并且對這些表達基因進行功能的初步詮釋,為后續實驗通過設計RACE引物獲得全長基因,以及進一步的功能注釋和代謝途徑分析做好準備。實驗原理:首先用crossmatch程序

9、去除ESTs原始序列中的載體成分和引物成分,然后用phrap生成congtig和singlet,用blast程序進一步將有同源性的contig和singlet進行功能聚類,最后通過blast對聚類獲得的cluster進行功能注釋。在實驗過程中將用到一些本實驗室寫好的perl程序用于連接各數據庫和工具軟件。實驗內容:1運行crossmatch程序,并用perl程序處理結果獲得ESTs序列;2運行phrap程序,并用perl程序提取congtig和singlet;3運行blastn和blastx程序,用perl程序分別獲得cluster和初步功能注釋結果。實驗報告:1實驗各步驟記錄和中間結果文件;

10、2說明各perl程序在ESTs處理過程中的作用;3舉例簡要說明結果文件中數據的生物學意義。參考書目:生物信息學概論羅靜初 等譯,北京大學出版社,2002;基因表達序列標簽(EST)數據分析手冊胡松年 等著,浙江大學出版社,2005。實驗五 利用Primer3設計RACE引物實驗目的:熟悉PCR引物設計工具Primer3的網絡計算平臺和Linux運算平臺,了解Primer3的一些基本參數,能夠根據實驗需要選擇相應的引物設計平臺設計PCR引物。實驗原理:PCR實驗是當代分子生物學的基本實驗之一,由于目標序列和實驗目的的不同,相應設計引物的要求也不一樣。本實驗延續ESTs分析結果,對于其中需要獲得全

11、長的基因進行RACE引物的設計,即5和3RACE引物,配合接頭序列設計單向引物,并模擬練習通過連接獲得全長的基因CDS序列。最后設計已知全長基因序列的PCR擴增引物。實驗內容:1從網站下載并安裝Primer3;2分別在網上和Linux運算平臺設計 5和3RACE引物;3拼接全長CDS序列,并設計擴增引物。實驗報告:1實驗各步驟使用的數據、運算平臺、結果文件記錄;2比較不同引物設計平臺和不同PCR實驗的差別;3討論:如何應用Primer3為基因芯片實驗設計克隆大規模序列。參考書目和網頁:生物信息學概論羅靜初 等譯,北京大學出版社,2002;生物信息學實驗指導胡松年 等著,浙江大學出版社,2003

12、; /cgi-bin/primer3/primer3_www.cgi。實驗六 ORF預測實驗目的:了解ORF預測的作用,能夠運用ORF分析軟件Getorf,并能用這些程式進行簡單的分析。實驗原理:通過序列的ORF預測,為建立cDNA文庫,差減雜交得到均質化文庫,cDNA序列測定,生物信息學分析,同源性比較,功能預測做必要的準備。實驗內容:1、從上述網站下載最新版Getorf,并參考以下網站所介紹的方法安裝:http:/bioweb.pasteur.fr/seqanal/interfaces/getorf.html.2、熟悉Getorf軟件的主要的功能

13、、輸入文件的格式、以及相關參數的作用等。3、利用Getorf進行簡單的分析,記錄分析步驟和結果。實驗報告:要求實驗報告闡述實驗步驟,簡介Getorf的功能,記錄實例分析結果,記錄實驗中出現的問題和解決方案,以及實驗的總結。參考書目和網頁:生物信息學概論羅靜初 等譯,北京大學出版社,2002;生物信息學實驗指導胡松年 等著,浙江大學出版社,2003; http:/bioweb.pasteur.fr/seqanal/interfaces/getorf.html。實驗七 蛋白質結構功能分析實驗目的:掌握蛋白質一級、二級和三級結構分析的一些工具,了解與蛋白質功能分析相關的數據庫,如:SwissProt

14、蛋白質序列數據庫、PDB結構數據庫等。實驗原理:現有的蛋白質功能分析工具和平臺都是根據已知的蛋白質結構進行注釋分類、總結結構規律建立參考數據庫,并以此作為預測未知蛋白質結構和功能的依據。實驗內容:1、熟悉與蛋白質分析相關的數據庫資源,如SwissProt蛋白質序列數據庫、PDB結構數據庫、PROSITE。2、利用PredictProtein對蛋白質序列進行分析。3、利用SSPRED對蛋白質序列進行分析。4、比較兩種方法得到的結果。5、利用swiss-model對蛋白質序列進行三維結構預測。實驗報告:要求實驗報告詳細闡述實驗步驟,結果,及其對實驗的總結。參考書目和網頁:生物信息學概論羅靜初 等譯

15、,北京大學出版社,2002;生物信息學實驗指導胡松年 等著,浙江大學出版社,2003; http:/www.embl-heidelberg.de/predictprotein/predictprotein.html;http:/www.dl.ac.uk/CCP/CCP11/DISguISE/structure_prediction/sspredmsu.html;/swissmod/SWISS-MODEL.html。實驗八 Emboss工具包的熟悉和使用實驗目的:了解Emboss工具包中的各軟件功能,會用Emboss中的分析工具分析序列的相關特征,熟悉Emboss工具包中常用應用軟件的使用,并能用這些軟件進行簡單的序列分析。實驗原理:歐洲分子生物學開放軟件系統(Emboss)最初是為英國測序中心用戶開發的一個序列分析綜合軟件包,包括一系列應用程序,例如EST聚類分析、序列模體快速搜索、核算序列模式分析、密碼子使用分析、基因識別工具、蛋白質序列模體識別等。Emboss系統可從網址ftp:/ /pub/EMBOSS/獲取。 實驗內容:1、從上述網站下載最新版Emboss,并參考以下網站所介紹的方法安裝:2、熟悉Emboss系統,了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論