(分子生物學本科生課件)生物信息學_第1頁
(分子生物學本科生課件)生物信息學_第2頁
(分子生物學本科生課件)生物信息學_第3頁
(分子生物學本科生課件)生物信息學_第4頁
(分子生物學本科生課件)生物信息學_第5頁
已閱讀5頁,還剩14頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、( (分子生物學本科分子生物學本科生課件生課件) )生物信息生物信息學學 2、基因進化基因進化 生物信息學的根本目標是探究隱藏在生物數據后生物信息學的根本目標是探究隱藏在生物數據后面的生物學知識。對于基因組研究來說,一個重要的面的生物學知識。對于基因組研究來說,一個重要的研究方向就是分子序列的進化。通過比較不同生物基研究方向就是分子序列的進化。通過比較不同生物基因組中各種結構成分的異同,可以大大加深我們對生因組中各種結構成分的異同,可以大大加深我們對生物進化的認識。這項研究已逐步形成一個稱為比較基物進化的認識。這項研究已逐步形成一個稱為比較基因組學的新學科。從各種基因結構與成分的進化,密因組學

2、的新學科。從各種基因結構與成分的進化,密碼子使用的進化,到進化樹的構建,各種理論上和實碼子使用的進化,到進化樹的構建,各種理論上和實驗上的課題都等待生物信息學家的研究。驗上的課題都等待生物信息學家的研究。 3、藥物設計藥物設計 生物信息學所提供的數據資料,可以指導對藥生物信息學所提供的數據資料,可以指導對藥物作用靶位的選定和藥物分子的設計。它的研究包括物作用靶位的選定和藥物分子的設計。它的研究包括大分子結構功能的模擬和預報,藥物分子與大分子結大分子結構功能的模擬和預報,藥物分子與大分子結合的模擬,關鍵性基因的致病機制,以及生物分子同合的模擬,關鍵性基因的致病機制,以及生物分子同源性的分析,生物

3、分子在指定細胞的分布和位點等。源性的分析,生物分子在指定細胞的分布和位點等。人類基因組及其他基因組測序工作的進行,為新藥研人類基因組及其他基因組測序工作的進行,為新藥研制提供了許多潛在的靶點。后基因組時代為我們提供制提供了許多潛在的靶點。后基因組時代為我們提供了大量靶點的信息,同時這些信息又是不完整的,很了大量靶點的信息,同時這些信息又是不完整的,很多時候甚至對于靶點的結構和功能還不清楚。因此迫多時候甚至對于靶點的結構和功能還不清楚。因此迫切需要發展能夠適應這種要求的新的藥物設計方法。切需要發展能夠適應這種要求的新的藥物設計方法。 4、基因區域預測基因區域預測 所謂基因區域的預測,一般是指預測

4、所謂基因區域的預測,一般是指預測DNA順序中順序中編碼蛋白質的部分,即外顯子部分。不過目前基因區域編碼蛋白質的部分,即外顯子部分。不過目前基因區域的預測已從單純外顯子預測發展到整個基因結構的預測。的預測已從單純外顯子預測發展到整個基因結構的預測。這些預測綜合各種外顯子預測的算法和人們對基因結構這些預測綜合各種外顯子預測的算法和人們對基因結構信號信號(如如TATA box和加尾信號和加尾信號)的認識,預測出可能的完的認識,預測出可能的完整基因。預測外顯子的基本算法,早期有最長整基因。預測外顯子的基本算法,早期有最長ORF(openreading frame)法。近年來同源比較算法也法。近年來同源

5、比較算法也被應用于預測可能的基因。許多基因預測的程序都已經被應用于預測可能的基因。許多基因預測的程序都已經整合了同源比較算法,比如著名的整合了同源比較算法,比如著名的GRAIL 程序。除程序。除上述提到的算法之外,目前被應用于基因預測的算法還上述提到的算法之外,目前被應用于基因預測的算法還有:法則系統有:法則系統( rule2based system);語言學;語言學(linguistic)系統;線性判別分析系統;線性判別分析(Linear DiscriminantAnalysis,LDA);決策樹;決策樹( decision tree);spliced align2ment算法;傅利葉分析算

6、法;傅利葉分析(Fourier analysis)等。等。 5、基因功能預測基因功能預測 基因功能預測常用的方法有:序列同源比基因功能預測常用的方法有:序列同源比較,同源比較的發展方向,尋找蛋白質家較,同源比較的發展方向,尋找蛋白質家族保守順序。用于將序列在序列數據庫中族保守順序。用于將序列在序列數據庫中進行同源比較的進行同源比較的3 種流行算法是:種流行算法是:Smit2Waterman 算法,算法,FASTA 算法和算法和BLAST算法。算法。Feng2Doolittle 算法是較常算法是較常用的多序列對齊算法。其他的新算法包括用的多序列對齊算法。其他的新算法包括HMM 方法,方法,Gib

7、bs sampling以及處理多以及處理多結構域蛋白質家族的算法。結構域蛋白質家族的算法。 6、蛋白質結構預測蛋白質結構預測 生命活動的執行者是基因的表達產物生命活動的執行者是基因的表達產物蛋白蛋白質,而研究基因的根本目的在于解釋整個生命活質,而研究基因的根本目的在于解釋整個生命活動的規律。因此,隨著大量基因的破譯及鑒定,動的規律。因此,隨著大量基因的破譯及鑒定,這些基因編碼的蛋白質正成為下一步研究的熱點。這些基因編碼的蛋白質正成為下一步研究的熱點。后基因組中一個重要的方面是蛋白質功能的研究。后基因組中一個重要的方面是蛋白質功能的研究。隨著結構基因組的進行,越來越多的蛋白質在測隨著結構基因組的

8、進行,越來越多的蛋白質在測定空間結構后尚不清楚其生物功能,因此蛋白質定空間結構后尚不清楚其生物功能,因此蛋白質功能預測日益受到重視。研究者將利用所發展的功能預測日益受到重視。研究者將利用所發展的基于關鍵作用部位的篩選方法進行蛋白質功能的基于關鍵作用部位的篩選方法進行蛋白質功能的預測。這不僅是分子生物學實驗問題,也是一個預測。這不僅是分子生物學實驗問題,也是一個生物信息學問題。生物信息學問題。 三、后基因組時代三、后基因組時代( post - ( post - genome era) genome era) 的基因組信息的基因組信息學學 1、從結構基因組、從結構基因組( structural g

9、enome) 到功到功能基因組能基因組( f unctional genome) (1)DNA芯片芯片(DNA chips)和微陣列制樣和微陣列制樣(microarray) (2)蛋白質組)蛋白質組(proteome)研究技術研究技術 2、后基因組時代的基因組信息學研究重點、后基因組時代的基因組信息學研究重點 (1)完整基因組的比較研究完整基因組的比較研究 (2)基因表達網絡)基因表達網絡 (3)非編碼區功能預測)非編碼區功能預測 1、從結構基因組從結構基因組( structural genome) 到功能基因組到功能基因組( f unctional genome) 當前當前,雖然包括構建遺傳

10、連鎖圖、物理圖、確定新基因以及測序雖然包括構建遺傳連鎖圖、物理圖、確定新基因以及測序在內的任務還沒有最終完成在內的任務還沒有最終完成,但完成這些任務只是時間和投入的問題但完成這些任務只是時間和投入的問題,并不存在學術障礙。可是我們雖然知道了基因并不存在學術障礙。可是我們雖然知道了基因,知道了核酸序列知道了核酸序列,但我但我們不知道它們是如何發揮功能的們不知道它們是如何發揮功能的,或者說它們是如何按照特定的時間、或者說它們是如何按照特定的時間、空間進行基因表達的空間進行基因表達的,表達量有多少。很多實驗表明表達量有多少。很多實驗表明,在不同的組織中在不同的組織中表達基因的數目差別是很大的表達基因

11、的數目差別是很大的,腦中基因表達的數目最多腦中基因表達的數目最多,約有三萬個。約有三萬個。有的組織中只有幾十或幾百個基因表達。即使同一組織在不同的個體生有的組織中只有幾十或幾百個基因表達。即使同一組織在不同的個體生長發育階段表達基因的種類、數量也是不同的。因此獲得基因的功能表長發育階段表達基因的種類、數量也是不同的。因此獲得基因的功能表達譜達譜,將存在于人類基因組上的靜的基因圖譜將存在于人類基因組上的靜的基因圖譜,向時間、空間維上展開向時間、空間維上展開是新一階段基因組研究的核心。如果把前一階段的人類基因組研究稱為是新一階段基因組研究的核心。如果把前一階段的人類基因組研究稱為結構基因組結構基因

12、組( st ruct ural genome),那么下一個研究階段那么下一個研究階段(post-genome era)應轉入功能基因組研究應轉入功能基因組研究(functional genome)。 為了得到基因表達的功能譜,國際上在核酸和蛋白質兩個層次上都為了得到基因表達的功能譜,國際上在核酸和蛋白質兩個層次上都發展了新技術。在核酸層次上的新技術是發展了新技術。在核酸層次上的新技術是DNA芯片,在蛋白質層次上芯片,在蛋白質層次上則是二維凝膠電泳和測序質譜技術。則是二維凝膠電泳和測序質譜技術。 (1)DNA芯片芯片(DNA chips)和微陣列和微陣列制樣制樣(microarray) 所謂所謂

13、DNA 芯片是一類生物芯片芯片是一類生物芯片(biochips),它,它是按特定的方式在每平方厘米范圍內固定有幾萬到幾是按特定的方式在每平方厘米范圍內固定有幾萬到幾十萬個十萬個DNA探針的硅片、玻片或金屬片。由于探針的硅片、玻片或金屬片。由于DNA芯片具有高集成度,高并行處理能力,可自動化分析,芯片具有高集成度,高并行處理能力,可自動化分析,因此它可對不同組織來源,不同細胞類型,不同生理因此它可對不同組織來源,不同細胞類型,不同生理狀態的基因表達進行監測,獲得基因表達的功能譜。狀態的基因表達進行監測,獲得基因表達的功能譜。現在監測酵母基因組功能的芯片已經完成。與此同時,現在監測酵母基因組功能的

14、芯片已經完成。與此同時,DNA芯片還可用來進行芯片還可用來進行DNA的快速測序,的快速測序,DNA突變突變檢測,藥物篩選等。檢測,藥物篩選等。 (2)蛋白質組蛋白質組(proteome)研究技術研究技術 蛋白質組就是基因組的蛋白質產物。近幾年在蛋白質組就是基因組的蛋白質產物。近幾年在DNA芯片發展的同時,也發展了一套在蛋白質水平芯片發展的同時,也發展了一套在蛋白質水平上研究功能基因組的技術上研究功能基因組的技術,這就是二維凝膠電泳和測這就是二維凝膠電泳和測序質譜技術。序質譜技術。1996年已經實現了在一個年已經實現了在一個1618cm的凝膠上分離的凝膠上分離3000個蛋白質個蛋白質, 有了這樣

15、的技術有了這樣的技術, 一些一些簡單有機體象簡單有機體象M. genitalium (生殖道枝原體生殖道枝原體) 或或H. influenzae (噬血流感菌噬血流感菌) 的整個蛋白質組可展現在的整個蛋白質組可展現在一個二維凝膠片上。測序質譜技術發展也很快一個二維凝膠片上。測序質譜技術發展也很快, 當前當前MALDI-TOF MS(matrix-assisted laserdesorption/ ionisation time-of-flight mass spectrometry)已可在一天之內分析幾千個蛋白質。已可在一天之內分析幾千個蛋白質。無論是生物芯片還是蛋白質組技術的發展都更強烈無論

16、是生物芯片還是蛋白質組技術的發展都更強烈地依賴于生物信息學的理論與工具。地依賴于生物信息學的理論與工具。 2、后基因組時代的基因組信息學研究后基因組時代的基因組信息學研究重點重點 隨著功能基因組實驗技術的深入隨著功能基因組實驗技術的深入,大量的數據庫將大量的數據庫將成為支持這些技術的必然組分成為支持這些技術的必然組分,象蛋白質序列數據庫象蛋白質序列數據庫(如如SWISS-PROT)、核酸序列數據庫、核酸序列數據庫(如如GenBank)、結構域數據庫結構域數據庫(如如PROSITE)、三維結構數據庫、三維結構數據庫(如如PDB)、二維凝膠電泳數據庫、二維凝膠電泳數據庫(如如SWISS-2DPAG

17、E)、翻譯后修飾數據庫翻譯后修飾數據庫(如如O-GL YCBASE)、基因組數據、基因組數據庫庫(如如OMIM)、代謝數據庫等。沒有這些數據庫、代謝數據庫等。沒有這些數據庫,新技新技術是很難應用的。另外在芯片設計以及數據分析上術是很難應用的。另外在芯片設計以及數據分析上,也也需要從理論到軟件的支持。除了為實驗服務之外需要從理論到軟件的支持。除了為實驗服務之外,基因基因組信息學本身也面臨新的重要研究課題和方向。組信息學本身也面臨新的重要研究課題和方向。 (1)完整基因組的比較研究完整基因組的比較研究 在后基因組時代在后基因組時代,生物信息學家面對的不僅是序列和基因生物信息學家面對的不僅是序列和基

18、因而是越來越多的完整基因組。科學家們對最早的七個完整基因而是越來越多的完整基因組。科學家們對最早的七個完整基因組所做的分析就得到了很多有意義的結論。這些生物體都是能組所做的分析就得到了很多有意義的結論。這些生物體都是能獨立存活的獨立存活的, 最大的是啤酒酵母最大的是啤酒酵母, 它有它有5932個基因個基因, 最小的是生最小的是生殖道枝原體殖道枝原體, 它只有它只有470個基因。有了這些資料人們就能估計個基因。有了這些資料人們就能估計,最小獨立生活的生物至少需要多少基因最小獨立生活的生物至少需要多少基因,這些基因是如何使它這些基因是如何使它們活起來的們活起來的? 基因組研究還發現基因組研究還發現

19、, 鼠和人的基因組大小相似鼠和人的基因組大小相似, 都都含有約三十億堿基對含有約三十億堿基對,基因的數目也類似。可是鼠和人差異確基因的數目也類似。可是鼠和人差異確如此之大如此之大,這是為什么這是為什么?當我們比較鼠和人的基因組就會發現當我們比較鼠和人的基因組就會發現,盡盡管兩者基因組大小和基因數目類似管兩者基因組大小和基因數目類似,但基因組的組織卻差別很但基因組的組織卻差別很大。例如存在于鼠一號染色體上的基因卻分布到人的一、二、大。例如存在于鼠一號染色體上的基因卻分布到人的一、二、五、六、八、十三、十八號七個染色體上了。或許鼠與人的表五、六、八、十三、十八號七個染色體上了。或許鼠與人的表型差異

20、就來自基因組的組織。同樣型差異就來自基因組的組織。同樣, 有的科學家估計不同人種有的科學家估計不同人種間基因組的差別不大于間基因組的差別不大于0. 1 %; 人猿間差別不大于人猿間差別不大于1 %。因此其。因此其表型差異不僅應從基因、表型差異不僅應從基因、DNA序列找原因序列找原因,也應考慮染色體組也應考慮染色體組織上的差異。總之織上的差異。總之, 由完整基因組研究所導致的比較基因組學由完整基因組研究所導致的比較基因組學必將為后基因組研究開辟新的領域。必將為后基因組研究開辟新的領域。 (2)基因表達網絡基因表達網絡 長期以來令人驚異與困惑的是長期以來令人驚異與困惑的是:生命并不是一群分生命并不

21、是一群分子的堆積子的堆積,它是高度有組織的。那么這種有序性的起源它是高度有組織的。那么這種有序性的起源是什么是什么? 自本世紀六十年代開始于物理學領域的非平衡自本世紀六十年代開始于物理學領域的非平衡與非線性研究說明與非線性研究說明:正常的生物體是一個不斷地與外界正常的生物體是一個不斷地與外界進行物質和能量交換的開發系統進行物質和能量交換的開發系統, 生物體是遠離熱力學生物體是遠離熱力學平衡的平衡的, 生物體中大量的過程是不可逆的。因而生物才生物體中大量的過程是不可逆的。因而生物才能生長、發育、繁殖和新陳代謝能生長、發育、繁殖和新陳代謝, 能進化能進化,是有序的。在是有序的。在分子水平對基因表達調

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論