《基因組學》PPT課件.ppt_第1頁
《基因組學》PPT課件.ppt_第2頁
《基因組學》PPT課件.ppt_第3頁
《基因組學》PPT課件.ppt_第4頁
《基因組學》PPT課件.ppt_第5頁
已閱讀5頁,還剩47頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第十三章基因組學,第十三章基因工程和基因組學,第一節 基因組學 概述,基因組學(genomics) :遺傳學研究進入分子水平后發展起來的一個分支,主要研究生物體內基因組的分子特征。* 研究對象:以整個基因組為研究單位,而不以單個基因為單位作為研究對象。* 研究目標:認識基因組的結構、功能和進化;闡明整個基因組所包含的遺傳信息和相互關系;充分利用有效資源,預防和治療人類疾病。,基因組(Genome):又稱染色體組,是指一個物種單倍體的染色體數目,是生物體全部遺傳物質的總和。 基因組學(Genomics):對生物體所有基因進行基因組作圖(包括遺傳圖譜、物理圖譜、轉錄圖譜)、核苷酸序列分析、基因定位

2、和基因功能分析的一門科學。 最終目標:獲得生物體全部基因組序列,注解基因組所含的全部基因,鑒定所有基因的功能及基因間相互作用關系,并闡明基因組的復制及進化規律。,一、基因組學的概念,不同生物基因組大小,1. 人類基因組計劃 與曼哈頓原子 計劃、阿波羅登月計劃并稱的人類科學史上的重大工程。于1990年首先在美國啟 動,后有德、日、英、法、中等國的科學家先后正式加入。,(一) 人類基因組, 1990年,美國國會批準美國的“人類基因組計劃”在10月1日正式啟動。其總體規 劃是準備在15年內(19902005)至少投入30億美元,分析人類的基因組30 億個堿基對。 2003年,6國科學家宣布人類基因組

3、序列圖繪制成功,HGP的所有目標全部實現。覆蓋人類基因組所含基因區域的99%,精確率達到99.99%,比原計劃提前兩年多,耗資27億美元。,人類基因組計劃,人類基因組 核基因組DNA的總長約3109bp,含有24條線性DNA分子,最長的有250 Mb,最短的55 Mb。 30億個堿基對。 線粒體基因組是長度為16569 bp的環狀DNA分子,每個細胞平均含有800個線粒體,每個線粒體含10個基因組拷貝。 以每10cm 書寫60個字母計算,30億個堿基對連接的長度可達5 000 km,相當于北京到香港來回的距離。,為人類的基因組研究提供重要的依據。 1996年,酵母菌基因組測序。 1998年12

4、月,線蟲完整基因組序列的 2000年3月,果蠅的基因組測序 2001年12月14日,擬南芥基因組的完整圖譜。,(二) 其他生物基因組,我國超級雜交稻(秈稻)基因組計劃 2001年7月啟動 2002年4月5日Science。 材料:秈稻“9311”。 完成單位:華大基因研究中心、中科院遺傳與發育生物學研究所等12個單位。 水平:水稻基因組的總基因數約為4602255615個,工作框架圖序列已覆蓋水稻整個基因組92以上的基因。 方法:“鳥槍射擊法”,利用國產曙光2000、曙光3000超級計算機(1000億次/秒)對隨機DNA碎片進行排序和組裝。,水稻基因組計劃,國際水稻(粳稻)基因組計劃始于199

5、8年,日本、美國、中國、法國等國家和地區參加。中國負責第4號染色體:36 Mb (占910%)。,國際水稻基因組測序計劃,2002年12月21日Nature,中國第四號染色體。 材料:粳稻“日本晴”。 完成單位:中科院國家基因研究中心等4家單位。 水平:第四號染色體中的總堿基數目為0.35億堿基對,覆蓋全長序列98的區域,只剩下7個小空洞,堿基序列的精確度達到99.99%。完整測定的著絲粒序列在高等生物中屬于首次。,國際水稻基因組測序計劃,水稻是第一個完成基因組全序列測定的農作物,核基因組含有12條染色體,總長約389Mb,1號染色體最大為43.2Mb,10號染色體最小22.6Mb。全基因組預

6、測約含有4萬個基因。 水稻雙鏈閉環線粒體基因組大小為491kb,葉綠體基因組134.5kb,C值:是指一個單倍體基因組中DNA的總量。 值悖理 (C value paradox):物種的C值和它的進化復雜性之間無嚴格對應關系的現象稱為C 值悖理,是復雜生物基因組的一個普遍特征,(三) C值悖理和N值悖理,(三) C值悖理和N值悖理,N值:是指生物體所含有的基因數目。 N值悖理(N value paradox):復雜性不同的生物種屬所具有的基因數目與其生物結構的復雜性不成比例的現象。 如結構比較簡單的線蟲含有的基因數為1.9萬個, 比線蟲更復雜的果蠅基因數為1.8萬個, 水稻的基因數約4萬個,

7、最復雜的人類其基因總數約3萬個。,四、基因組學研究內容,(一)結構基因組學(structural genomics) 通過基因作圖、核苷酸序列分析確定基因組成、進行基因定位的科學。 遺傳信息在染色體上,但染色體不能直接用來測序,必須將基因組這一巨大的研究對象進行分解,使之成為較易操作的小的結構區域,這個過程就是基因作圖。完成基因組圖譜構建之后,就可以利用圖譜進行基因組序列測定和組裝。,四、基因組學研究內容,(二)功能基因組學(functional genomics) 利用結構基因組所提供的信息和產物,研究基因組功能表達的一門分支學科。 主要研究內容: 基因的識別、鑒定和克隆。包括新策略、新技術

8、、新方法的創立和各種基因組數據的建立; 基因結構與功能及其相互關系的研究。包括基因變異體的系統鑒定和目錄的繪制;基因表達譜的編制、基因結構與功能關系的鑒定、基因相互作用網絡圖的編制; 基因表達調控的研究,四、基因組學研究內容,(三)蛋白質組學(proteomics) 研究細胞內蛋白質組成及其活動規律。旨在闡明生物體全部蛋白質的表達模式及功能模式,內容包括鑒定蛋白質表達、存在方式、結構、功能和相互作用方式等。 基因是遺傳信息的攜帶者,而全部生物功能的執行者卻是蛋白質, 僅僅從基因的角度來研究是遠遠不夠的。,第 2節 基因組圖譜構建,基因組計劃的目的是獲得全基因組序列,并對其進行解讀。DNA測序每

9、次反應僅能讀取1000bp的長度,因此,基因組測序的基礎是基因組圖譜的構建。,鳥槍射擊法(shotgun) 基因組序列測定,第 2節 基因組圖譜構建,基因組測序策略 重疊群法 相互存在重疊序列的一組克隆。根據重疊群的相對位置講各個克隆首尾相連,長度可達百萬級bp。對單個重疊群,采用鳥槍法測序,然后進行組裝。這是由上而下(up to down)的測序策略。 直接鳥槍法 首先進行全基因組鳥槍法測序,再用分子標記為起點強鳥槍DNA片段組裝。這是由下而上(bottom to up)的測序策略。這種方法依賴于高密度分子標記基因組圖譜。 基因組圖譜分為遺傳圖譜和物理圖譜。,(一)遺傳標記,遺傳標記就是遺傳

10、物質的特殊的易于識別的多態性表現形式,它包括形態標記、細胞學標記、生化標記和分子標記。 形態標記:主要指可以觀察到的一些性狀,如種皮顏色、眼色、株高等。 細胞學標記:細胞學標記是指能明確顯示遺傳多態性的細胞學特征。 生化標記:主要是同工酶及種子貯藏蛋白,有時又稱蛋白質標記。 分子標記:主要指DNA水平上的標記。,DNA標記,以DNA為基礎的分子標記主要包括 基于雜交的分子標記,如RFLP。 基于PCR的分子標記,如RAPD、AFLP、SSR (又稱microsatellite )、AFLP 等。 基于DNA序列和芯片的分子標記,如SNP(single nucleotide polymorphi

11、sm)。,RAPD由Williams 等(1990)和Welsh等(1990)分別發展起來的分子標記技術。這一技術是以基因組DNA為模板,采用隨機設計的單個寡核甘酸序列(一般為10bp)為引物,通過PCR擴增,產生不連續的DNA產物,用于檢測DNA序列的多態性。,RAPD (Random amplified polymorphic DNA),重復序列 串聯重復序列(tandem repeated sequence),其重復單位首尾相連,成串排列(Flavell 1986)。 散布重復序列(interspersed repeated sequence),其重復單位與其它無關序列或單拷貝序列相間排

12、列。,SSR (simple sequence repeats) 或微衛星(microsatellite ),微衛星DNA序列或SSR又稱短串聯重復序列(short sequence repeat,STR),它是由幾個核甘酸(一般16個)為重復單位簇集而成的串聯重復序列,可隨機的分布在整個基因組的不同位置上。微衛星長度具有高度變異性,并且這種多態性常常表現復等位性,兩端的序列多是相對保守的單拷貝序列,因而可以根據兩端的序列設計一對特異引物,擴增每個位點的微衛星序列,從而揭示其長度的多態性(simple sequence length polymorphism,SSLP)。,SSR,ISSR是一

13、種新型的分子標記。與SSR相反,直接用同位素標記SSR序列,擴增2個SSR間的單拷貝序列。為了增加擴增的特異性,在引物的5和3端分別加入12個選擇性堿基,引物長度1618bp。,ISSR(inter-ssr), AFLP結合了RFLP和RAPD技術的優點。AFLP的基本原理是基于PCR的擴增基因組DNA限制性片段多態性。基因組DNA先用限制性內切酶切割,然后將雙鏈接頭(adapter)連接到DNA片段的末端,通過選擇在3端分別添加13個選擇性堿基的不同引物,選擇性地識別具有特異配對順序的酶切片段并與之結合,從而實現特異擴增。,AFLP ( Amplicon fragment length po

14、lymorphism),AFLP反應過程示意圖,遺傳信息由DNA mRNA 蛋白質。 一個典型的真核生物mRNA分子:5- U TR ( 5端轉錄非翻譯區) , ORF (開放閱讀框架) ,3- U TR ( 3端轉錄非翻譯區) ,polyA,任何一個基因,cDNA 的5端或3端的有限序列即可特異性地代表生物體某種組織某個時期的一個表達基因。EST 的數目可以顯示所代表的基因的拷貝數,EST (expressed sequence tags),從組織細胞中提取總mRNA ,構建成標準cDNA 文庫,然后從中挑取大量克隆,利用載體通用引物測出插入載體的cDNA 片段5端或3端300 - 500

15、堿基的序列。 將測序所得的EST 與dbEST 等數據庫中的數據進行比較分析,根據核酸或蛋白質序列的同源性比較,可以鑒定出哪些EST 代表已知基因,哪些EST 代表未知基因。,EST,序列標簽位點(sequence tagged site) 是一小段DNA序列。每個基因組僅1個拷貝,很容易分辨。STS要滿足2個條件: 是一段已知的序列,可據此涉及PCR引物來檢測不同DNA片斷中是否存在 這一序列。 STS在染色體上必須是獨一無二的。如果在基因組中有多個位點出現,作圖數據將含混不清。 常見的尋找STS的方法: EST、 SSLP、 隨機基因組序列,STS,單核苷酸多態性是指基因組序列中由于單個核

16、苷酸(,)的替換而引起的多態性。通常SNPs不包括堿基的插入、缺失以及重復序列拷貝數的變化。這種標記只有兩種等位基因。 人類基因組的編碼基因中有20萬個SNPs, 在非編碼區的數目可能還要多10倍以上。 單倍型:當前常用術語“happlotype”(單倍型)代替術語“allele”(等位基因)。在給定的一條染色體的緊密連鎖的位點上多個等位基因的集合,通常34個相鄰等位基因彼此靠近而構成的單倍型可作為一個整體而遺傳(稱為單倍型塊(haploblock),SNP ( single nucleotide polymorphism ),(二) 遺傳圖譜的構建,1 人類基因組遺傳圖譜的構建 人類的遺傳圖

17、譜是利用家系分析法,在對8個家系的134個成員的分析中(186個減數分裂),主要根據5264個STR標記繪制而成的。 利用這些家系的資料繪制第1至22號染色體圖譜。對于X染色體圖譜,還利用了來自另外12個家系,170個成員(105個減數分裂)的資料繪制而成。 最后,將5264個標記定位在2335個位點(其中有些標記相距很近而作為一個位點)。,2 植物基因組遺傳圖譜的構建,作圖群體 常用的遺傳作圖群體有F2群體、回交群體、加倍單倍體(double haploid,DH)群體、重組近交系(recombinant inbred lines,RIL)群體、近等基因系(nearisogenic line

18、s,NIL)群體等(徐云碧,1994)。 遺傳標記的染色體定位,標記間的連鎖分析 LINKAGE、Mapmaker、JoinMap,二、 物理圖譜繪制,(一 )限制性作圖 (二)基于克隆的基因組作圖 (三) 原位雜交 (四)序列標簽位點(STS)作圖 (五) 人類基因組圖譜,重疊群(contigous DNA clones, contigs) 從1個感興趣的位置開始,利用第1個元件的末端部分來辯別第2個元件,沿染色體“行走”(walk)。通過鑒別目標位點兩測的2個DNA標記,從1個標記向另1個標記的行走。 沿染色體鑒別一系列重疊群是大規模研究的基礎。在特定區域的染色體行走可以提供分離通過遺傳圖

19、譜定位在該區域基因的方法。集中全部染色體的重疊群,可以為以后研究提供有效克隆來源。 染色體行走考慮的根本是每“步”的大小,較大的步加快積聚相鄰克隆的進程。,(二) 基于克隆的基因組作圖,區域作圖 Regional mapping,區域作圖 Regional mapping,Minimal tiling path selected for sequencing.,區域作圖 Regional mapping,(三) 原位雜交,熒光原位雜交(fluorescent in situ hybridization, FISH) 基因組原位雜交(genome in situ hybridization, G

20、ISH ),(四)序列標簽位點(STS)作圖,輻射雜交系 是含有另一種生物染色體片斷的嚙齒類細胞。帶有人類染色體片段的輻射雜交系 DNA庫 YAC/BAC 克隆作圖 獲得大分子DNA克隆文庫以后,用PCR的方法檢測STS,根據重疊的STS標記繪制克隆連鎖圖。,(四)序列標簽位點(STS)作圖,當兩個片段含有同一STS順序時,則這兩個片段彼此重疊。如果它們彼此鄰接,這兩個STS總會同時出現在相同片段上。如果它們相距甚遠,有時會在同一片段,有時則在不同片段。 要將一組STS作圖定位,必需收集來自同一染色體或整個基因組隨機斷裂的DNA片段。不同DNA片段之間有各種可能的重疊,可以覆蓋整個作圖區段。依

21、次采用單個STS挑出它們所在的DNA片段,根據它們彼此的重疊關系可以逐段繪DNA物理圖。,生物信息學是現代生物技術與計算機科學的結合,收集、加工和分析生物資料和信息的學科。 應用生物信息學可以將來自不同的基因組理論和應用綜合并標準化,利用大量的生物信息資料了解遺傳網絡系統、信號傳遞及相互關系,計算機還可進行一些生物模擬研究。 利用生物信息學能夠分析從微生物、動物、植物以及人類基因組序列測定產生的大量資料,闡明遺傳信息。 研究內容兩大類:DNA 數據分析; 蛋白質數據分析。,第三節生物信息學(bioinformatics),基因芯片,基因芯片(gene chip),又稱DNA微陣列(microarray),是由大量DNA或寡核苷酸探針密集排列所形成的探針陣列,其基本原理是通過雜交檢測信息。利用基因芯片,可以實現基因信息的大規模檢測。,生物信息學的應用,(一)發現新基因和新的單核苷酸多態性 在研究生物的基因時,不斷的發現新的基因。一般說

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論