測序技術介紹_第1頁
測序技術介紹_第2頁
測序技術介紹_第3頁
測序技術介紹_第4頁
測序技術介紹_第5頁
已閱讀5頁,還剩66頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、測序技術介紹測序技術介紹測序技術發展史一代測序1954 年,Whitfeld 等用化學降解法測定多聚核糖核苷酸序列,是關于DNA 測序技術的較早報道。1977 年,Sanger 發明DNA 雙脫氧核苷酸末端終止測序法(chain terminator sequencing),A.M.Maxam 和W. Gilbert 發明DNA 化學降解測序法(chemical degradation sequencing),2 項技術的出現,標志第1 代測序技術誕生。Sanger 測序法的原理每一次DNA 測序反應都由4 個獨立反應組成;由于DNA 雙鏈中核苷酸以3,5-磷酸二酯鍵相連,因此在測序過程中摻入

2、2,3-雙脫氧核苷三磷酸ddNTP(不含3-OH),當ddNTP 位于DNA 雙鏈的延伸末端時, 無羥基3端不能與其他脫氧核苷酸形成3,5-磷酸二酯鍵, 因此,DNA 雙鏈合成便終止;若在終止位點摻入ddATP,則新生鏈末端為A,若摻入ddTTP、ddCTP、ddGTP,相應地,新生鏈末端則是T、C 或G。該測序技術的具體做法如下:將模板、引物、4 種dNTP(其中含有一種為放射性同位素標記的核苷酸)與DNA 聚合酶共同保溫,形成的混合物包含許多長短不一的片段, 最后利用聚丙烯酰胺變性凝膠電泳(SDS-PAGE)分離該混合物,得到放射性同位素自顯影條帶圖譜,人們依據凝膠電泳圖即可讀出DNA 雙

3、鏈的堿基序列組成。自動化測序實際上已成為當今 dna序列分析的主流。美國PE ABI公司已生產出373型、377型、310型、3700和3100型等dna測序儀,其中310型是臨床檢測實驗室中使用最多的一種型號。測序過程中的常見問題分析在進行DNA測序時,緊接引物的10 30 Bases有時不一定能完全讀清楚。 由于DNA結構上的原因,有時會出現反應中途無法進行之情況。如:G/C rich; G/C Cluster;Poly A、 Poly T的連續結構等。此外,另一種情況為反應中途出現的套峰現象,此種情況一般為DNA結構中的重復序列,造成測序用引物和模板之間有二個以上的結合位點。具體問題分析

4、如下:1 1: 測序結果有很多套峰,出現很多測序結果有很多套峰,出現很多N N值值原因分析:PCR產物直接進行測序,在PCR產物長度以后將無反應信號,機器將產生許多N值。 在序列的起始端出現N值,主要是由于有未去除的染料單體造成的干擾峰,是機器無法正確判讀出位何值。有時,引物二聚體或者起始端小片段的丟失,也會出現N值。模版本身含雜合序列,有等位基因。測序過程中的常見問題分析2 2:為什么找不到我的:為什么找不到我的PCRPCR引物序列?引物序列?用PCR引物作為測序引物,所測序列是從引物3末端后第一個堿基開始的,所以就找不到您的測序引物了。可以進行反向測序,得到引物的反向互補序列。還可以將所測

5、片段克隆到適當載體中,由于通用引物與插入序列有一段距離,就可以測出您的引物序列。3 3:測序結果和文獻資料不一樣,為什么:測序結果和文獻資料不一樣,為什么? ?原因有很多,如同一種動物,在不同的種族之間,或者不同的個體之間,基因序列也不一定完全一樣。如果是PCR產物克隆測序, 那還有PCR過程中的錯配因素等等。我們提供的測序結果是客戶樣品序列的忠實結果,不能保證和文獻序列完全一致。4 4:過短的:過短的PCRPCR產物為什么不適于直接測序?產物為什么不適于直接測序?首先由于一般的PCR產物純化試劑盒要求產物片段大于200bp,過短的PCR產物不能進行純化;再者,測序的前50bp和后50bp的序

6、列是不好的,所以不適于直接測序。測序過程中的常見問題分析5 5:酒精如果沒有揮發完全:酒精如果沒有揮發完全, ,在約在約300bp300bp處會出現連續異常的處會出現連續異常的G G峰,酒精揮發時峰,酒精揮發時間過長會導致間過長會導致DNADNA斷裂。斷裂。第一個峰,重疊干擾。如果不判讀為干擾峰,那就說明樣品不純,如果是基因組DNA,就很好地說明了樣品為雜合子,該位點可能存在SNP現象(T/G)。如果判讀為干擾峰,我們只需認定樣品此處堿基為T為行了。第二個峰,錯位干擾。如果不判讀為干擾峰,則說明樣本可能比預期多一個堿基(G),如果判讀為干擾峰,我們仍只需認定樣品此處堿基為T為行了。測序過程中的

7、常見問題分析6 6:為什么用:為什么用PCRPCR產物或質粒測序時,經常會出現套峰現象產物或質粒測序時,經常會出現套峰現象? ?下圖是pGEM-T載體測序的結果,在83位點處測序結果出現雙峰,即模板中含有兩個或兩個以上的相同載體,但是插入片段不同。 解決辦法:重新挑取單克隆或者重新提取質粒。需要注意的是,重新進行PCR反應或者酶切鑒定僅能證明該克隆含有插入片段,并不足以證明模板的單一。測序過程中的常見問題分析7 7:polypoly結構的測序結果結構的測序結果以polyT為例,在polyA/T結構之后往往出現移碼現象,而在polyG/C之后會往往導致測序信號的衰減。解決辦法:使用反向引物對模板

8、進行測序,測到該poly結構處,即可完成模板全長的拼接。第二代測序技術(Next-Generation Sequencing)各自的優點454 測序平臺得到的片段能夠達到400 bp,并且讀長的質量高;Solexa 測序平臺的性價比最高,在數據量相同的情況下,測序成本僅為454 測序平臺的1/10;SOLiD 測序平臺準確度能夠達到99.94%,在片段覆蓋率為15時,測序準確度可接近100%。 2005年底,454公司推出第一個基于焦磷酸測序原理的高通量基因組測序系統Genome Sequencer 20 System,這是核酸測序技術發展史上里程碑式的事件。隨后,羅氏公司以1.55億美元收購

9、了454公司,并在2006年推出了更新的GS FLX測序系統,該系統可在10小時的運行中獲得100萬條讀長(reads),46億個堿基信息(base pair),且準確率達到99%以上。2008年,GS FLX系統再次升級,通量提高了5倍,讀長和準確率也有所增加。雖然454 GS測序平臺也許不是市場占有率最高的測序儀,但截至2011年3月,利用該系統進行研究的論文已發表超過1000余篇,而它在讀長上的優勢明顯勝于另兩套系統,因此在從頭測序(de novo)和宏基因組測序(meta genome)方面有著不可替代的地位。 2006年,Solexa公司也推出了自己的NGS系統Genome Anal

10、yzer,簡稱GA。這套基于DNA簇(DNA cluster)、橋式PCR(Bridge PCR)和可逆阻斷(Reversible terminator)等核心技術的系統具有高通量、低錯誤率、低成本、應用范圍廣等優點。2007年,Illumina公司以6億美元的高價收購了Solexa,使GA得以商品化。GA最早期的版本一次運行可獲得1Gb的數據,因此也有1Gb Analyzer的含義,而最新的Hiseq2000平臺則能夠在10天的運行中獲得300Gb以上的數據,讀取的堿基長度達到150bp左右。更有消息稱,Illumina已完成了600Gb的運行測試并在部分客戶中開展了前期體驗,Tb(1000

11、Gb)級的測試Run也將于年內進行。據不完全統計,Illumina公司已售出超過600臺/套GA IIx和Hiseq2000平臺,2010年僅深圳華大基因研究院一家就購買了128臺Hiseq2000,一舉成為全球最大的基因組測序與分析中心,Illumina公司在測序領域的影響力由此可見一斑。 在Sanger測序時代,美國應用生物系統公司(ABI)一直是該行業的龍頭老大,其壟斷地位無人能撼,從早期的377到全自動化的3730 xl,ABI的測序儀被廣泛應用在基因組學研究的各個方面。然而在第二代測序技術迅猛發展之初,ABI起步較晚,顯得有些漫不經心。直到2005年454公司推出GS平臺,ABI的領

12、先地位受到威脅,這才開始發力,迅速收購了研發NGS的一家小公司Agencourt,并于2007年推出了它的SOLiD測序平臺。此后SOLiD不斷升級,目前已到SOLiD 5版本(SOLiD 5500 xl)。SOLiD的全稱是Sequencing by Oligo Ligation Detection,即寡聚物連接檢測測序,其基本原理是通過熒光標記的8堿基單鏈DNA探針與模板配對連接,發出不同的熒光信號,從而讀取目標序列的堿基排列順序。在該方法下,目標序列的所有堿基都被讀取了兩遍,因此SOLiD最大的優勢就是它的高準確率。據悉,SOLiD 5平臺的測序通量已達到30Gb/天,成本低于60美元/

13、Gb,準確率高達99.99%。并且由于SOLiD系統采用的不是PCR反應進行DNA合成與測序,因此對于高GC含量的樣本,SOLiD系統具有非常大的優勢。2021-7-7454測序原理焦磷酸測序法(Pyrosequencing)的原理2021-7-7454測序原理焦磷酸測序法(Pyrosequencing)的原理2021-7-7454測序原理焦磷酸測序法(Pyrosequencing)的原理2021-7-7454測序原理l 在454測序儀中,A、T、G、C四種堿基是分別存儲在單獨的試劑瓶中的,每步反應四種堿基依次加入反應池,當堿基配對結合,就會釋放出一個焦磷酸(PPi),而這個焦磷酸在酶的作用下

14、,將熒光素氧化成氧化熒光素,并發出光信號,從而讀取出這一位置的堿基信息。454測序儀的整個實驗步驟可大致概括為: 樣品處理 文庫制備 emPCR 反應板準備 上機測序2021-7-7454測序原理 樣品處理: 樣品處理主要是針對大片段的DNA分子,如基因組DNA、Fosmid或BAC質粒等,利用超聲或氮氣打斷將這些DNA分子片段化,然后采用瓊脂糖凝膠電泳回收或磁珠純化,選擇500-800bp的DNA片段。對于非編碼RNA或PCR產物,則不需要這一步驟。2021-7-7454測序原理 文庫制備包括接頭連接和磁珠純化兩步,454的文庫接頭分A、B兩種,各44bp,由20bp的PCR引物、20bp的

15、測序引物及4bp(TCAG)的“key”堿基構成,其中B接頭的5端帶有生物素(Biotin)標記,用于磁珠純化步驟。經過磁珠結合與DNA變性之后,只有A+目的片段+B形式的連接產物得以富集,另兩種形式(AA、BB)的產物都被去除。2021-7-7454測序原理 emPCR(乳液PCR)是454測序的一個關鍵步驟,將富集到的文庫與測序磁珠、各反應物混合,加入特定的礦物油和表面活性劑,再利用振蕩器劇烈振蕩,使反應體系形成油包水(water-in-oil)的穩定乳濁液。在理想條件下,每一個液滴,或稱微反應器(microreactor)中將只包含一個磁珠和一條單鏈DNA,通過控制該步驟的條件,1mL乳

16、液中可以形成至少10的6次方個理想的微反應器。經過PCR擴增后,每一個磁珠上將形成密集的DNA簇,這些DNA序列完全相同,即可用于后續的步驟。隨后,乳液混合物被打破,擴增的片段依然結合在磁珠上。2021-7-7454測序原理 454測序的反應板稱為PTP(Pico Titer Plate),含有350萬個由光纖組成的小孔,每個孔的直徑為29m,而測序磁珠的直徑為20m,因此每個孔中僅能容納一個磁珠。將磁珠與測序試劑加入PTP中,使之可用于上機測序。2021-7-7454測序原理 測序步驟如前所述,四種堿基在泵的控制下依次加入反應板,反應完成后再洗去,每延伸一個或若干個堿基,就會發出一次光信號,

17、通過記錄信號的有無和強度,即可測定DNA序列。2021-7-72021-7-7454測序原理優缺點: 454測序準確度較高,當讀長超過400bp時,其準確性仍能達到99%以上; 主要的錯誤來自于同聚物,即相同堿基的連續延伸,如ATTTG這樣一段序列,A和G的讀取沒有問題,但T只記錄了一次光信號,僅信號強度與ATG序列的T有所不同,因此同聚物越長,可能產生的誤差就越大。 目前,由于454測序儀在讀長上的明顯優勢,它在大基因組從頭測序(de novo)、轉錄組分析、基因組結構分析等領域有著廣泛的應用。Solexa測序2021-7-7Solexa測序2021-7-7常用術語:SBSSBS:邊合成邊測

18、序反應,每次SBS會延伸一個堿基,大約耗時70分鐘。RunRun:單次上機測序反應,可以產生4G-75G測序通量不等。LaneLane:單泳道,每條泳道可以直接物理區分測序樣品,1次run最多可以同時上樣8條Lane。ChannelChannel:Lane的同義詞。TileTile:小區,每條Lane中排有2列tile,合計120個小區。每個小區上分布數目繁多的簇結合位點。ClusterCluster:簇,在Solexa測序技術中會采用橋式PCR方式生產DNA簇,每個DNA簇才能產生亮度達到CCD可以分辨的熒光點。Solexa測序2021-7-7IndexIndex:標簽,在Solexa多重測

19、序(Multiplexed Sequencing)過程中會使用Index來區分樣品,并在常規測序完成后,針對Index部分額外進行7個循環的測序,通過Index的識別,可以在1條Lane中區分12種不同的樣品。Barcode:Barcode: Index同義詞FastaFasta:一種序列存儲格式。一個序列文件若以FASTA格式存儲,則每一條序列的第一行以“”開頭,而跟隨“”的是序列的ID號(即唯一的標識符)及對該序列的描述信息;第二行開始是序列內容,序列短于61nt的,則一行排列完;序列長于61nt的,則每行存儲61nt,最后剩下小于61nt的,在最后一行排列完;第二條序列另起一行,仍然由“

20、”和序列的ID號開始,以此類推。Solexa測序2021-7-7FastqFastq:Fastq是Solexa測序技術中一種反映測序序列的堿基質量的文件格式。第一行以“”符號開頭,后面緊跟一個序列的描述信息;第二行是該序列的內容;第三行以“+”符號開頭,后面緊跟的內容與第一行一樣,同樣是該序列的描述信息;而第四行是第二行中的序列內容每個堿基所對應的測序質量值。PF%PF%:PF%是指符合測序質量標準的簇的百分比(Multiplexed Sequencing),與測序的通量相關聯。ReadRead:Solexa是成簇反應的,每個簇對應一條DNA序列片段,成為一個read。Solexa測序2021

21、-7-7Solexa測序2021-7-7Solexa測序2021-7-7Solexa測序2021-7-7Solexa測序2021-7-7Solexa測序2021-7-7Solexa測序2021-7-7Solexa測序2021-7-7Solexa測序2021-7-7應用: Solexa平臺的應用范圍極廣,幾乎囊括了目前基因組學研究的所有方面,例如基因組從頭測序(de novo)、重測序(re-sequencing)、基因組結構分析、轉錄組測序、表達譜分析、小RNA及非編碼RNA測序、表觀遺傳學研究等等。SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SO

22、LiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7SOLiD測序2021-7-7三者比較測序技術讀取長度(測序技術讀取長度(),在種測序技術中最長,可以對未知基因組),在種測序技術中最長,可以對未知基因組進行從頭測序,但其通量最低(進行從頭測序,但其通量最低()。當遇到(如)。當遇到(如 等)

23、時,等)時,堿基個數和熒光信號強度不成線性關系,即判斷重復堿基堿基個數和熒光信號強度不成線性關系,即判斷重復堿基有困難。有困難。2021-7-7三者比較屬于高度自動化的系統,讀屬于高度自動化的系統,讀取片段比其它種類的測序多,適合進行大量小片段的測序(如取片段比其它種類的測序多,適合進行大量小片段的測序(如),其測序通量大,),其測序通量大,其新機型產出量為,其新機型產出量為,但基于可逆反應時隨反應輪數增加效率降低、信號減弱,并且但基于可逆反應時隨反應輪數增加效率降低、信號減弱,并且讀長(通常為)比短,給從頭讀長(通常為)比短,給從頭測序拼接帶來困難。測序拼接帶來困難。2021-7-7三者比較

24、技術每個堿基讀取次,有非常高的技術每個堿基讀取次,有非常高的準確性,特別是針對的檢測。此外,靈活的系統和準確性,特別是針對的檢測。此外,靈活的系統和完善的磁珠編碼系統可以進行樣品的來分完善的磁珠編碼系統可以進行樣品的來分割測序區域,特別適用于具有高質量參考基因組序列物種割測序區域,特別適用于具有高質量參考基因組序列物種的重測序,但是該測序讀長()最短,并且讀取的重測序,但是該測序讀長()最短,并且讀取長度受反應輪數的限制,給從頭測序拼接帶來困難。長度受反應輪數的限制,給從頭測序拼接帶來困難。2021-7-7第三代測序技術原理:脫氧核苷酸用熒光標記,顯微鏡可以實時記錄熒光的強度變化。當熒光標記的脫氧核苷酸被摻入DNA鏈的時候,它的熒光就同時能在DNA鏈上探測到。當它與DNA鏈形成化學鍵的時候,它的熒光基團就被DNA聚合酶切除,熒光消失。這種

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論