人類染色體結(jié)構(gòu)變異研究_第1頁
人類染色體結(jié)構(gòu)變異研究_第2頁
人類染色體結(jié)構(gòu)變異研究_第3頁
人類染色體結(jié)構(gòu)變異研究_第4頁
人類染色體結(jié)構(gòu)變異研究_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 人類染色體結(jié)構(gòu)變異研究 李超摘 要:人類染色體結(jié)構(gòu)變異是多種疾病產(chǎn)生的根源,研究人體中結(jié)構(gòu)變異對癌癥和相關(guān)基因疾病的治療具有十分重要的意義。本文介紹了人類染色體結(jié)構(gòu)變異的主要情況,總結(jié)了目前已有的性能優(yōu)良的結(jié)構(gòu)變異檢測方法,并分析了結(jié)構(gòu)變異研究所面臨的主要挑戰(zhàn)。Key:染色體;結(jié)構(gòu)變異;檢測:Q343.2,S565.1 :A :1671-2064(2017)10-0188-021 染色體結(jié)構(gòu)變異1.1 染色體結(jié)構(gòu)變異簡介染色體的結(jié)構(gòu)變異 (Genomic structural variants, SVs),是人類基因變異的一個主要來源1,同時結(jié)構(gòu)變異也是一些常見疾病產(chǎn)生的主要原因。雖然基因組

2、中的結(jié)構(gòu)變異并不如單核苷酸多態(tài)(single nucleotide polymorphisms, SNPs)2更加常見,但是由于它比起SNPs有更大的尺寸及更復(fù)雜的結(jié)構(gòu),使其在染色體組的變異中扮演著更重要的角色。結(jié)構(gòu)變異的類型主要包括兩類,一類是不改變基因片段拷貝數(shù)目的平衡性結(jié)構(gòu)變異(balanced structural variation),另一類是改變基因片段拷貝數(shù)目的非平衡性結(jié)構(gòu)變異(unbalanced structural variation)3?;绢愋偷慕Y(jié)構(gòu)變異主要包括刪除(deletions)、插入(Insertion)、倒位(Inversions)、易位(Transloca

3、tions)、隨即復(fù)制(Duplications)和拷貝數(shù)變異(Copy-Number Variants)4?;谶@幾種基本類型的結(jié)構(gòu)變異,在實際情況中會出現(xiàn)一個變異包含多種基本類型變異的情況,例如倒位易位,甚至更復(fù)雜的情況。通常情況下,一個結(jié)構(gòu)變異在序列中的長度約為1Kb到3Mb。1.2 染色體結(jié)構(gòu)變異與疾病的關(guān)系結(jié)構(gòu)變異和某些基因疾病的產(chǎn)生具有緊密相關(guān)的聯(lián)系。結(jié)構(gòu)變異存在于不同個體之間,可引起個體之間的表型差異5,例如外貌、行為、環(huán)境適應(yīng)性等6。同一個體不同細胞間的結(jié)構(gòu)變異的類型及數(shù)目也存在差異,這些結(jié)構(gòu)變異可能直接或間接的影響某些關(guān)鍵基因的表達,從而導(dǎo)致癌癥、21-三體綜合征(唐氏綜合征

4、)7、貓叫綜合性征8和一些精神類疾病的產(chǎn)生。隨著對癌癥研究的不斷深入,人們已經(jīng)意識到在癌癥的形成和發(fā)展過程中,結(jié)構(gòu)變異起到舉足輕重的作用。當人體染色體中的某些關(guān)鍵基因發(fā)生突變時,細胞的生成速度會大于細胞的凋亡速度,進而細胞群落不斷擴大,導(dǎo)致患者體內(nèi)的腫瘤逐漸形成,病情進一步惡化,形成癌癥。如果能夠把癌癥患者體內(nèi)的變異基因識別清楚,這將對癌癥的治療具有很重要的作用。目前,導(dǎo)致癌癥的典型原癌基因和抑癌基因已經(jīng)識別的比較全面。但由于檢測方法的限制,必定還有一些與癌癥的產(chǎn)生關(guān)系很大的基因未被識別出來,對這類基因的識別依然有很重要的意義。2 染色體結(jié)構(gòu)變異的檢測2.1 檢測染色體結(jié)構(gòu)變異的重要意義對基因

5、測序數(shù)據(jù)中結(jié)構(gòu)變異的檢測是對結(jié)構(gòu)變異進行研究的一項重要內(nèi)容。高通量測序技術(shù)的引進,對于生殖細胞和體細胞中結(jié)構(gòu)變異的檢測起到了巨大的推動作用。目前已有許多種基于不同統(tǒng)計方法所開發(fā)的結(jié)構(gòu)變異檢測方法,這些方法主要包括以下幾種類型:通過分析讀片的覆蓋度來檢測結(jié)構(gòu)變異的方法稱之為讀深度分析(read-depth analysis)9;通過分析高通量測序數(shù)據(jù)中不正常的映射對(mapping pairs)的檢測方法稱為雙末端映射方法(paired-end mapping methods)10;通過分析斷點類型及斷點區(qū)間的方法稱之為split-read分析。識別結(jié)構(gòu)變異需要將讀片與參考序列進行比對,根據(jù)比對

6、信息,提取異常測序片段對(discordant read pairs)11,并對其聚類,根據(jù)聚類結(jié)果判斷基因組上的結(jié)構(gòu)變異類型,進而識別出結(jié)構(gòu)變異的斷點連接點(breakpoint)即間斷點。對高通量測序平臺產(chǎn)生的原始數(shù)據(jù)重建待檢序列,理論上可以用于檢測任何結(jié)構(gòu)變異類型,但是由于基因組中存在著大量的重復(fù)區(qū)域,這使得在序列組裝過程中很難確定測序讀片在基因組上的準確位置。同時,由于測序錯誤的存在以及基因組結(jié)構(gòu)的復(fù)雜性,從而加大了結(jié)構(gòu)變異檢測的困難。針對一個樣本,所用的模型不僅需要將識別出的體細胞基因組結(jié)構(gòu)變異個數(shù)控制在幾十個或者幾百個,而且還要給出每個結(jié)構(gòu)變異發(fā)生的概率值,這為癌癥早期發(fā)現(xiàn)以及診斷

7、治療提供了一個重要的參考對象。此外,大量的檢測結(jié)果表明,對于不同類型的癌癥以及同一種癌癥的不同樣本,每種結(jié)構(gòu)變異的類型所占比重不同。如何分析并解釋腫瘤異質(zhì)性,就要對癌癥樣本中的結(jié)構(gòu)變異進行識別,進而可以對癌癥病人進行靶向用藥,促進精準醫(yī)療的發(fā)展12。2.2 結(jié)構(gòu)變異的檢測方法結(jié)構(gòu)變異檢測方法性能的優(yōu)劣主要用敏感性和精確性兩個值來衡量,而敏感性和精確性在一定程度上又是兩個相互對立的概念,這就使得敏感性和精確性俱佳的方法難以得到。我們只能在盡量保證精確性的前提下提高檢測方法的敏感性,這就要求我們盡量多的結(jié)合已經(jīng)得到的序列比對信息,并且運用與堿基的分布相貼合的分布模型,來統(tǒng)計已知信息,得到更可靠的結(jié)

8、構(gòu)變異位點。現(xiàn)在的結(jié)構(gòu)變異檢測方法中,有的結(jié)合信息不夠,從而導(dǎo)致檢測方法的精確性不高,有的檢測方法所用的概率分布與實際情況出入較大,這就會對檢測結(jié)果的敏感性和精確性都造成較大的不利影響。表1中總結(jié)了目前已經(jīng)發(fā)布并且應(yīng)用比較廣的四種檢測結(jié)構(gòu)變異的軟件,并且對他們的性能特點做了簡要的概述。除了上述的四種檢測結(jié)構(gòu)變異的軟件之外,還有很多與之相似的軟件,例如:Pindel,GASV,HYDRA,Swan等。值得注意的是,由于不同的軟件各有自己不同的特點,所以在進行結(jié)構(gòu)變異檢測的時候,要根據(jù)測序數(shù)據(jù)的實際情況,選用合適的軟件進行檢測。 3 結(jié)語染色體中結(jié)構(gòu)變異的研究,對各種基因疾病尤其是癌癥的治療具有十

9、分重要的意義。結(jié)構(gòu)變異研究的一項重要內(nèi)容是對其進行檢測。目前已有一些優(yōu)秀的檢測方法和軟件,它們都有各自的優(yōu)點,但也存在很多不足。建立敏感度和精確度俱佳的結(jié)構(gòu)變異檢測方法,是當前結(jié)構(gòu)變異研究的一項重要內(nèi)容。Reference1G. R. Abecasis,D. Altshuler,A. Auton等. A map of human genome variation from population-scale sequencingJ. Nature,2010, 467(7319):1061-1073.2G. H. Roffler,S. J. Amish,S. Smith等. SNP discove

10、ry in candidate adaptive genes using exon capture in a free-ranging alpine ungulateJ. Mol Ecol Resour,2016, 16(5):1147-1164.3R. M. Layer,C. Chiang,A. R. Quinlan等.LUMPY: a probabilistic framework for structural variant discoveryJ. Genome Biol,2014,15(6):R84.4H. Parikh,M. Mohiyuddin,H. Y. Lam等. svclas

11、sify: a method to establish benchmark structural variant callsJ. BMC Genomics,2016, 17:64.5龔強. 基因組變異的深度挖掘M:中國科學(xué)院北京基因組研究所,2013. 135.6P. H. Sudmant,T. Rausch,E. J. Gardner等. An integrated map of structural variation in 2,504 human genomesJ. Nature,2015, 526(7571):75-81.7李沖.唐氏綜合癥外周血表達譜分析和21號染色體DNA甲基化譜分

12、析M.復(fù)旦大學(xué),2012. 150.8周煥庚,康雪珍,張蒨蒨.貓叫綜合癥的細胞遺傳學(xué)研究J.遺傳學(xué)報,1982(01):20-23.9K. Chen,J. W. Wallis,M. D. McLellan等. BreakDancer: an algorithm for high-resolution mapping of genomic structural variationJ. Nat Methods,2009, 6(9):677-681.10A. Abyzov,M. Gerstein. AGE: defining breakpoints of genomic structural variants at single-nucleotide resolution, through optimal alignments with gap excisionJ. Bioinformatics,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論