




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基因與基因組的結構與功能第1頁/共159頁表型和基因型某一機體可以觀察到的特征稱為表型(phenotype),與表型相應的基因組成稱為基因型(genotype)。如細菌能否合成亮氨酸記為Leu+和Leu-,相應的基因型為Leu+和Leu-。
等位基因
(1)二倍體細胞有2套基因,一套來自父本,另一套來自母本,每個細胞的全部基因均由2套基因組成,每一對基因稱做等位基因。
(2)由于突變作用引起DNA結構變異,所以某一基因可具有若干種不同的形式,這種同一基因不同的形式互稱等信基因(allele)。第2頁/共159頁基因的基本結構5’、、、AGCCGACTATGTCGAAGCTT、、、、、、GCTTGACTATAAGACA、、、3’3‘、、、TCGGCTGATACAGCTTCTAA、、、、、、CGAACTGATATTCTGT、、、5‘轉錄調控區貯存RNA或蛋白質結構信息區轉錄終止區第3頁/共159頁4.3基因組(gencme)細胞或生物中,一套完整單倍體遺傳特質的總和(包括一種生物所需的全套基因及間隔序列)稱為基因組(P27)。基因組的結構主要指不同的基因功能區域在核酸分列中的分布和排布情況,基因組的功能是貯存和表達遺傳信息。人類基因組包含多染色體和XY兩條性染色體上的全部遺傳物質(核基因組)以及胞線粒體上的遺傳物質(線粒體基因組)。(X免疫基因,男XY,女XX)。*1個配對(精子或卵子),1個單倍體細胞或1個病毒所包含的全套基因,稱為基因組。第4頁/共159頁4.3.2基因及基因組的大小與C值矛盾C值:真核生物單倍體基因組所包含的全部DNA總量稱為該物種的C值。C值愈大愈高等?關系密切的生物C值差異巨大?大量的DNA為非編碼序列。第5頁/共159頁4.4病毒及其基因組4.4.1病毒基因組特點簡單,信息總量少,只含一種核酸,有基因重疊,間隔序列很短,功能相關基因成簇,為一個轉錄單元;噬菌體基因是連續的,但也有許多病毒基因是不連續的。完整的病毒顆粒具有蛋白質外殼,以保護病毒核酸不受核酸酶的破壞,并能識別和侵襲特定的宿主。類病毒例外,它是一類植物病毒,為很小的單鏈閉環RNA(250-400堿基)。第6頁/共159頁
病毒核酸與所有的原、真核生物的核酸組比較,最為突出的特點是每種病毒顆粒只含1種核酸,或DNA或RNA,兩者不共存于1種病毒顆粒中,據此,病毒可以分成兩組,即DNA病毒和RNA病毒。病毒核酸分子量大小:RNA病毒小106-107D,DNA病毒大;107-108D
基因數:3-幾百個第7頁/共159頁一切烈性病毒(virulentvirus)都具備參下幾個時相的生活周期:(1)吸附;(2)核酸進入細胞;(3)轉錄、翻譯和復制;(4)病毒顆粒成熟;(5)釋放病毒顆粒。典型的生活周期為6-48小時,噬菌體為20-60分鐘。病毒對細胞功能的干予,最典型的是噬菌體(phage),當其入菌后,立即接管了細菌的各種主要功能,細菌自身的DNA復制RNA轉錄,蛋白質合成,能量代謝等都停頓下來轉變成合成病毒的機器。有些動物病毒也有類似的情況,但非普通規律。相對而言,動物病毒和宿主細胞可以共存一段時間至病毒生活周期的后期才造成宿主細胞的嚴重損害,這些損害有如下3個類型:(1)抑制宿主RNA和DNA的合成。(2)核糖體合成受損。(3)蛋白質合成受抑制是普遍現象。
與人類疾病有關的病毒屬于動物病毒,它包括8個DNA病毒科和12個RNA病毒科,這些病毒基因組結構和功能已基本清楚第8頁/共159頁
(二)病毒有(十)鏈RNA和(一)鏈RNA之分。
(十)RNA病毒(一)RNA概念極性和mRNA極性相同,與mRNA極性相反或與(十)RNA
堿基順序也相同。互補的RNA。作用
1.作為模板(與mRNA一樣)必須依賴翻譯出病毒多肽或蛋白質。RNA的RNA2.作為模板,合成(一)RNA,pol合成(十)可以以(一)RNA為模板RNA(mRNA)合成子代病毒RNA。才能翻譯出
3.作為模板合成cDNA.病毒(即以mRNA為模板反轉錄合成DNA)。蛋白質。RNA的序列基本相同,只是編碼鏈上的T在相應轉錄本上為U,由于轉錄本RNA編碼基因表達的蛋白質產物,DNA的這條鏈也由此命名為編碼鏈。編碼鏈又稱為有義鏈;模板鏈又稱為反義鏈。與RNA互補的鏈是負鏈第9頁/共159頁二.病毒基因組結構功能特點(P28)(一)病毒核酸可以是ssDNA、dsDNA或RNA分子,分子結構有發夾、環狀、線型、節段型。以SSDNA,dsRNA最為突出。(二)基因重疊即同一段基因可以編碼2種或以上的基因產物這種現象在其它生物細胞僅見于線粒體和質體DNA.所以是病毒核酸較為獨特結構能使小小病毒攜帶較多的遺傳信息,原因是病毒基因閱讀框可以錯位(SV40)。第10頁/共159頁(三)連續的和不連續的基因
病毒基因結構特征往往與其宿主細胞基因結構相似。原核病毒(如噬菌體)基因是連續的,沒有內含子;真核病毒(如多瘤病毒)基因是不連續的,有內含子。有意思的是,有些真核病毒的內含子或其中的一部分對某一基因來說是內含子,對另一基因卻是外顯子。如SV40和多瘤病毒的早期區域就是這樣的。除了(+)RNA病毒外,真核病毒基因都是先轉成mRNA前體,再經過剪接等步驟能成為成熟的mRNA.第11頁/共159頁(四)節段性基因大部分病毒核酸都是由一條雙鏈或單鏈構成,少數病毒核酸由數個片段構成。這類病毒一般度RNA病毒。如flu-v由6-7個片段構成,各段在天然狀態下不連接,而且可以轉錄成6-7個片段相應的mRNA。單獨的片段沒有感染性,感染要一起感染才發揮作用。(五)除了retro-v外,所有的病毒基因都是單倍體基因。即每個基因在某個病毒顆粒中只出現一次,即只有1套基因。(六)編碼區>非編碼區(95%/5%)。病毒核酸大多數順序都用來編碼蛋白質。第12頁/共159頁(七)基因常常成簇排列,沒有間隔序列或間隔序列很小。功能相關蛋白質基因在基因組的1個或幾個特定部位,叢集成簇被轉錄成多順反子,然后加工成各種蛋白質的mRNA模板。如腺病毒晚期基因。(八)不規則的結構基因1.幾個結構基因的編碼區不規則,因此有些結構基因無翻譯起始序列。2.有的mRNA(=gene)沒有5’帽子,但有翻譯增強子。(九)DNA或RNA1種病毒基因組只是1種核酸。第13頁/共159頁4.4.2病毒的核酸正鏈(直接作為mRNA模板,反之為負鏈。第14頁/共159頁4.4.3典型病毒基因組4.4.3噬菌體基因組也可進入裂解循環。噬菌體基因組為長度約為50kb的雙鏈
DNA分子,噬菌體是感染大腸桿菌的溶源性噬菌體,在感染宿主后可進入溶源狀態,實際大小為48502bp第15頁/共159頁病毒組裝組分基因病毒感染相關基因病毒復制相關基因第16頁/共159頁第17頁/共159頁ΦΧ174噬菌體基因組單鏈環狀,5386個核苷酸對,11個基因,3個轉錄單元,有重疊基因,基因間間隔區很小第18頁/共159頁5866bp63JFGHAA*CD811036BKE第19頁/共159頁第20頁/共159頁SV40病毒基因組
SV40(simiansarcomavirus40猴肉瘤病毒)屬乳多空病毒類,是最小的DNA病毒之一。它可長期潛伏于猴腎細胞,對新生倉鼠有致癌性,體外試驗還可使多種屬細胞惡性轉化。第21頁/共159頁1、基因組結構特點
(1)雙鏈環狀DNA分子、MW3×103KD,長52436p,與4種組蛋白(H2A、H2B、H3及H4)綜合,與真核染色質區別在于不含H1。
(2)基因組由早期基因、調控區和晚期基因構成。①早期基因含有2個重疊基因,編碼T和t(T=tumor)抗原②晚期基因含3個重疊基因,編碼VP1(主),VP2和VP3(次)3種衣殼蛋白③調控區位早、晚期基因之間,長約4006p包括復制起點,啟動子和增強子,可調節基因組的復制及早、晚期基因的轉錄。第22頁/共159頁2、SV40病毒基因的表達
(1)啟動子位于調控區復制起點上游,其中含有RNAPOLII識別位點位于-21-26bp之間的TATA盒可啟動RNA轉錄起始準確位置,一般不相差10個核苷酸。
(2)增強子在106-250位是2個串聯的含有72bp的完全重復順序,即為增強子,能增強SV40及異源基因的表達。(3)早期基因轉錄的mRNA前體選擇剪接形成不同的mRNA(TmRNA、t-mRNA)第23頁/共159頁3、病毒基因組的復制及基因表達調控
T抗原控制病毒的復制,啟動晚期基因轉錄。(1)早期基因T及t的表達受T抗原的反饋阻遇,表現一種自我調節作用。(2)晚期基因表達需要T抗原及SV40DNA本身的復制。一般過程是,感染早期合成T、t抗原→T-方面抑制早期mRNA進一步合成;另一方激活多種與DNA復制有關的酶,引發病毒的復制→進而推動晚期RNA的合成,產生Vp蛋白(12h)→V-DNA+VP123→病毒顆粒。第24頁/共159頁腺病毒腺病毒是一種無外殼的雙鏈DNA病毒,基因組長約36kb,衣殼(capsid)呈規則的20面體結構,直徑約80-110nm。以病毒DNA開始復制為分界線,按轉錄時間的先后,將腺病毒基因大致區分為早期(E1~4)和晚期轉錄單位(L1~5)。各種腺病毒基因又可以進一步地分為更小的轉錄單位,如E1區可以進一步分為E1A和E1B,每個轉錄單位都至少有一個獨特的啟動子。病毒的兩條鏈均有編碼功能。第25頁/共159頁腺病毒基因組的兩端各有一段100bp的反向末端重復序列(ITR),是復制的起始位點。在左端ITR的3′側有一段長約300bp的包裝信號(ψ)介導腺病毒基因組包裝入病毒衣殼。對腺病毒而言,只有包括兩端的ITR和包裝信號(ψ)的約0.5kb的序列是順式作用元件,也就是說必須由腺病毒載體自身攜帶,而其他的30余種蛋白都可以通過輔助病毒(或細胞)反式補足。
第26頁/共159頁病毒基因組進入細胞核,就將進行一系列的復雜而有序的逐級放大的剪切和轉錄過程。腺病毒基因組進入細胞核后,細胞轉錄因子首先與E1A區上游的增強子結合,表達E1A蛋白,該蛋白的作用是調節細胞代謝,使病毒DNA更易于在細胞中復制。E1A蛋白還可以激活其他早期基因(E1B、E2A、E2B、E3和E4)的啟動子,其中E2B驅動另外三個與病毒復制有關的早期基因轉錄單位末端蛋白前體(pTP,precursorterminalprotein)、單鏈DNA結合蛋白(ssDBP,single-strandedDNAbindingproteins)以及DNA聚合酶(DNApol,DNApolymerase)的表達,這三個基因的表達產物緊密地結合成一個復合物,與至少三種細胞蛋白相互作用,啟動病毒基因組的復制。第27頁/共159頁3逆轉錄病毒
1.逆轉錄病毒一般分類
逆轉錄病毒可以說就是RNA腫瘤病毒。第一個被發現的RNA腫瘤病毒是勞氏肉瘤病毒(RousSarcomavivus,RSV,1911)。至今為止所發現的retro-v都能使動物致癌,如下。(1)肉瘤病毒(2)白血病病毒(leuremiavirus)
(3)乳腺瘤病毒(mammazytumorvirus)和淋巴瘤病毒,如鳥類髓細胞瘤病毒(avianmyelocytoma,AMV)
(4)人類嗜T細胞逆轉錄病毒(humanT-lymphotropicretro-v,HTLV)HTLV-III現稱人類免疫缺陷綜合癥病毒(humanimmunodeficiencyvirus,HIV)或AIDS病毒。第28頁/共159頁2.逆轉錄病毒基結構特征(1)是RNA的復合體①2條(+)RNA單體正向平行,攜帶所有的遺傳信息,而且完全相同,為什么要求2條相同正鏈,意義不太清楚(怕基因丟失或損傷?)。②2條tRNA較小,是宿主tRNA(RSV是tRNAtrp),+RNA對于復制位置是至關重要。(2)5’端有m7Gppp帽,3’端有Poly(A)尾。第29頁/共159頁(3)編碼區(反式功能區)從5’→3’
非編碼區(順序功能區,調控區)5’,3’都有①gag(groupantigen)編碼衣殼蛋①R區逆轉錄合成cDNA必須區域②Pov(Polyrmerase)逆轉錄酶②PB區引物結合區③env(envelop)包膜蛋白③U區U3含啟動子,U5與轉錄終止加尾有關*④ONC(oncogene)癌基因④ψ(包裝信號),DLS(氫鏈結合位點)
如RSV是SRCC為調控區*有的retro-V有ONC。第30頁/共159頁3.逆轉錄病毒生活周期
(1)吸附可能所有的動物病毒受體都是表面糖蛋白(MLV的受體是左旋氨基酸轉運蛋白,受體與基因治療)。
(2)入胞逆轉錄,轉錄,翻譯。
①逆轉錄——前病毒基因組(cDNA)的形成
RNA+逆轉錄酶→宿主胞漿→逆轉錄→(RNA為模板,+RNA為引物)→cDNA(見第四章)→進入核→隨機整合宿主染色體→形成前病毒。
cDNA形成新的重復(U3-R-U5)稱LTR(longterminalrepeat長末端重復順序)。cDNA含有RNA全部信息且較RNA長。
第31頁/共159頁
逆轉錄酶除了逆轉活性外,還至少還有3種活性:即RNaseH活性,內切核酸酶活性(特異地切斷基因組3’端RNA,作為“+”鏈DNA的引物)和以“-”鏈DNA為模板合成“+”鏈DNA的活性。第32頁/共159頁②轉錄——病毒基因組的形成
U3區啟動子啟動前病毒基因組轉錄出從5’區至3’R區的RNA。③翻譯gag、env、polGag(編碼衣殼蛋白)
——
全長RNA能直接作為gag基因mRNA,進行翻譯。但有90%的mRNA只譯出gag多蛋白質,經肽鏈加工裂解為衣殼蛋白。pol——RNA序列有干擾gag終止碼的序列,使約10%mRNA在翻譯過程中,直至pol的終止碼,經翻譯后加工裂解,形成衣殼蛋白,逆轉錄酶和整合酶(integrase)。env——
一部分全長mRNA經過轉錄后的剪接,使env編碼區與病毒RNA5’端帽子連接在一起→envmRNA→包膜糖蛋白。第33頁/共159頁(3)病毒顆粒成熟←包裝←ψ(基因治療)
RNA5’端PB-區與宿主tRNA以氫鏈相連形成復合體→包裝→病毒顆粒。(4)釋放子病毒→感染其它細胞。第34頁/共159頁4.逆轉錄病毒引起白血病的3種機理.(以此說明RNA腫瘤病毒的致癌作用與基因組類型.)
(1)急性逆轉錄病毒(2)慢性逆轉錄病毒(3)HTlV(人類嗜T細胞逆轉錄病毒)①含onc*①不含onc①含tat的HTLV②可在數周內使培養②不能轉化,但V感染②含使培養細胞轉化,機理和1、2細胞發生轉化.整體動物潛伏數月致癌.不同。③onc插到宿主DNA中③前V整合到proto-onc③反式調控作用,tot插入→去產生致癌mRNA癌基前,病毒LTR啟動子增強轉錄mRNA→tat蛋白作用于因產物轉化細胞致癌.子啟動增強c-onc表達,TGF-β1等→使細胞增殖永生改變細胞生長特性.化。第35頁/共159頁人類免疫缺陷病毒基因組(HIV)獲得性免疫缺陷綜合征(AIDS)1981年在美國首先發現,其病原是一種破壞人免疫系統的retro-V.1986年命名為HIV。HIV特異性侵犯并損耗T細胞造成機體免疫缺陷,最后并發各種嚴重感染和惡性腫瘤,成為艾滋病(談“艾”色變)。因該病無特效治療,病死率幾乎為100%。1.HIV感染的流行病學(節選)(1)我國流行特征:①發現較早,流行仍屬低下,但呈明顯上升趨勢。②分布地區廣,表現形式多。③年齡范圍廣,以青壯年為主,男女比為11.5/1。④感染途徑多,但通過性傳播日顯重要。⑤感染者的發現比重明顯從外籍人員轉向國內居民。第36頁/共159頁(2)HIV感染的危險因素增加①性傳播疾病發生率有增無減.②流行人口增加,估計全國流動人口達12000萬,年齡20-29,正處于性活躍期。③性觀念,性行為改變.④吸毒、販毒劇增,吸毒者往往有性亂,女性則賣淫。⑤醫源性傳播控制工作及宣傳防治工作薄弱。專家認為中國大陸HIV疫情持續上升,如超過一定數量,將出現暴發流行。HIV為分為HIV-1和HIV-2兩個型。HIV-1是感染的主要毒株,一旦感染,終身帶毒,進展快,預后差。HIV-2感染的潛伏期長,致病性低。中國存在HIV-1A、B、B‘、C、E五個亞型。第37頁/共159頁2.HIV的生物學特性(見分子病毒學)3.HIV基因組結構和功能(1)HIV基因組為SS(+)RNA,HIV-19.3kb,HIV-29.7kb,5’端有帽,3’端poly(A)尾含3個結構基因,至少6個調節基因。(2)LTR(長末端重復順序)與結構基因。①LTR含啟動子、增強子、負調節元件及哺乳動物組胺轉錄因子結合位點等。②gag編碼病毒核心結構蛋白③pol編碼逆轉錄酶、整合酶、蛋白酶。④env編碼包膜蛋白第38頁/共159頁(3)HIV調節基因①tat反式激活轉錄基因②rev病毒蛋白表達調節因子③vif病毒侵染性因子④nef負調節子⑤vpr病毒蛋白R⑥vpu病毒蛋白U⑦vpx病毒蛋白X僅存于HIV-2中.第39頁/共159頁4.5細菌基因組Prokaryoticgenome以細菌為代表講述,有稱bacteriagenome。細菌對醫學分子生物學有重要貢獻,是基因工程研究的主要材料之一。因為:1.構造相對簡單,基因結構也不復雜,取材便利,易于培養,可選擇突變株進行研究,實驗結果容易重復。(如選擇DDDPI缺乏的Ecoli突變株,Ecoli仍可合成DNA,說明酸I對EcoliDNA合成不起作用。)2.與人類有共同的要子生物學規律可,如:(1)遺傳物質都是DNA;(2)主要的功能分子都是蛋白質;(3)基因密碼是通用的,等等。3.尤其是E.coli,是分子克隆是“明星“,基因工程主要原因的工程菌,因為基因工程的主要工作是克隆克核基因在原核系統中表達。第40頁/共159頁一、原核生物基因組結構與功能的特點1.基因組通常僅由一條環狀雙鏈DNA分子組成。其DNA是與蛋白質結合,但并不形成染色體結構,只是習慣上將之稱為染色體。細菌染色體DNA在胞內形成一個致密區域,即類核(nucleoid),類核無核膜將之與胞漿分開。2.基因組中只有1個復制起點。3.具有操縱子結構。操縱子(operon)是指數個功能相關的結構基因串聯在一起,構成信息區,連同其上游的調控區(包括啟動和操縱區)及其下游的轉錄終止信號構成的基因表達單位。(見第六章)4.結構基因無重疊現象,基因組中任何一段DNA不會用于編碼2種蛋白質。5.基因序列是連續的,無內含子結構。第41頁/共159頁6.編碼區和非編碼區(主要是調控序列)在基因組中約各占50%。(5%,95%)7.基因組中的重復序列很少。編碼蛋白質結構基因多為單拷貝,但編碼rRNA的基因往往是多拷貝的,這有利于核糖體的快速組裝。(15AA/秒,2AA/秒)8.具有編碼同功酶的基因(isogene)這是一類結構不完全相同,而功能相同的基因。如E.coli含有2個編碼乙酸乳酸合成酶的基因和2個編碼分支酸變位酶同工酶的基因。9.細菌基因組中存在可移動的DNA序列,包括插入序列和轉座子。10.原核基因的基本結構特點:啟動子(promoter)、操縱基因(operator)、調控序列、結構基因(structuregene)、終止子(terminator)。(見第六章)第42頁/共159頁二、染色體外的遺傳物質———質粒(一)概念
1.質粒(plasmid)是獨立于許多細菌及某些真核細胞染色體外共價閉合環狀的DNA分子(covalantclosedcircnlar,cccDNA),能獨立復制的最小遺傳單位。(P35-6)
2.質粒是雙鏈的DNA分子,大小在1—200kb之間,和病毒不同,它們沒有衣殼蛋白(裸DNA)。第43頁/共159頁
從生化學來說,除酵母的殺傷質粒(killerplasmid)是RNA外,其余質粒是染色體外的cDNA分子。
從遺傳學來說,質粒是與宿主染色體有別的復制子(真核細胞分裂過程中,DNA纖維分成許多復制單位,該單位稱為復制子)。在細胞分裂時能恒定傳遞給交代細胞的獨立遺傳因子或能在胞內寄生和復制的復制子。第44頁/共159頁3.質粒與宿主細胞的關系(1)質粒對宿主的生存不是必需的,只是“友好”的“借居”宿主細胞中,既不殺傷細胞,對宿主的代謝活動也無影響,宿主離開質粒照樣的生存下去。(2)質粒離開宿主就無法生存,只有依賴宿主細胞的(酶和蛋白質)幫助,才能完成自身的復制(擴增)、轉錄。(3)質粒經常為宿主執行一些適當的遺傳功能,作為對宿主細胞的補償(“交房租”)。(4)質粒賦于宿主各種有利的表型(質粒編碼蛋白質或酶),使宿主獲得生存優勢,與我們基因工程實驗緊密相關的,如抗生素抗性基因:Ampr
酶,水解β-內酰胺環,解除氨關毒性,使細菌抗氨關。Tetr
膜蛋白,可阻止四環素進入細胞,使細菌抗四環素。第45頁/共159頁4.質粒發現和研究意義
1)理論意義質粒能夠復制、傳遞和表達遺傳信息,從分子遺傳學觀點來看是一種有機體,是比病毒更原始的生命形式,是生命起源研究的起一塊體重要基石。
2)實踐意義是基因工程的重要載體(vector),能把外源基因(目的基因)送到宿主細胞中去克隆擴增或克隆表達(見第八章)。
①質粒是可以改造的,可以剪切、剪接的,基因工程的重要任務之一就是嚴格改造質粒的同時,控制質粒不傳遞,若一個致癌質粒可以傳遞就會傳到外都是。
第46頁/共159頁②作為基因工程載體的3個特點:
A.都能獨立自主的復制;
B.都能便利的加以檢測(抗生素抗性);
C.都能容易引進宿主細胞中去,也易從宿主細胞中分離純化(提質粒)。質粒符合上述3個條件。基因工程中主要使用人工構建的質粒。第47頁/共159頁(二)質粒的分類
1.按質粒的復制機理,分為2類:1)嚴謹控制型(stringentcontrdtype)
2)松弛控制型(relaxedcontroltype)
(1)拷貝數少,一般<10個,分子量大;(1)拷貝數多,10-200個,分子量小;
(2)復制受限,受細菌宿主DNA復制系(2)復制不受細菌DNA復制系統限制,統的控制;僅需DDDPI,當宿主蛋白質合成受抑制
(3)特點是這類質粒可以自傳遞;時(如培養中加入氯要素時),其拷貝
(4)嚴謹控制機理(低拷貝原因),認數可猛增至1000-3000之多,該性質對為是該質粒可以產生阻逼蛋白,反饋基因工程技術十分有利。抑制自身DNA合成。3)分子量小,不具備自傳遞能力;
4)基因工程使用松弛型(高拷貝數)質粒,以獲得列多的基因產物。*拷貝數(copynumber)—細胞所含的按每—基因組計算的某種質粒或基因的數目。第48頁/共159頁2.按分子量大小,分為2類1)小型質粒,<15kb
2)大型質粒>15kb小型質粒,無接合和自傳遞能力,在按多屬接合型或自傳遞型,大型質粒只合質粒協助也能轉移,也可心通過轉化能通過細菌的接合作用人一個細菌作用進入受體細胞,這類質粒種類較多,傳到另一個細菌。(如F質粒)。幾乎每種細菌都可以含有2種以上,基因工程一般用小型質粒。第49頁/共159頁3.按質粒轉移方式,分為3類1)接合型質粒(conjugaativeplasmid)帶有效接觸基因質粒,只能使細菌接合,本身不被傳遞.2)可移動質粒(mobiliableplasmid)可以被傳遞,但不能使細菌接合型與可移動性共存時,能傳遞可移動質粒。3)自傳遞質粒(selftranmissibleplasmid)兼具1)2)兩種功能因而可以自傳遞,如F質粒。
*轉化作用(transformation)—這是涉及細菌攝入外源DNA而實現基因轉移一種機制。(見第八章)第50頁/共159頁(三)質粒的功能質粒的功能主要通過質粒本身攜帶的基因偏碼蛋白質表現出來。攜帶質粒的宿主細胞可表現出相應表型。1.性質粒即雄性細菌F質粒,它本身轉到F-宿主細胞時,使后者變成F+,改變宿主細菌性別。2.抗生素抗性抗藥性(R)質粒使細菌產生抗生素抗性,這種抗藥性抗性基因也可以轉移到缺乏這種抗藥基因的細菌體內,使之產生抗藥性。3.產生毒素的質粒如col質粒能產生大腸桿菌素因子(colicin),殺死不合該毒素的親緣細菌。4.降解復雜的有機化合物作為能源質粒。5.產生限制和修飾酶。(見第八章)第51頁/共159頁(四)質粒的基本特性
1.自主復制
質粒的復制是自主調節的,不受染色體復制調節因素的影響。復制調控系統由質粒上的復制起點(ori),質粒的rep基因和cop基因組成。
Rep蛋白啟動質粒的復制,cop基因本身或其表達產物可抑制復制作用,從而控制質的拷貝數。
2.質粒的不相容性
利用相同復制系統的質粒不能共存于同一個細胞內。
PMB和COLEI是兩個密切相關的復制調控系統,帶有PMB和COLEI復制調控系統的質粒是不相容的。但它們與帶有PSC101或P15A復制調控系統是完全相容的,可以共存于一個細胞內。不相容性使質粒能夠很容易被克隆。
3.質粒的轉移性在自然條件下,在些質粒可以通過細菌接合作用在細菌細胞向傳遞。基因工程中常用的質粒載體缺乏轉移所需的基因(mob基因),不能通過接合作用在細胞間傳遞,但可采用人工方法轉化到細菌細胞中。第52頁/共159頁(四)細菌有限制—修飾系統細菌的限制—修飾系統是分別由特定的基因編碼的限制酶和修飾酶組成的二元系統。
1.防御外源性DNA入侵。
2.構成細菌種屬和菌株之間交叉繁殖屏障,但又允許外源DNA有某些遺漏,利于物種進化。
3.基因工程重要的工具酶。(350/400)甲基化酶1.保護自身DNA不受限制酶切割(限制)。
2.影響DNA分子構象,利于基因表達調控。限制酶和甲基化酶辯證關系。第53頁/共159頁4.6真核生物基因組
4.6.1真核生物基因組的結構特點1.分子量大,比原核細胞大10倍以上。P892多條,線狀。多復制起點3、DNA與蛋白質結合,可以形成染色質結構4、分為胞質區和核區,轉錄和翻譯在實踐和空間分隔。5、重復序列6、多為單拷貝基因7、有跳躍基因8、有內含子第54頁/共159頁4.6真核生物基因組
4.6.1真核生物基因組的結構特點(一)真核基因的基本結構1.結構基因、內含和外顯子、斷裂基因。(1)結構基因(structuralgene)指能轉錄成為mRNA、rRNA或tRNA的DNA順序。(2)內含子和外顯子真核生物的結構基因是不連續的,編碼序列被非編碼序列打斷,在編碼序列之間的序列稱為內含子(intron),編碼序列稱為外顯子(extron)。(3)斷裂基因(splitgene)在真核類結構基因組中,編碼順序被許多稱為內含子的非編碼區分割成幾段稱之。第55頁/共159頁斷裂基因mRNA的前體是核內不均一RNA,實驗證據P90,不連續基因是普遍現象(原核極為少見,古細菌和噬菌體中發現了斷裂基因)斷裂基因共性:外顯子排列順序與產物相同,在不同組織中其內含子成分相同,內含子突變不影響蛋白產物,第56頁/共159頁內含子外顯子的相互關系概念P92n,n+1,內含子,外顯子內含子兩端有高度保守的序列,P92內含子分類第57頁/共159頁3.
內含子的分類根據基因的類型和剪接的方式,通常把內含子分為4類I:主要存在于線粒體、葉綠體及某些低等真核生物的rRNA基因;II
:是常見的形成套索結構后剪接,大多數mRNA基因有此類內含子;IV:是tRNA基因及其初級轉錄產物中的內含子,剪接過程需酶及ATP。第58頁/共159頁G外顯子-內含子邊界外顯子和內含子的邊界有一些明顯的特征,如:內含子的5‘端或稱供體位(donorsite)常見的順序為5’-AG↓GTTAAGT-3’;
3’端又稱受體位(acceptorsite),多為5‘PyPyPyPyPyPyCAG-3’(“Py”嘧啶核苷酸,T或C);第59頁/共159頁II型基因(由RNA聚合酶II催化的)內含子5′端與外顯子3′端均具有GT序列,內含子3′端與外顯子5′端均具有AC序列,這種內含子稱為主型內含子。同一基因在不同組織中其內含子外顯子數目長度位置會有變化。第60頁/共159頁內含子功能?促進重組促進重組,利于兩條DNA分子間的連接,增加基因組復雜性內含子里也有可能含有可讀框;內含子外顯子是相對的;含剪接信號產生核仁小RNA對基因表達產生影響第61頁/共159頁蛋白質結構域與外顯子內含子關系一個外顯子一般對應于一條多肽鏈折疊而成的結構域。邊界序列可以精確地對應蛋白質折疊的鉸鏈區。第62頁/共159頁不連續基因的分子進化結構基因來源于以外顯子作為模板構成的嵌合體。基因進化中,外顯子可以發生復制不同基因間,外顯子可以重復出現。第63頁/共159頁3真核生物基因組的序列異質性也就是序列的不均一性。可以通過復性動力學反應基因組序列復雜性。第64頁/共159頁DNA復性與Cot分析K復性速度常數第65頁/共159頁Cot1/2=1/kXDNA序列復雜度,量綱為核苷酸對的長度第66頁/共159頁DNA的復雜度通過與已知復雜度的標準DNA相比較而確定。復雜度以DNA的相對長度描述DNACot1/2/E.coli的DNACot1/2=DNA復雜度/4.2*106bp(P98)根據復性快慢將同一物種的總DNA分為幾個部分,也可以計算DNA的長度,和化學測定法結合測定序列的重復頻率。第67頁/共159頁據出現的頻率不同可將DNA序列分為3類:
1.高度重復序列在基因組中的重復次數>1052.中度重復序列在基因組中的重復次數為101-1053、低度重復序列在基因組中的重復次數為2-10拷貝
4.單拷貝序列在整個基因組中出現1次或少數幾次P101真核生物基因組的序列類型第68頁/共159頁散在重復順序是人類基因組中非串聯非反向的重復順序,包括少數活躍的轉位因子,根據重復序列的長度可將該家族分為2個主要類型,短散在核元件和長散在核元件。1.SINEs(shatinterspersednuclearelements)2.LINES(longinterspersednuclearelements)
代表Alu家族(逆轉錄轉座子)
KpnI家族(1)序列中含Alu限制酶位點(1)序列中含KpnⅠ限制酶位點(2)基因組中重復數3-5×105(2)全長6-7kb(3)Alu順序之間間隔:3-5kb(3)KnpⅠ消化后可見4條帶(4)相對集中在染色體R帶(4)集中分布在染色體G或Q帶
逆轉來轉座子
RNA介導轉座,合成cDNA→基因組編碼組蛋白、5SRNA,TRNA的基因也是中度重復序列第69頁/共159頁真核基因組中的轉座子
在真核基因組中,編碼序列在染色體中的位置相對比較穩定,但一些中度重復序列往往是可移動的。通常為RNA編碼。在些可移動成分的結構與原核基因組的轉位因子相似,是通過DNA介導的。
而另外一些中度重復序列的轉移成分,要先轉錄成RNA,再逆轉錄生成cDNA,然后重新整合到基因組中,這種逆轉錄旁路的轉移成分稱為逆轉錄座子(retroposon),是RNA介導的。第70頁/共159頁衛星DNA簡單重復序列,異染色質區,梯度離心時,主DNA峰之外的小峰,小衛星DNA微衛星DNA第71頁/共159頁轉位因子
轉位因子(transposableelement)即可移動的基因成分(可移動基因,movablegenemob),是指能夠在一個DNA分子內部或兩上DNA分子之間移動的DNA片段。在細菌中指在質粒和染色體之間或在質粒和質粒之間移動的DNA片段(文獻上有時形象地稱其為是跳躍基因,jumpinggene)。轉位也是DNA重組的一種形式。
第72頁/共159頁
移動基因最早由美國冷泉港實驗室(coldspringHarborLaboratory)的女科學家B.MClintock于上個世紀40年代晚期在玉米中首次發現的。60年代,為J.A.Shapirc研究大腸桿菌高效突變實驗證實。1983年榮獲諾貝爾生物學醫學獎。第73頁/共159頁(一)轉位因子的種類及特征細菌的轉位因子包插入序列,轉座子及可轉座的噬菌體。
1.插入序列(insertionsequence,IS)
IS的形體圖TSTranspcsasegeneTSIRIRTStargetsite靶位點Transposasegene轉位酶基因IRinvertedrepeated反向(倒轉重復順序)第74頁/共159頁(1)IS是一類較小的轉位因子,長度約700-2000bp,按發現順序IS1、IS2…命名,只攜帶轉移的必需基因,不含有其它偏碼蛋白質結構基因,本身沒有表型效應。(2)IS兩側為反向(倒轉)重復順序(16-41bp),中間為轉位酶基因,在插入新的位點側有3~116p順向重復順序(directwrepeatedsequencedk),DR是靶位點序列復制的產物。(3)IS到處活動,可以插入到E.coli染色體的各個位置上,也可以插入到質粒和某些噬菌體基因組上,甚至同一基因不同位點上。這種插入作用可以雙向進行,可以是正向,也可以是反向插入IS這種移動方式稱為轉位作用(transposition)。(4)在一個世代的107細菌中有1次插入。*TR(反向倒轉重復序列):GGAAGGT、、、ACCTTCCCTTCCA、、、TGGAAGG*DR(正同向重復序列):TACGTTACGT第75頁/共159頁2.轉座子(transposon,Tn)(1)Tn是一類較大的可移動成分,除mobgene外,尚含有其它基因,如抗藥基因等。Tn是在研究抗藥基因中發現的,由此知道抗藥基因可在質粒之間,質粒與染色體之間或質粒與可轉座的噬菌體之間來回移動,Tn的轉位原理和Is基本相同,轉位頻率為10-3~10-6/拷貝。(2)根據結構特征的不同,Tn可以分為2個亞類:
① 復合型Tn:轉座酶由IS編碼,IS可以是反向(或正向)重復構型。② TnA:數個結構基因(mob、mdr等)十IR組成。
StructuralgenesIRIRStructuralgeneIS1IS1第76頁/共159頁3.可轉座的噬菌體(transposablephage)(1)包括Mu和D108兩種噬菌體,是一類溫和噬菌體*。(2)感染細菌后,可以整合到細菌染色體中,插入位點是隨機的(而入phage插入位點是專一的),可以插到結構基因內部,引起突變,Mu即Mutator(突變子)因此得名。(3)插入部位的2側有短的DR,插入時,一個拷貝留在原位,新合成的拷貝插入新的部位。(4)和IS,Tn相比,Mu末端不含IR,這是可轉座成分的一個例外。第77頁/共159頁*噬菌體(phage)—是侵襲細菌的病毒,主要由蛋白質和核酸組成。噬菌的生活周期分為①溶菌周期和②溶原周期。溶原性噬菌體(溫和噬菌體)→宿主菌→將自身DNA整合到細菌染色體中→和細菌染色體一起復制→隨細菌增殖傳到細菌子代中去,不產生子代Phage.第78頁/共159頁(二)轉位作用的機理1.復制性轉位機理共聯體生成和解離,靶序列的切割與復制。2.非復制型轉位作用轉位將供體DNA轉座因子兩側各切斷一條單鏈并與靶序列的兩個游離末端連接,隨后并沒有復制過程,而是由轉座酶將供體DNA轉座因子的另一端也切斷,因此在供體DNA留下一個致死性缺口。轉座子的兩條游離單鏈在靶位點退火接合,DNA聚合酶項平缺口。第79頁/共159頁(三)轉位的遺傳效應1.基因重排可能產生1個新的蛋白分子等,基因重排是進化的動力。2.基因突變插入到基因內部,可引起插入失活。3.插入位點引入新的基因如引進抗藥基因。第80頁/共159頁真核生物的基因家族和基因簇基因家族(genefamily)
基因家族是指核苷酸序列或編碼產物具有一定程度同源性的一組基因.(來源同,結構相似、功能相關)基因家族中各個基因之間的關系:1.家族中各基因的核苷酸序列相同這些基因族也被稱為單純多基因家庭(如rRNA,tRNA家族)和復合多基因家族(如組蛋白基因家族).2.家族中各基因核苷酸序列高度同源3.家族中各基因編碼的蛋白質有高度的同源性,但基因的核苷酸序列可能不同。4.家族各基因編碼的蛋白質中具有很小的保守基序(conservedmotif)。5.基因超家族(genesuperfamily)基因超家族是指一組由多基因家族及單基因家族組成的更大的基因家族。它們的結構有程度不等的同源性,因此它們可能起源于相同的祖先基因,但是它們的功能并不一定相同,這一點正是與多基因家族的差別所在。這些基因在進化上也有親緣關系,但親緣關系較遠,故將其稱為基因超家族。第81頁/共159頁基因簇:指基因家族中各成員緊密成簇排列成大段的串聯重復單位,定位于染色體的特殊區域,為同一個祖先的基因擴增產物。第82頁/共159頁按照基因結構和轉錄方向可以分為簡單的多基因家族、復雜的多基因家族。第83頁/共159頁簡單的多基因家族如rRNA基因家族5SrRNA家族tRNA家族和
tRNA基因:
人類基因約有1300個tRNA基因,編碼50多種tRNA。每種tRNA可有10-幾百個基因拷貝。同種tRNA往往串聯在一起形成基因簇,但基因間有非轉錄間隔區分隔,常常比結構基因長近10倍。第84頁/共159頁復雜的的多基因家族由幾個多基因家族組成,如組蛋白基因家族5個成員,受發育調控的復雜多基因家族:這些基因家族的各個成員在DNA分子上的排列順序按照發育的不同階段先后次序排列,故也稱“發育控制復合多基因家族”。如α-珠蛋白和β-珠蛋白基因家族第85頁/共159頁基因超家族(genesuperfamily)基因超家族是指一組由多基因家族及單基因家族組成的更大的基因家族。它們的結構有程度不等的同源性,因此它們可能起源于相同的祖先基因,但是它們的功能并不一定相同,這一點正是與多基因家族的差別所在。這些基因在進化上也有親緣關系,但親緣關系較遠,故將其稱為基因超家族。如:免疫球蛋白超基因家族表達產物都有免疫球蛋白樣的結構域結構。有2個微球蛋白、MHCI類抗原的α鏈,Ⅱ類抗原的α鏈和β鏈,Thy1、CD4、CD8等與免疫有關的分子。在后又陸續發現了許多免疫系統內以及與免疫無關的家族成員。第86頁/共159頁假基因(pseudogene)
1.假基因在多基因家族中某些與正常功能基因在核苷酸序列上相似,但不能轉錄或轉錄后生成無功能基因產物的DNA序列,被稱為假基因。DNA序列,被稱為假基因。
2.假基因常用符號ψ表示,如ψα1
表示與α1
相似的假基因.3.假基因與有功能的基因同源,原來也可以是有功能的基因,由于發生缺失(deletion)、例位(inversion)或點突變(pointmutaion)等,成為無功能的基因,即形成了假基因,哺乳動物基因組中的1/4基因為假基因,可能為進化的痕跡。
第87頁/共159頁4.6.3線粒體基因與基因組的結構一個線粒體有多個DNA分子閉合雙鏈環狀分子大小差異大.動物<植物不與組蛋白結合,自主復制轉錄,缺乏修復機制編碼了呼吸鏈中的蛋白質亞基突變率高,與衰老相關,生物密碼的通用性及個例:P111第88頁/共159頁4.6.3葉綠體基因與基因組的結構編碼了呼吸鏈中的蛋白質亞基類囊體膜蛋白組分以及與氧化還原反應相關的酶類基因組較大,閉合雙鏈環狀分子不與組蛋白結合,含有數萬堿基對的兩個反向重復序列,大拷貝區,小拷貝區,P112第89頁/共159頁人類基因組簡介第90頁/共159頁人類基因組的組成(3×109bp)第91頁/共159頁一、什么是HGP?
人類基因組計劃(HumanGenomeProject,HGP)是由美國科學家于1985年率先提出,由六個國家的科學家共同參加的旨在闡明人類基因組30億個緘基對的序列,發現所有人類基因,破譯人類全部遺傳信息,使人類在分子水平上真正全面認識自我的科學計劃。
第92頁/共159頁人類基因組計劃
基因科學發展的必然要求是偏重單個基因的研究,還是轉到從整體水平上研究基因組?人類認識自身的必然要求例如:人類的進化?疾病產生的機制?人的生老病死?第93頁/共159頁HGP提出過程中的幾個事件:
1985年,加州大學校長Sinsheimer首次提出了測定人類基因組全序列的動議
1986年,諾貝爾獎獲得者DulbeccoR在《科學》雜志上熱情宣傳開展人類基因組計劃的意義1986年,美國能源部(DOE),正式提出實施測定人類基因組全序列的計劃
第94頁/共159頁1986年6月,HGP在美國冷泉港實驗室召開的分子生物學會議上引起了激烈辯論1988年2月,國家科學研究委員會(NRC)的15位專家撰寫完成“人類基因組的作圖與測序(mappingandsequencingthehumangenome)”的報告美國國會正式批準美國的“人類基因組計劃”于1990年10月1日正式啟動
第95頁/共159頁2.誰參與了HGP國際人類基因組測序協作組(公共計劃組)由6個國家、20個研究中心的2000多位科學工作者組成。國家承擔的測序任務美國54%英國33%日本7%法國2.8%德國2.2%中國1%第96頁/共159頁中國參與HGP研究的情況
HGP參加國:美國、英國、德國、日本、法國、中國。中國是唯一的發展中國家。中國開展基因組研究的情況:
1987年,開展模式生物水稻基因組計劃研究(“863”項目),2002年4月完成;
1993年,中華民族基因中若干位點基因結構研究(國家自然科學基金委);
1996年,人類重大疾病相關基因的定位、克隆、結構與功能研究(國家自然科學基金委);
第97頁/共159頁中國HGP研究機構:以強伯勤為主任的中國人類基因組北方中心(北京協和醫科大學);以陳竺為主任的中國人類基因組南方中心(上海瑞金醫院);1999年7月,以楊煥明為主任的中科院遺傳所人類基因組研究中心(北京)在國際人類基因組組織注冊。承擔任務:申請承擔其中1%的測序任務,即第3號染色體上的3000萬個堿基對;2000年,成立以楊煥明為主任的杭州華大基因研究中心(杭州)。
第98頁/共159頁研究進展:2000年3月底,中國科學家完成了第3號染色體上的3千萬個堿基對的測序和初步安裝工作,并計劃2003年完成全部組裝及分析工作。第99頁/共159頁中國的水稻基因組計劃:完成時間:2002年4月。堿基數目:基因組總基因序列達4.6億bp。基因總數:46022—55615個之間。完成單位:由來自北京、杭州華大基因研究中心暨中科院基因組信息學中心、中科院遺傳與發育生物學研究所等12個單位完成。
第100頁/共159頁人類基因組計劃研究進展
2000年6月,人類基因組工作草圖繪制成功。2001年2月,人類基因組精細圖譜繪制完成,并進行了初步解讀。
至2001年,包括小鼠、果蠅、線蟲、擬南芥、酵母、大腸桿菌、枯草桿菌等在內的模式生物基因組測序完成,發現并克隆到許多基因。
第101頁/共159頁科學家公布人類基因組細節研究成果
一、基因數量少得驚人。一些研究人員曾經預測人類約有14萬個基因,但塞萊拉公司將人類基因總數定在2.6383萬—3.9114萬個之間。最終確定出的基因數在這個范圍內,比如3萬個左右,那么,人類只比果蠅多大約1.3萬個基因。塞萊拉公司的科學家測出的序列準確地覆蓋了基因組的95%,并已經確定了所有基因的2/3,平均測序精度為99.96%。二、人類基因組中存在“熱點”和大片“荒漠”。人類基因組序列中所謂的“荒漠”就是包含極少或根本不包含基因的部分,基因組上大約1/4的區域是長長的、沒有基因的片段。基因密度在第17、第19和第22號染色體上最高,在X染色體、第4、第18號和Y染色體上相對貧瘠。三、35.3%的基因組包含重復的序列。這意味著所有這些重復序列,即原來被認為的“垃圾DNA”應該被進一步研究。事實上,第19號染色體57%是重復的。除了重復片段,科學家還鑒定了210萬個人與人之間不同的基因序列,這些序列被稱為“單核苷酸多態性”,它們通常是無害的。四、地球上人與人之間99.99%的基因密碼是相同的。研究發現,來自不同人種的人比來自同一人種的人在基因上更為相似。在整個基因組序列中,人與人之間的變異僅為萬分之一。第102頁/共159頁研究目標從基因組整體水平上解碼生命現象,認識生命起源、個體差異的起因、疾病產生的機制,衰老等的原因。第103頁/共159頁人類基因組研究的內容1、描繪遺傳圖譜
2、制作物理圖譜
3、完成序列圖譜
4、基因鑒定5、建立基因信息系統,儲存處理及開發相應軟件第104頁/共159頁遺傳圖譜轉錄圖譜0.7cM或kb
序列圖譜物理圖譜100kbSTSmap四張圖:物理圖轉錄圖遺傳圖序列圖
連鎖作圖序列作圖遺傳標記連鎖單位厘摩cM第105頁/共159頁遺傳圖遺傳圖又稱連鎖圖,是通過計算連鎖的遺傳標記之間的重組頻率來確定他們之間的相對距離,測定單位用CM表示,這對疾病基因的定位是至關重要的。在摩爾根研究的交叉互換中,他應用果蠅的許多不同性狀通過反復的雜交,從各性狀的重組率即可確定基因間的距離。遺傳學距離簡單的說就是在減數分裂過程中同源染色體間發生交換的可能,重組率與染色體上兩個座位間距離呈正相關。但實際細胞遺傳學中的交換與經典遺傳學中的重組是兩個不同的概念。如果父源與母源染色體在某兩座位上的等位基因完全相同,這時就不可能檢出任何重組的遺傳效應。因此,只有具有多態性的座位才有可能檢測到重組的發生,才有作為遺傳標記的價值。因此,人類基因組遺傳圖的建立需要:1、遺傳標記多,2、多態性,3、某座位上等位基因呈共顯性。第106頁/共159頁遺傳標志最早的遺傳標志是經典的性狀遺傳標記,如ABO血型、性別、HLA標志等,但這些蛋白多態性少、等位基因數目有限、分布不夠均勻、檢測技術復雜第一代遺傳標記:RFLP,DNA順序的改變遍于整個基因組(尤其基因組),平均每200bp就有一個,這種改變可通過限制性內切酶切點的有無,導致酶切片段長度多態。1983年,Huntington舞蹈癥定位就是應用此技術。但此法限制酶種類有限、還需同位素標記探針,復雜煩瑣。第二代遺傳標記:VNTR或STR,不但具多態性高頻率,還可PCR擴增而自動化第三代遺傳標記:SNP,數量多,覆蓋密度高,還與基因功能密切相關。第107頁/共159頁遺傳圖與基因定位遺傳圖對疾病基因的定位至關重要:一個基因位點至少有兩個等位基因,一個正常,一個異常,只有通過異常才發現正常,如紅綠色盲基因的發現,才定位此基因。如我們想知道某種病的基因定位就可分析此位點與某一遺傳標記的交換情況,就可在這遺傳標記附近找這基因。進一步找基因就需要物理圖了(進一步找遺傳標記旁的物理標記,再沿著找相鄰片段群)
第108頁/共159頁17cM11cMXg(血型基因)ich(普通魚鱗病)OA(眼白化癥)遺傳圖譜舉例:重組頻率用于X染色體上基因的連鎖和定位第109頁/共159頁物理圖物理圖用于確定各遺傳標記之間的物理距離,用kb或Mb表示。1CM相當1Mb物理圖有兩種
1、以一段已知核苷酸序列的DNA片段即序列標記部位STS(sequencetaggedsite)為路標,以Mb或kb做圖距的基因組圖。
STS的要求:在基因組有明確的位置,且是一段已知的序列因此,可用一段已知的DNA序列做探針,就可找到某一位置的路標。至1996年10月已建立22000個STS,分辨率達199kb2、建立以DNA克隆片段相互重疊的鄰接克隆群(contig),即由225個YAC連續克隆重疊群組成的覆蓋人類基因組75%的物理圖。如將含有一個STS路標的DNA片段一個個接起來稱為相鄰片段群,或相鄰克隆群。(相鄰克隆群的建立為大片段測序創造了條件)第110頁/共159頁轉錄圖轉錄圖又稱表達圖。它是以部分5端或3端cDNA序列即EST為路標,根據轉錄順序的位置和距離所繪制的圖。人體每一特定組織,只有10%的基因是表達的,只要分離某一發育階段、某一組織的mRNA,進而合成相應的cDNA,然后克隆、測序,這些cDNA序列標記即表達的標簽序列EST。轉錄圖有特定的意義:①首先由于DNA轉錄是有組織和時間特異的,它來源于已知的某一生育階段的某一組織,它可使我們了解某一基因在不同時間、不同組織、不同水平的表達,也可以了解某一特定時間不同組織、不同基因的表達②為HGP提供表達序列③為基因功能研究提供信息④為基因鑒定提供侯選基因⑤編碼序列具潛在商業價值第111頁/共159頁序列圖序列圖即分子水平的物理圖,測定長度約1米的31億個核苷酸的順序。策略:從上而下:①建立人基因組DNA的酵母人工染色體(YAC)重疊群②利用DNA標志或DNA指紋圖譜建立有序排列的連續克隆系,常用的標志有STS和EST③將這些克隆系列分別定位于染色體的不同區域,構成全基因組物理圖譜④再對這些克隆進行亞克隆,作為測序模板⑤再進行序列分析,尋找開放閱讀框全基因組鳥槍法:不需構建YAC的重疊群,而是直接對人類基因組的大小不同的隨機克隆進行直接測序,然后運用計算機分析,將各測序片段進行排列。
第112頁/共159頁遺傳標記的種類路標?已知的基因,多態性標記(限制性內切酶位點,RFLP,可變數目串聯重復(VNTR)SIR,,STR,SNP,STS虛列標簽位點第113頁/共159頁人工染色體:YAC人工染色體載體是利用釀酒酵母Saccharomycescerevisiae)的染色體的復制元件構建的載體,其工作環境也是在釀酒酵母中。釀酒酵母的形態為扁圓形和卵形,生長的代時為90分鐘;含16條染色體,其大小為225-1900kb,總計有14×106bp;具真核mRNA的加工活性。
第114頁/共159頁YAC載體的復制元件是其核心組成成分,其在酵母中復制的必需元件包括復制起點序列即自主復制序列autonomouslyreplicatingsequence,ARS)、用于有絲分裂和減數分裂功能的著絲粒(centromere,CEN)和兩個端粒(TEL)。
YAC載體為能夠滿足自主復制、染色體在子代細胞間的分離及保持染色體穩定的需要,必須含有以下元件:
·端粒重復序列(telomericrepeat,TEL):定位于染色體末端一段序列,用于保護線狀的DNA不被胞內的核酸酶降解,以形成穩定的結構。
·著絲粒(centromere,CEN):有絲分裂過程中紡錘絲的結合位點,使染色體在分裂過程中能正確分配到子細胞中。在YAC中起到保證一個細胞內只有一個人工染色體的作用。如pYAC4使用的是酵母第四條染色體的著絲粒。
·自主復制序列(autonomouslyreplicationsequences,ARS)一段特殊的序列,含有酵母菌中DNA進行雙向復制所必須的信號。
第115頁/共159頁YAC載體的選擇標記主要采用營養缺陷型基因,如色氨酸、亮氨酸和組氨酸合成缺陷型基因trp1、leu2和his3、尿嘧啶合成缺陷型基因ura3等,以及赭石突變抑制基因sup4。第116頁/共159頁“逐個克隆法”:對連續克隆系中排定的BAC克隆逐個進行亞克隆測序并進行組裝(公共領域測序計劃)人類基因組計劃:大規模測序基本策略“
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 社區重陽節工作總結模版
- 小學數學教師教育教學工作總結模版
- 統編人教版三年級語文下冊《口語交際:春游去哪兒玩》示范公開課教學課件
- 蘇少版四年級音樂下冊第一單元四季放歌教學設計
- 災害急救護理體系構建
- 員工心態培訓總結模版
- 陜西省2025屆七下數學期末經典模擬試題含解析
- 新員工入職工作心得體會模版
- 級長工作總結大班級級長工作總結模版
- 大學生職業規劃大賽《經濟統計學專業》生涯發展展示
- (正式版)JB∕T 14455-2024 土方機械 非公路自卸車 電傳動系統控制要求
- 費用組成-特殊施工增加費課件講解
- 2024年湖南省長沙市雅禮實驗中學中考二模考試英語試題
- 2023年八年級歷史下冊競賽試卷
- 國民經濟行業分類代碼表
- 小學六年級下冊數學期末考試卷完整版
- 人工智能設計倫理智慧樹知到期末考試答案章節答案2024年浙江大學
- MOOC 網絡技術與應用-南京郵電大學 中國大學慕課答案
- 交付管理體系
- 國際市場開拓策略研究
- 小兒支氣管肺炎護理查房
評論
0/150
提交評論