基于組學數據的作物育種技術研究_第1頁
基于組學數據的作物育種技術研究_第2頁
基于組學數據的作物育種技術研究_第3頁
基于組學數據的作物育種技術研究_第4頁
基于組學數據的作物育種技術研究_第5頁
已閱讀5頁,還剩3頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于組學數據的作物育種技術研究

現在,對于許多作物的育種,育種者可以使用數百或數千種親水材料,并且可以選擇1000多種混合組合。由于試驗規模的限制,一個育種項目所能配置的組合一般只有數百或上千,育種家每年花費大量的時間去選擇究竟選用哪些親本材料進行雜交;對配制的雜交組合,一般要產生2000個以上的F2分離后代群體,然后從中選擇1%~2%的理想基因型,中選的F2個體在遺傳上是雜合體,需要做進一步的自交和選擇,每個中選的F2個體一般需產生100個左右的重組近交家系才能從中選擇到存在比例低于1%的理想重組基因型。育種早期選擇一般建立在目測基礎上,由于環境對性狀的影響,選擇到優良基因型的可能性極低,統計表明,在配制的雜交組合中,一般只有1%左右的組合有希望選出符合生產需求的品種,考慮到上述分離群體的規模,最終育種效率一般不到百萬分之一。因此常規育種存在很大的盲目性和不可預測性,育種工作很大程度上依賴于經驗和機遇。生物個體的表型是基因型和環境共同作用的結果,植物育種的主要任務是尋找控制目標性狀的基因,研究這些基因在不同目標環境群體下的表達形式,聚合存在于不同材料中的有利基因,從而為農業生產提供適宜的品種。生物數據可以來自生物的不同水平,如群體水平、個體水平、孟德爾基因水平和DNA分子水平等,各類生物數據為作物育種提供了大量的信息。尤其隨著分子生物學和基因組學的飛速發展,生物信息數據庫積累的數據量極其龐大,但由于缺乏必要的數據整合技術,可資育種工作者利用的信息卻非常有限,作物重要農藝性狀基因(quantitativetraitlocus,QTL)的定位結果也難以用于指導作物育種實踐。作物分子設計育種將在龐大的生物信息和育種家的需求之間搭起一座橋梁,在育種家的田間試驗之前,對育種程序中的各種因素進行模擬篩選和優化,提出最佳的親本選配和后代選擇策略,從而大幅度提高育種效率。1新體育學研究為分子設計育種提供了新手段近年來,主要作物的基因組學研究,特別是擬南芥、玉米、水稻和小麥基因組學研究取得了巨大成就,基因定位和QTL作圖研究為分子設計育種奠定了良好基礎,計算機技術在作物遺傳育種領域的廣泛應用為分子設計育種提供了有效的手段。國內外生物領域的高技術飛速發展,主要表現在以下5個方面。1.1我國生物酶基因測序研究的現狀在過去的幾年里,由于基因組學和蛋白組學的飛速發展,3大核酸序列數據庫,即歐洲生物信息研究所(EuropeanBioinformaticsInstitute,EBI)維護的EMBL數據庫、美國國家生物技術信息中心(NationalCenterforBiotechnologyInformation,NCBI)的GenBank數據庫和日本國立遺傳學研究所(JapanNationalInstituteofGeneticsCenterforInformationBiology)的DDBJ數據庫,截至1992年1月總計收錄核酸序列數據只有59317條,共77805556堿基對;截至2005年3月,3大數據庫收錄的核酸序列已經達到43118204條,共計47099081750堿基對,年份間呈幾何級數增長。2002年,國際3大機構PIR(ProteinInformationResources,蛋白質信息資源,美國國家健康研究所)、EBI和SIB(SwissInstituteofBioinformatics,瑞士生物信息研究所)將3個蛋白質數據庫PIR、SWISS-PROT和TrEMBL合并組建了單一的權威性蛋白質數據庫UniProt,截至2005年5月24日已經收錄了1748002條蛋白質序列共計555158414個氨基酸。在這些數據庫中,有關植物DNA序列主要來源于擬南芥、玉米、水稻和小麥等。水稻作為模式植物和世界上最重要的糧食作物之一,其基因組學研究一直走在其他作物的前列,是第一個完成測序的重要農作物。我國在2002年完成了世界首張秈稻基因組草圖,與Syngenta公司完成的粳稻基因組草圖同時發表在Science。隨后完成了粳稻(日本晴)4號染色體的精確測序,是世界上首先完成的2條精確測序水稻染色體之一。同時還完成了秈稻(廣陸矮4號)4號染色體80%的精確測序以及水稻4號染色體著絲粒的序列分析。上述工作的完成使我國水稻基因組測序研究處于世界領先水平。所有這些序列以及基因和蛋白質結構和功能的數據成為全世界科學界的寶貴資源和財富,這些海量的序列信息給高效、快速的基因發掘和利用提供了新的契機,在若干研究領域實現跨越式發展甚至“革命”的時機已經到來。但是,如何收集和處理這些DNA和蛋白質信息,并在作物改良中加以應用仍是一個巨大的挑戰。1.2第三代分子標記的開發自20世紀80年代以來,先后開發出基于Southern雜交的第一代分子標記(RFLP為代表)和基于PCR的第二代分子標記(SSR為代表)。隨著植物基因組學研究的發展,全基因組序列、EST及全長cDNA數量迅猛增長,成為開發新型分子標記的新資源。因此目前全世界正在大力開發基于基因序列的第三代分子標記,即來自cDNA序列的SSR和SNP標記。這類分子標記具有數目多、適于高通量檢測的優點;更重要的是,由于EST和cDNA全長序列是表達基因序列,通過對現有的EST或全長cDNA數據進行標記查尋,再進行合適的標記引物設計和多態性檢測,就可以找到穩定可靠的基于表達基因的特定分子標記。因為標記來自基因的轉錄區域,因此這些標記能更好地對基因功能的多樣性進行更直接的評估。cSSR標記還具有一個優點,即部分標記可以跨物種應用,因為在不同物種中的表達基因大多數是相似的,針對這些表達基因設計的SSR標記就可以在物種間通用。此外,根據EST序列信息或根據不同種質資源中的基因序列比較分析,還可以開發出針對特定等位基因的SNP標記,這些SNP標記將大大方便對有利基因的分子標記輔助選擇。1.3主要農作物的ssr-qp擴增和ssa表達在農業和經濟作物重要農藝性狀大多是數量性狀,受多基因控制,這些基因間存在復雜的相互作用,基因的表達容易受環境因素的影響。分子標記技術的飛速發展,極大促進了基因定位特別是數量性狀基因定位的研究,定位數量性狀的基因位點(QTL),闡明它們的效應、上位性以及與環境的互作,是當代遺傳育種研究的一個重要方向。目前,植物QTL定位方面應用較廣的方法有:區間作圖、復合區間作圖和基于混合線性模型的復合區間作圖等。利用這些方法,對主要農作物的數量性狀進行了大量的定位研究,截止2005年4月僅CAB(國際農業和生物學中心文摘數據庫)收錄的各種QTL定位的論文就有3497篇,其中植物方面的QTL定位研究論文1581篇,研究比較深入的作物有水稻、玉米、小麥和番茄等。研究者從不同角度分析了QTL的主效應、QTL之間的互作效應、QTL與環境的互作效應等,采用的作圖群體包括重組自交系(RIL)、加倍單倍體(DH)、F2及其衍生群體、回交群體、隨機交配群體和染色體片段置換系(CSSL)群體等;在此基礎上,進行單基因分解、精細定位和圖位克隆研究。等位基因變異的檢測與表型性狀的深入鑒定相結合已成為從種質資源中發掘新基因的有效手段。自1995年以來,Eshed和Zamir倡導利用高代回交導入系結合定向選擇,大規模發掘種質資源中有利基因,從而獲取QTL的復等位基因在不同遺傳背景下的表達效應,以便將QTL定位研究與植物育種緊密結合起來,為分子設計育種提供全面、準確的遺傳信息。1.4在染色體上進行定位利用EST或cDNA全長序列等信息對表達序列直接進行作圖已成為發掘新基因和比較基因組學研究的重要途徑之一。EST是目前發現新基因的主要信息來源之一,尤其是對尚未進行全基因組測序的小麥和玉米等作物來講,EST是了解基因組中基因序列特征、開發基因特異性標記的重要信息基礎。例如,通過把與抗病基因或防御反應基因相似的EST在水稻染色體上進行作圖,發現部分EST定位在以前就已明確含有抗病基因的染色體區域。通過EST序列還可以鑒定出那些編碼特定代謝途徑中的酶類基因,因此EST也是揭示作物代謝途徑的重要方法。NCBI利用BLAST技術把EST數據進行了整理和分析,建立了dbEST數據庫;為了更好地利用EST數據,NCBI還根據基因序列對EST進行了分類,進一步建立了UniGene數據庫,其中來自水稻、小麥和玉米的序列數分別為20607條、22959條和13193條(2003年7月數據)。研究表明,通過將EST或cDNA全長序列等信息對表達序列直接進行作圖,可以把不同基因定位在染色體上。例如,Wu等用6591個水稻EST進行了轉錄圖的構建,明確了各表達基因在染色體上的位置。這些數據與全基因組序列的基因注釋信息結合起來,已使人們對水稻中的基因有了更清晰的認識。1.5主基因控制和分子標記輔助選擇優勢利用轉基因技術進行作物品種改良已取得一定進展。但是,目前轉基因技術還僅限于利用主基因改良單一目標性狀,對于由多基因控制的大多數重要農藝性狀,轉基因技術尚無法發揮其優勢。另一方面,國內外對分子標記輔助選擇育種做了不少有益的嘗試,但對主基因控制的性狀,分子標記輔助選擇并不比傳統的選擇方法有明顯優勢;對多基因控制的重要農藝性狀,由于QTL在遺傳上的復雜性、背景依賴性以及與環境的復雜互作,現有的QTL定位成果很難直接用于指導分子標記輔助選擇育種。2國內分子設計育種的發展模式植物擬南芥和水稻的全基因組序列測定的完成,使得植物基因組學研究由結構基因組向功能基因組等各種“組學”迅猛發展。基因組學和蛋白組學借助生物信息學的力量讓人們從分子水平上了解植物亞細胞生理活動及真核生物的多細胞是如何組成并實現其復雜的功能,各種“組學”把傳統生物學迅速帶入了系統生物學的新時代,這一革命性的改變催生了分子設計(moleculardesign)的概念。目前,已有許多研究機構在做前期準備工作,朝此方向發展。美國農業部已投資在十幾個研究單位建立各種作物的數據庫,這些數據庫的整合將成為未來分子設計育種的重要基礎。其他比較有影響的研究機構如美國的先鋒公司、澳大利亞的昆士蘭大學和CSIRO,以及國際玉米小麥改良中心在基因型到表型建模、基因型與環境互作分析及育種模擬等方面開展了研究。中國水稻所2004年提出水稻基因設計育種的概念,就是在水稻全基因組測序完成后,在主要農藝性狀基因功能明確的基礎上,通過有利基因的剪切、聚合,培育在產量、米質和抗性等多方面有突破的超級稻新品種。目前我國開展分子設計育種的時機已經成熟,其主要表現有以下4個方面。(1)我國已擁有生物信息學的研究力量和技術。我國是世界上首次對水稻全基因組測序并對水稻第4染色體精細測序的國家之一。在測序的過程中,生物信息學手段是完成序列組裝和分析的關鍵。能完成這些大量的測序任務,本身就說明我國已擁有很高的生物信息學研究水平。另外,從基因組序列、EST信息和全長cDNA序列中發掘新標記和新基因的工作也已取得了一定進展。(2)已開展虛擬分子育種。我國利用分子數量遺傳學和計算機技術研究QTL作圖、QTL與環境之間的關系方面位于國際同等水平,國家高技術研究發展計劃(863計劃)已經資助開展主要農作物的虛擬育種研究,在回交育種、聚合育種、雜種優勢預測和親本選配的計算機模擬研究等方面已經取得了一定進展。(3)已擁有建立大型的數據搜集和處理系統的技術和經驗。我國的國家作物種質資源信息系統已建立多年,目前該系統中儲存的數據已達數千萬項,在大型數據庫的建立、完善和維護方面積累了豐富的經驗。(4)已擁有基因作圖、比較基因組學研究、等位基因多樣性研究等關鍵技術。我國在作物的基因作圖方面開展得比國外晚,但近年來進步很大,并且涉及到各種重要作物的大多數重要性狀。利用DNA和蛋白質序列信息,針對特定基因或基因類型進行作圖在水稻之外的其他作物上也發展很快。此外,我國已開展小麥族內的物種之間、禾本科作物之間的比較基因組學研究,并取得了一定進展,正在開展的等位基因多樣性研究也已取得階段性成果。與國外同類研究相比,我們的差距主要存在以下3個方面。(1)主要農藝性狀基因發掘和功能研究存在不足。近十年來,我國利用分子標記,在水稻、小麥、玉米等主要作物中已經開展了大量的基因(特別是QTL)定位研究,積累了大量的遺傳信息。但這些信息還處于零散的狀態,缺乏集中、歸納和總結;對不同遺傳背景和環境條件下QTL效應、QTL的復等位性以及不同QTL之間的互作研究不夠系統全面,不利于QTL定位的成果轉化為實際的育種效益;重要農藝性狀的遺傳基礎、形成機制和代謝網絡研究還很欠缺,而這些正是分子設計育種的重要信息基礎。同時,缺乏擁有自主知識產權的計算機軟件,限制了將已有的基因或QTL信息應用到實際育種中去。(2)分子設計育種相關的信息系統不夠完善。在國家高技術研究發展計劃(863計劃)和國家重點基礎研究發展計劃(973計劃)等項目的大力支持下,主要農作物主要經濟性狀遺傳研究取得了很大進展,國家已全面啟動水稻等主要糧食作物主要經濟性狀的功能基因組研究,但是距全面了解作物所有性狀的遺傳基礎還比較遙遠。我國現有的生物信息數據庫中,已明確功能和表達調控機制的基因信息比較匱乏;在轉錄組學、蛋白組學、代謝組學以及表型組學等方面的研究與國際上存在較大差距,作物種質資源信息系統中,能被分子設計育種直接應用的信息還很有限。(3)分子設計育種理論研究相對滯后。目前,國內已經開始意識到分子設計育種將會成為未來作物育種的發展方向,但大多尚停留在概念上,還沒有真正開展分子設計育種的理論建模和軟件開發工作。3中國食品分子設計與繁殖的研究我國的作物分子設計育種研究應集中在以下3個方面。3.1回交組合定位結果構建水稻、小麥、玉米、大豆和棉花等作物的高代回交導入系群體,通過大規模回交導入系并結合定向選擇,消除復雜的遺傳背景對基因/QTL定位精度的不良影響,高效發掘種質資源中重要農藝性狀的基因/QTL。通過不同輪回親本和供體親本配制的高代回交組合定位結果的分析比較,探明基因/QTL的一因多效、多因一效、同一基因/QTL位點的復等位性、基因/QTL之間的上位性互作、基因/QTL與遺傳背景之間的互作、基因/QTL與環境互作等信息。高代回交導入的遺傳背景高度純化,便于直接對主效應大、表達穩定的基因/QTL進行精細定位。3.2品種資源利用核心種質以最小的資源數代表最大的遺傳多樣性,即保留盡可能小的群體和盡可能大的遺傳多樣性;骨干親本則是當前作物育種中廣泛使用并取得較好育種成效的育種材料,其中含有大量有利基因資源。發掘這兩類材料中的遺傳信息并建立其分子設計育種信息系統和鏈接,可以快速獲取親本攜帶的基因及其與環境互作的信息,為分子設計育種模型精確預測不同親本雜交后代在不同生態環境下的表現提供信息支撐。3.3gp模型中的育種核心表型GP(Genotypetophenotype)模型描述不同基因和基因型、以及基因和環境間是如何作用以最終產生不同性狀的表型,從而可以鑒定出符合不同育種目標和生態條件需求的目標基因型,因此GP模型是分子設計育種的關鍵組成部分。GP模型利用發掘的基因信息、核心種質和骨干親本的遺傳信息鏈接提供的信息,結合不同作物的生物學特性及不同生態地區育種目標,對育種過程中各項指標進行模擬優化,預測不同親本雜交后代產生理想基因型和育成優良品種的概率,大幅度提高育種效率。4對國外分子育種的質疑Peleman和vanderVoort對“設計育種”(Breedingbydesign)這一名詞進行了商標注冊,他們認為分子設計育種應當分3步進行:(1)定位所有相關農藝性狀的QTL;(2)評價這些位點的等位性變異;(3)開展設計育種。這里結合我們在水稻上的一些研究結果說明分子設計育種的過程。4.1標記的多態性這一過程包括構建作圖群體、篩選多態性標記、構建標記連鎖圖譜、評價數量性狀的表現型和QTL分析等步驟。這里有一包含65個染色體片段置換系(chromosomesegmentsubstitutionline,CSSL)的群體,產生這一群體的2個親本分別為粳稻Asominori(背景或輪回親本)和秈稻IR24(供體或非輪回親本)。每個CSSL包含一個或幾個來自IR24的染色體片段,其余染色體來自背景親本Asominori。所有供體染色體片段覆蓋了IR24的整個基因組,不同染色體片段用不同的RFLP標記表示。根據粒長的觀測值,可以通過分析不同標記基因型間粒長的差異顯著性來判斷哪些片段上攜帶有影響粒長的QTL。存在QTL的可能性常用LOD值的大小來衡量(圖1-A),圖1-A清楚表明標記M23和M34代表的染色體片段上包含有控制粒長的QTL,它們分別解釋粒長表型變異的36.9%和8.9%,因此可視為主效QTL,尤其是M23染色體片段上的QTL。但這2個QTL加性效應的方向相反(圖2-B),即對于標記M23上的QTL來說,來自IR24的等位基因使粒長增加,來自Asominori的等位基因使粒長減小;對于標記M34上的QTL來說,來自IR24的等位基因則使粒長減小,來自Asominori的等位基因使粒長增加。實踐中,可根據不同研究目的選擇LOD臨界值去判定QTL的存在,如果研究目的在于QTL的克隆和功能分析,則判定QTL存在時應選擇較高的LOD臨界值,如3.0或更高,以避免假陽性;如果目的在于預測基因型,則假陽性不會對結果造成較大的負面影響,此時可選擇較低的LOD臨界值,如1.0,以保證效應較小的QTL也能鑒定出來。在上面的實例中,當采用0.83的臨界值時(對應于顯著性水平0.05),我們一共鑒定出13個控制粒長的QTL,8個控制粒寬的QTL,同時也鑒定出一些上位性QTL。4.2基因型的估計和遺傳多樣性這一過程利用已經鑒定出的各種重要育種性狀QTL的信息,包括QTL在染色體上的位置、遺傳效應、QTL之間的互作、QTL與背景親本和環境之間的互作等,模擬預測各種可能基因型的表現型,從中選擇符合特定育種目標的基因型。在我們的例子中,Asominori是短粒和寬粒型品種,IR24是長粒和窄粒型品種,但它們的CSSL后代在2個性狀4個方向上均有超親分離現象,因此2個性狀的增效QTL和減效QTL在2個親本中應該分散分布。通過對粒長的QTL作圖,發現在染色體片段M6、M12、M14、M23和M25上的5個QTL具有正效效應,即對于這些座位上的QTL來說,來自IR24的等位基因使粒長增加;對于粒寬,只有一個QTL具有正效效應,說明增加粒寬的大多數基因來自Asominori。除此之外還發現一些染色體片段如M10、M12、M14和M23,同時攜帶有既控制粒長又控制粒寬的QTL;在片段M10上,QTL對粒長和粒寬效應都是正向的;在其他片段上,QTL對粒長和粒寬效應卻相反。這一點與根據表型估計的相關系數r=-0.34**一致。根據上面的信息,可以預測各種可能的基因型的表現型(圖2),發現最小和最大粒長基因型的粒長分別是4.20mm和6.21mm,最小和最大粒寬基因型的粒寬分別是2.12mm和3.07mm。假定育種目標是長粒和寬粒型,由于一些QTL在2個性狀上有負向的一因多效現象,不可能獲得一個基因型既具有圖2中最大粒長又具有最大粒寬。經模擬我們發現一個設計基因型,其粒長為6.05mm,粒寬為3.00mm,接近最大粒長6.21mm和最大粒寬3.07mm(圖2)。至此我們設計出一個最符合長粒和寬粒型這一育種目標的基因型。4.3標記選擇方案獲得圖2中的設計基因型,需要IR24的4個染色體片段,即M1、M6、M23和M25。在65個CSSL中,CSSL5包含片段M6;CSSL16包含片段M1和M23;CSSL19包含片段M25;因此可以作為產生設計基因型的親本材料。但CSSL19包含有我們不需要的片段M12,在選擇過程中需要將其替換為Asominori的片段。3個親本間的三交(又稱頂交)組合有可能將我們需要的染色體片段聚合在一起,產生三交組合的方式有3種,即三交組合1:(CSSL5×CSSL16)×CSSL19;三交組合2:(CSSL5×CSSL19)×CSSL16和三交組合3:(CSSL16×CSSL19)×CSSL5。假定采用標記輔助方法選擇目標基因型,可供選擇的方案有很多,這里只考慮其中的2種,標記選擇方案1:產生100個三交F1個體,每個產生30個F2個體,利用單粒傳共產生3000個F8家系,然后從中選擇目標基因型;標記選擇方案2:產生100個三交F1個體,通過標記輔助選擇只保留含有目標染色體片

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論