SLAF簡化基因組測序_第1頁
SLAF簡化基因組測序_第2頁
SLAF簡化基因組測序_第3頁
SLAF簡化基因組測序_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

I0I0SLAF-seq技術:大規模基因分型高通量策略大規模基因分型在遺傳相關性研究中起著重要作用, 尤其是和高通量測序技術結合后, 它為基因挖掘帶來了新的機遇。大規模基因分型的有效解決方法: SLAF-seq(specific-locusamplifiedfragmentsequencing ),該技術前期利用生物信息學方法,對目標物種的參考基因組(或已知BAC序列)進行系統分析,設計標記開發方案,后期根據前期的方案,構建SLAF-seq文庫,篩選特異性長度片段進行高通量測序,將獲得測序深度和質量滿足要求的SLAF片段來代表目標物種的全基因組信息。它具有以下優勢 :高深度測序保證分型準確;簡化的策略降低測序成本;前期簡化方案預測保障標記數量最優;采用doubleindex技術能適用于大群體。在文章中,我們用水稻和大豆數據驗證了 SLAF-seq技術的有效性,2個結果都顯示預測的和實際的結果一致性非常高,同樣基因分型也非常準確。我們還利用這個技術構建了鯉魚的高密度遺傳圖譜(物種高雜合且無參考基因組) ,對2個親本和211個子代進行簡化測序,得到50,530個SLAF標簽,構建了50條連鎖群,上圖標記5885,標記平均距離0.68cM。將得到的連鎖群與鯉魚的近緣物種斑馬魚進行比較基因組學研究,結果顯示鯉魚的 2條連鎖群對應斑馬魚的1條染色體,二者的共線性良好,說明高質量的 SLAF分型結果。SLAF-seq技術為大規模基因分型提供了一個高通量的策略, 并且能應用于不同物種和群體,適用性非常廣。SLAF標記的質量評估部分的基本原理,采用基因分型質量評分對標記質量進行評估。質量評分采用PHRED公式的算法,錯誤率數據用新的方法得到。文章中,對于SLAF簡化效率的評估方式和結論,通過仿真研究發現4>以上的測序深度能夠保證 SLAF的準確性。對鯉魚4.28XI的測序進一步驗證,SLAF的質量能將錯誤率控制在3%(5/190)以內。SLAF的技術流程:預實驗:用rice和soybeans等trainingdata確定酶和酶切片段大小。構建文庫:包括酶切,連接, PCR反應,凝膠電泳過程。基因分型:采用配對雙末端測序獲得短片段 DNA序列信息,用軟件定義和評估基因型。

EipcaeflSUtfpowbw ?ndicmm byiroimiig伽ichtmetofSLAFselMilon02BQ置<1|5G?Pi■禺emSirft.bci==_==-_Bi==EipcaeflSUtfpowbw ?ndicmm byiroimiig伽ichtmetofSLAFselMilon02BQ置<1|5G?Pi■禺emSirft.bci==_==-_Bi===二三二High4hri3ughpiJl$$qLB$e>cirigstnrdgenotyping!=■■■一三二二E=!!_=■_=二f」IMr5_1士—=_£_下圖所反映的分析流程展示如何用質量評分選擇高質量遺傳標記和個體的動態優化過程。 首先對每個SLAF和個體計算低質量的標記。 刪除標記質量最差的SLAF和個體。重復以上過程,直到所有SLAF標記的平均質量分達到13。通過計算標記或者個體的低質量基因型數量,反復刪除標記或者個體,最終使標記平均質量值達到閾值,文章中最終得到 7559個標記和160個體。Sconedistribution9000£E60000 40 80 120 160 20QInidividualsnumber3000anteA皆gm.5-1B°0 5 101S2d25 30Genotypescore匸Sconedistribution9000£E60000 40 80 120 160 20QInidividualsnumber3000anteA皆gm.5-1B°0 5 101S2d25 30Genotypescore匸.2三Ea.i'eliCDBQ#SLAF標記的質量評估部分的基本原理是貝葉斯方法驗證分型準確性, 通過基因型覆蓋度和多態性計算個體在某個標記位點擁有某個基因型的概率, 綜合考慮測序深度和測序錯誤率將每個基因型進行打分。以分值大小評估標記質量。文章中,對于SLAF簡化效率的評估方式和結論,實際標記數和預測值盡量接近; SLAF均勻分布于基因組上;、避免重復序列。遺傳圖譜評估的方案和結果,研究重組斷點,檢查重組斷點的準確性;比對同源物種,檢查同源性。只有1.51%分型可疑,25.6%的標記唯一比對到斑馬魚基因組, 且有良好的共線性。SLAF技術結合了位點特異性擴增和高通量測序,可以用于全基因組范圍的 DeNovoSNP開發和大范圍的基因分型。為了提高片段選擇的高效性,生物信息統計模型被開發出來, 用于進行特定位點選擇的擴增,這種是基于 training數據的。它包含稀有序列BAC序列和基因組草圖序列。這種t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論