基于測序的微生物多樣性分析總結_第1頁
基于測序的微生物多樣性分析總結_第2頁
基于測序的微生物多樣性分析總結_第3頁
基于測序的微生物多樣性分析總結_第4頁
基于測序的微生物多樣性分析總結_第5頁
免費預覽已結束,剩余3頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于二代高通量測序的環境微生物多樣性分析一般認為土壤、海洋、腸道等生態系統中的微生物數量繁多、 種類多樣。傳統的培養方法只限于對環境樣品中極少部分(0.1%-1%)可培養的微生物類群的研究,而變性梯度凝膠電泳 (DGGE、克隆文庫等常規的分子生物學方法也因操作復雜、成本高、痕量菌發現困難等因素無法達到深入分析環境微生物多樣 性的目的。高通量測序技術的出現, 極大的促進了對環境中不可 培養微生物以及痕量菌的研究, 為環境微生物多樣性的研究開啟 了新的研究熱潮。微生物群落中物種的多樣性依然是目前研究的重點。對群 落結構的研究,將有助于了解種群結構的穩定性,進而了解種群內物種間的相互依賴、相互制約的

2、內在聯系,為將來構建功能性 種群服務。鑒于微生物群落是一個多物種的集合體,其中高達95%以上的微生物物種無法分離也不能獨立培養,拼裝出每個獨立個體的基因組現在也無法實現,細菌16S或真菌ITS測序分析依然是現階段微生物群落多樣性和多態性分析的基石。一、高通量測序背景介紹高通量測序技術,可以一次對幾十萬到幾百萬條 DN份子進行序 列測定,使得對PCRT增產物直接進行序列測定成為可能。極大 的促進了對環境中不可培養微生物以及痕量菌的研究, 為環境微 生物多樣性的研究開啟了新的研究熱潮。 目前高通量測序的主要平臺代表有Illumina 公司的 Solexa 基因組分析儀(IlluminaGenome

3、Analyzer ) 、 羅氏公司(Roche) 的 454測序儀 ( Roch GSFLXsequencer )和 ABI 的 SOLiD 測序儀(ABI SOLiD sequencer )。微生物多樣性分析中,以Illumina 及 454測序平臺應用最為廣泛。二、工作流程1 PCR引物的設計2 PCR擴增條件摸索3 瓊脂糖凝膠電泳檢測結果4 全部樣品進行PCR5 PCR產物的凝膠回收及檢測6 PCR產物精確定量(Qubit 2.0)將純化后的PCPT物采用微量熒光核酸定量儀進行精確定量(精確到 0.1ng/ul )7 .將定量后混勻的 DNA羊本再次進行磁珠法純化后,進行高通量測序三、可

4、分析項目1) 有效序列數據統計在測序實驗中,通常采用多個樣品平行測序的方法,即多個樣品混合測序。為了能區分樣品,各樣品中的序列均引入了一段標示其樣本來源信息的barcode 標簽序列。若所測序列中不含有barcode 標簽序列,則無法確定其樣本來源,進而導致后續生物信息錯誤或意義不明。因此, 僅當原始序列中含有完整的barcode標簽序列時,該條序列才被認可為有效序列。2)優化序列數據統計通常情況下,有效序列可以直接用于后續生物信息學分析。在實驗過程中,測序產物可能含有非特異性擴增片段,利用特異性引物信息可以將其去除;序列中可能含有模糊堿基( ambiguous) 、單堿基高重復區( homo

5、logous )以,長度過短的序列(序列長度小于200bp),及PCR過程中產生的一些嵌合體,將這些序列納入分析范圍會降低分析質量,因此修剪、去除(trim )此部分序列,可得到供精準分析的優化序列。在數據去除(trim )時,把maxambig=0, axhomop=8, maxlength=200 ,及其嵌合體序列去掉,并對數據進行統計,得到優化序列的百分率。3) OTU 生成根據序列的相似性,將序列歸為多個OTU(操作分類單元),以便后續分析。OTU ( Operational Taxonomic Units )是在系統發生學研究或群體遺傳學研究中,為了便于進行分析,人為給某一個分類單元

6、(品系,種,屬,分組等)設置的同一標志。在生物信息分析中,一般來說,測序得到的每一條序列來自一個菌。要了解一個樣品測序結果中的菌種、菌屬等數目信息,就需要對序列進行歸類操作(cluster )。通過歸類操作,將序列按照彼此的相似性分歸為許多小組,一個小組就是一個OTU根據客戶指定的相似度(96% 97喊者98% ,對所有序列進行 OTU劃分 并進行生物信息統計分析。OTU 分析主要步驟(1) 提取非重復序列,堿基完全一致序列為重復序列;(2) 與 silva 庫中的 aligned(16S/18S, SSU) 核糖體序列比對;(3) Chimeric 序列檢測與去除(4)距離計算與OTU聚類。

7、4) 多樣性分析( Alpha-diversity )計算菌群豐度(Community richness )的指數有:(1) Chao:是用chaol算法估計群落中含 OTU數目的指數, chao1 在生態學中常用來估計物種總數,由Chao (1984) 最早提出。( 2) Ace: 用來估計群落中含有OTU 數目的指數,由 Chao 提出,是生態學中估計物種總數的常用指數之一,與Chao I 的算法不同。計算菌群多樣性(Community diversity )的指數有:(1) Simpson:用來估算樣品中微生物的多樣性指數之一,由 Edward Hugh Simpson (1949) 提

8、出,在生態學中常用來定量的 描述一個區域的生物多樣性。Simpson 指數值越大,說明群落多樣性越低。(2) Shannon:用來估算樣品中微生物的多樣性指數之一。它與 Simpson 多樣性指數均為常用的反映alpha 多樣性的指數。Shannon值越大,說明群落多樣性越高。測序深度指數有:Coverage:是指各樣品文庫的覆蓋率,其數值越高,則樣本中序列沒有被測出的概率越低。該指數實際反映了本次測序結果是否代表樣本的真實情況。使用軟件:mothur 及 BioLinker 自編程序。5) 稀釋性曲線(Rarefaction curve )稀釋性曲線:一般是從樣本中隨機抽取一定數量的個體,統

9、計出這些個體所代表物種數目,并以個體數與物種數來構建曲線。它可以用來比較測序數量不同的樣本物種的豐富度,也可以用來說明樣本的取樣大小是否合理。分析采用對優化序列進行隨機抽樣的方法,以抽到的序列數與它們所能代表OTU的數目構建稀釋性曲線。稀釋性曲線圖中,當曲線趨向平坦時,說明取樣的數量合理,更多的取樣只會產生少量新的OTU反之則表明繼續取樣還可能產生較多新的 OTU因此,通過作稀釋性曲線,可以得出樣 品的取樣深度情況。稀釋性曲線分析結果默認是在97%相似性水平下劃分 OUT并制作各樣品的稀疏曲線。6) 分類學分析(Taxonomy)在之前的分析步驟中,已經將序列按照其自身的堿基組成的相似性,分歸

10、到各OTU 中。在進行分類學分析時,首先,將每一條優質序列都與SILVA (最新版)數據庫進行比對,找出其最相近且可信度達80%以上的種屬信息。之后,將每一個OTU 中的所有序列進行類比,找出同一OTU 中的不同序列的最近祖先的種屬信息。最后,將得到的結果記錄在表格文件中。這樣做,可以在保留最可能多的信息量的情況下,確保得出信息的準確性。7) 樣本間比較各樣品群落結構分析柱狀圖或者餅狀圖在某一分類地位上根據各樣品中的微生物組成繪制餅圖或者柱狀圖。8) 全樣品相似度分析樹狀圖比較多個樣品中OTU1成的差異及各OTU中含有序列的豐度,計 算這些樣品的相似性,并繪制相似性圖譜。9)樣品OTU分布比較

11、-VENN圖統計多個樣品中所共有的OTU 數目可以反映環境樣品的相似性及重疊情況。10) Heatmap 熱圖分析Heatmap 可以用顏色變化來反映二維矩陣或表格中的數據信息,它可以直觀地將數據值的大小以定義的顏色深淺表示出來。常根據需要將數據進行聚類,將聚類后的數據表示在heatmap 的相似性和差異性。如在屬水平上對樣品和OTU 類型 (樣品所含菌屬)進行聚類(依據是不同樣品中各OTU 所含序列數越相近,即所含菌屬數量越相近,樣品間相似性越高),對聚類后各樣品中不同OTU (不同菌屬)所含序列的豐度作heatmap圖,能夠反映出在菌屬水平上各樣品菌落結構的相似性和差異性。將指定種屬水平上

12、的分類信息分別按照樣品和分類進行聚類后作出 Heatmap 圖, 能夠反映出所有樣品在各分類水平上表現的相似性或者差異性。11) 組間顯著性差異分析(metastats 分析)分析多個樣品時,如果這些樣品分屬于兩個組,則可以進行Metastats 分析。該分析通過對比兩組條件下的多個樣品,找出兩組中具有顯著差異的微生物類型。結果如下表所示:12) PCA 分析 (Principal Component Analysis)PCA分析,即主成分分析,是一種對數據進行簡化分析的技術,這種方法可以有效的找出數據中最“主要”的元素和結構, 去除噪音和冗余,將原有的復雜數據降維,揭示隱藏在復雜數據背后的簡

13、單結構。它的優點是簡單,而且無參數限制,可以方便的應用于各個場合。我們可以用PCA來分析不同樣品 OTU組成的差異,通過方差分解,將多組數據的差異反映在二維坐標圖上,坐標軸取能夠最大反映方差值的兩個特征值。如樣品組成越相似,反映在PCAS中的距離越近。不同環境間的樣品可能表現出分散 分布。PCA分析可以用來反映不同樣品中微生物群落組成的相似 性以及影響微生物多樣性的主要因素,一般情況下是用來對假設進行驗證。如PCA可以用來做以下分析:確定環境中的樣品是否具有顯著不同的微生物群落。將環境間的差異以圖的形式表現出來等。13) RDA分析利用冗余分析(RDA可以反映在OTU的水平或者某生物學分類水平上各樣品中菌群與環境因子之間關系。14) UniFrac 分析選取一個組的多個樣品或者不同組的樣品,進行Weightedunifrac PCoA 分析或者unweighted unifrac PCoA 分析,可以在OTU的水平上反映各樣品

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論