16s、代謝組及臨床信息關(guān)聯(lián)分析方案_第1頁
16s、代謝組及臨床信息關(guān)聯(lián)分析方案_第2頁
16s、代謝組及臨床信息關(guān)聯(lián)分析方案_第3頁
16s、代謝組及臨床信息關(guān)聯(lián)分析方案_第4頁
16s、代謝組及臨床信息關(guān)聯(lián)分析方案_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、腸道菌群16s宏基因組及代謝組關(guān)聯(lián)分析方案一、項目簡介1.1多組學(xué)關(guān)聯(lián)分析概述對多組學(xué)進(jìn)行關(guān)聯(lián)分析主要包括跨組學(xué)相關(guān)性分析以及基于機器學(xué)習(xí)算法的組合型生 物標(biāo)志物發(fā)現(xiàn)和多組學(xué)數(shù)據(jù)的深度挖掘。其屮,對于跨組學(xué)相關(guān)性分析目前主要由4部分 組成,分別是:(1)基于參考文獻(xiàn)和數(shù)據(jù)庫的關(guān)聯(lián)分析;(2)基于代謝通路分析的關(guān)聯(lián)分析;(3)基于交互作用的關(guān)聯(lián)分析;(4)基于統(tǒng)計方法的關(guān)聯(lián)分析。在基于統(tǒng)汁方法的關(guān)聯(lián)分析中,不僅包含了基于相關(guān)性的整合分析,如皮爾森相關(guān)性分 析(pearson correlation) s 斯皮爾曼秩相關(guān)性分析(spearman rank correlation)等,而 且還有基于

2、數(shù)據(jù)拼接的整合分析、基于多變量的整合分析(如典型的o2pls分析)和基于 代謝通路(pathway)的整合分析。omics datadata preprocessing, noise filtering, etctrans-omics data analysismachine learning algontm forbiomarkers combination discovedisunce evikmlionliterature o( top mtocuuomcross- eorreubonpathwayin terse bon network 片f / acoatlaton anat/m m

3、xd oncontlation amlyss txmd on pathway arwly»significantly associated omics data for further functional analysiscombinations of potential biomarfcers discovety for disease predictiondisease prediction model foundation by the combinabon of omics data for the subsequent health monitoring, preisea

4、se warning and medication guidance圖1.多組學(xué)關(guān)聯(lián)分析示意圖12腸道菌群16s rrna測序核糖體是細(xì)菌唯一的細(xì)胞器,是蛋白質(zhì)合成的場所,它的沉降系數(shù)是70s,在適當(dāng)條件 下解離成50s和30s兩個大小亞基,兩個亞基都含有rna和蛋白質(zhì)。廠rna按沉降系數(shù)分 3種,分別為5s, 16s和23s05s和23s rrna基因在50s亞基中,16s rrna在30s亞基中,它們是核糖體不可缺 少的成分。16srrna基因是細(xì)菌染色體上編碼rrna相對應(yīng)的dna序列,存在于所有細(xì)菌 的染色體基因組屮。16s rrna基因約由1540個核昔酸組成,并含有多個拷貝(即轉(zhuǎn)錄

5、單 位),如大腸桿菌k12染色體基因組中含7個16s rrna拷貝,而在一般情況下,細(xì)菌的 英他結(jié)構(gòu)基因都是單拷貝的。細(xì)菌16s rrna基因序列由保守區(qū)和可變區(qū)組成,兩者互相交 錯排列。編碼rrna基因與細(xì)菌整個基因組的變化相比,有高度的保守性。由于16s rrna基因核昔酸序列總長度適宜,結(jié)構(gòu)完整,更便于對細(xì)菌進(jìn)行各種研究。 設(shè)計一對引物,以16s rrna為靶分子在適當(dāng)條件下進(jìn)行pcr擴增,便得到擴增后的16s rrna 片段,對片段進(jìn)行測序,序列與基因庫屮的片段比對,便得知未知菌與基因庫中其他菌的相 似性,從而完成對菌的鑒定。1. 3 代謝組(metabolome)代謝組(metabo

6、lome)是指某個時間點上一個細(xì)胞所有代謝物的集合,尤其指在不同代謝 過程屮充當(dāng)?shù)孜锖彤a(chǎn)物的小分子物質(zhì),如脂質(zhì)、糖、氨基酸等,可以揭示取樣時該細(xì)胞的生 理狀態(tài)。人體由上萬億個不同類型的細(xì)胞組成,它們具有潛在不同的組織細(xì)胞代謝組。基因 和蛋白質(zhì)主要是為細(xì)胞發(fā)生的活動做準(zhǔn)備,在活動中大部分實際上是發(fā)生在代謝物上,如信 號轉(zhuǎn)導(dǎo)、能量轉(zhuǎn)移、細(xì)胞間通信都受代謝物調(diào)控。從整體上看,基因和蛋白表達(dá)緊密相連, 但代謝物的實時變化更密切地反映出細(xì)胞所處的環(huán)境,該環(huán)境依賴于細(xì)胞所攝取的營養(yǎng)狀況、所接觸的藥物和污染物以及其它影響細(xì)胞健康的外在因子情況。總之,轉(zhuǎn)錄組學(xué)告訴人 們細(xì)胞中可能發(fā)生的變化行為,蛋白質(zhì)組學(xué)告訴

7、人們細(xì)胞中正在發(fā)生的變化行為,而代謝組 學(xué)是研究生物樣品,尤其是尿液、唾液和血液中的代謝物譜(主要是指含有哪些代謝物、豐 度和分布狀況等)變化規(guī)律,告訴人們細(xì)胞中行為發(fā)生以后的狀況。1. 4樣本信息xx糞便樣品,分疾病組和對照組,分別測得16s rrna宏基因組和代謝組的數(shù)據(jù),以及 客戶提供的各種臨床指標(biāo)的數(shù)據(jù),現(xiàn)針對16s rrna、代謝組以及臨床指標(biāo)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分 析。物種名稱:小鼠數(shù)據(jù)來源:16s rrna宏基因組,代謝組,臨床指標(biāo)1.5分析內(nèi)容數(shù)據(jù)分析包插:相關(guān)性分析,scatter plot分析,代謝物來源及其相關(guān)性分析,臨床 指標(biāo)permanova分析,宏基因(宏轉(zhuǎn)錄/蛋白)及代謝

8、物互作網(wǎng)絡(luò)構(gòu)建。二、數(shù)據(jù)分析方案2.1相關(guān)性分析通過使用pearson或者spearman相關(guān)性分析方法,將經(jīng)過16s rrna宏基因組學(xué)分 析得到的差異顯著性菌群數(shù)據(jù)與代謝組學(xué)分析得到的差異顯著性代謝物數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析, 其屮顏色越紅表示菌群與代謝物間的正相關(guān)性越強,顏色越藍(lán)表示菌群與代謝物間的負(fù)相關(guān) 性越強,相關(guān)性p值小于0.05的數(shù)據(jù)在圖形中用*標(biāo)記,示例結(jié)果如下(具體顏色等可 根據(jù)實際情況進(jìn)行調(diào)節(jié)):vtmprovtxio4undoactenumtuncder4ttsserele4 streptophyta -streptococcus r-isltncv ophomoom4 stph

9、ytococcus4sponchthy- sptwx)o<wnm4* w sphtfigotmim*sotbocaus4 mhmiskemwwle4senate4j sdnwwxacteoum schteghete 1 azhromotectercorr005hhulipm圖2相關(guān)性分析熱力圖2. 2 scatter plot 分析為了進(jìn)一步驗證相關(guān)性系數(shù)分析得到的相關(guān)性的真實性,需要對菌群和代謝物進(jìn)行散點 圖分析,從而幫助去除假陽性的強相關(guān)作用,示例結(jié)果如下:圖3.菌群與代謝物相關(guān)性分析scatter plot2.3代謝物來源及其相關(guān)性分析通過對代謝物進(jìn)行來源性分析,主要分成三類:腸道

10、菌群來源性代謝物,人與腸道菌群 共同來源性代謝物、人體自身代謝物。對代謝物進(jìn)行斯皮爾曼等級相關(guān)性分析,選取具冇顯著性相關(guān)作用的代謝物進(jìn)行相關(guān)性展示。其中,紅色原點是在疾病組中富集的差異顯著性代 謝物,綠色方塊是在疾病組屮降低的差界顯著性代謝物,標(biāo)記了紅色外框的代謝物是研究屮 發(fā)現(xiàn)的潛在生物標(biāo)記物。此外,根據(jù)斯皮爾曼等級相關(guān)性系數(shù)大小進(jìn)行不同代謝物-代謝物 間的相關(guān)性連接,在該圖屮,紅色線條表示rho0.9,粉色線條表示0.9>rho0.8,黃 色線條表示0.8>tho20.7,藍(lán)色線條表示0. 7>rho20.6,海藍(lán)色線條表示0. 6>訃0$ 0.5,灰色線條表示rh

11、ow-0.5。(備注:對于菌群-菌群,菌群-代謝物都可以使用多種類似 的相關(guān)性網(wǎng)絡(luò)圖展示相關(guān)性結(jié)果)4.代謝物來源及其相關(guān)性分析圖2.4臨床指標(biāo)perman0va分析perman0va分析表明臨床指標(biāo)的變化(紅色標(biāo)記,p-value<0. 05)顯著性地改變?nèi)梭w的 腸道菌群和代謝物輪廓譜。其中g(shù)roups的p-value<0. 05表明分組的合理性。phe no typedfsumsofsqsmeansqsf.modelr2pr(>f)e.coli11275517.811275517.810.281918580.003157620.3203groups17778410.337

12、778410.331.747426130.019255930.0422age12138264.22138264.20.459124670.005372450.4864sex1480734848073481.071935660.011900880.3834height12543401.742543401.740.557775160.006298430.6818weight142313610.742313610.710.300110.104782280.0209bmi145793000.345793000.311.13174470.113436740.0154fg1837567.423837567

13、.4230.301261490.008076440.6779waist13918961.63918961.60.646553210.013569780.441hip12638338.232638338.230.431107110.009284880.6117sbp1764122.631764122.6310.325134740.004374490.9134dbp1330279.448330279.4480.140184440.00189080.9686trig13248565.763248565.760.684045320.0082730.3922ldlc12536217.242536217.240.533072110.006458890.5727chol13607806.063607806.060.760391440.009187870.4605hdlc14238519.734238519.730.894772970.010794080.3759apob12521527.282521527.280.487161970.006453570.6423apoa12991006.262991006.260.578565550.007655150.5676lpa149

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論