轉錄組RNAseq術語解釋_第1頁
轉錄組RNAseq術語解釋_第2頁
轉錄組RNAseq術語解釋_第3頁
轉錄組RNAseq術語解釋_第4頁
轉錄組RNAseq術語解釋_第5頁
已閱讀5頁,還剩1頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、RNA-Seq名詞解釋1.index測序的標簽,用于測定混合樣本,通過每個樣本添加的不同標簽進行數據區分,鑒別測序樣品。2.堿基質量值(Quality Score或Q-score)是堿基識別(Base Calling)出錯的概率的整數映射。堿基質量值越高表明堿基識別越牢靠,堿基測錯的可能性越小。3.Q30堿基質量值為Q30代表堿基的精確度在99.9%。4.FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)每1百萬個map上的reads中map到外顯子的每1K個堿基上的fragment個數。計算公式為公式

2、中,cDNA Fragments 表示比對到某一轉錄本上的片段數目,即雙端Reads數目;Mapped Reads(Millions)表示Mapped Reads總數,以10為單位;Transcript Length(kb):轉錄本長度,以kb個堿基為單位。5.FC(Fold Change)即差異表達倍數。6.FDR(False Discovery Rate)即錯誤發覺率,定義為在多重假設檢驗過程中,錯誤拒絕(拒絕真的原(零)假設)的個數占全部被拒絕的原假設個數的比例的期望值。通過把握FDR來打算P值的閾值。7.P值(P-value)即概率,反映某一大事發生的可能性大小。統計學依據顯著性檢驗方

3、法所得到的P 值,一般以P<0.05為顯著,P<0.01為格外顯著,其含義是樣本間的差異由抽樣誤差所致的概率小于0.05或0.01。8.可變剪接(Alternative splicing)有些基因的一個mRNA前體通過不同的剪接方式(選擇不同的剪接位點)產生不同的mRNA剪接異構體,這一過程稱為可變剪接(或選擇性剪接,alternative splicing)。可變剪接是調整基因表達和產生蛋白質組多樣性的重要機制,是導致真核生物基因和蛋白質數量較大差異的重要緣由。在生物體內,主要存在7種可變剪接類型:A)Exon skipping;B)Intron retention;C) Alt

4、ernative 5' splice site;D) Alternative 3' splice site;E) Alternative first exon;F) Alternativelast exon;G) Mutually exclusive exon。9.外顯子跳動(Exon skipping)外顯子在前體mRNA剪接形成成熟mRNA過程中被跳過,最終沒有消滅在某些成熟mRNA上,這種剪接機制被稱為外顯子跳動。10. 內含子保留(Intron retention)前體mRNA在剪接形成成熟mRNA的過程中,部分內含子被保留下來,這種剪接機制被稱為內含子保留。11. 5

5、'或3'端可變剪接前體mRNA在剪接形成成熟mRNA的過程中,5'端或3'端邊界發生不同方式的剪接,這種剪接機制被稱為5'或3'端可變剪接。12.基因結構優化由于使用的軟件或數據本身的局限性,導致所選參考基因組的注釋往往不夠精確,需要對原有注釋的基因結構進行修正,這一過程稱為基因結構優化。13. 基因間區(intergenic)指基因與基因之間的間隔序列,不屬于基因結構,不直接打算氨基酸,可能通過轉錄后調控影響性狀的區域。14. UTR:(UntranslateRegions)非翻譯區域。是信使 RNA(mRNA)分子兩端的非編碼片段。5'

6、;-UTR從mRNA起點的甲基化鳥嘌呤核苷酸帽延長至 AUG 起始密碼子,3'-UTR從編碼區末端的終止密碼子延長至多聚 A 尾巴(Poly-A)的前端。15. ORF(open reading frame)開放閱讀框或開放讀碼框。是結構基因的正常核苷酸序列,從起始密碼子到終止密碼子的閱讀框可編碼完整的多肽鏈,其間不存在使翻譯中斷的終止密碼子。16. CDS(Coding sequence)是編碼一段蛋白產物的序列,是結構基因組學術語。DNA轉錄成mRNA,mRNA經剪接等加工后翻譯出蛋白質,所謂CDS就是與蛋白質序列一一對應的DNA序列,且該序列中間不含其它非該蛋白質對應的序列,不考

7、慮mRNA加工等過程中的序列變化,總之,就是與蛋白質的密碼子完全對應。17. 插入片段大小(insert size)通過檢測雙端序列在基因組上的起止位置,可以得到插入片段的實際長度,打算了測序的長度,是信息分析的重要參數。18. 分子標記是遺傳標記的一種,直接在DNA分子上檢測遺傳變異。分子標記能對不同發育時期的個體、組織器官甚至細胞作檢測,數量極多,遍及整個基因組,多態性高,遺傳穩定,不受環境及基因表達與否的影響。目前常見分子標記主要有SNP、InDel、SSR 等。19. SNP(Single Nucleotide Polymorphism)即單核苷酸多態性,主要是指在基因組水平上由單個核

8、苷酸的變異所引起的DNA序列多態性。SNP所表現的多態性只涉及到單個堿基的變異,這種變異可由單個堿基的轉換(transition)或顛換(transversion)所引起,也可由堿基的插入或缺失所致。但通常所說的SNP并不包括后兩種狀況。20. SSR(Simple Sequence Repeat,SSR)即簡潔重復序列,又叫微衛星序列,指的是基因組中由1-6個核苷酸組成的基本單位重復多次構成的一段DNA,廣泛分布于基因組的不同位置,長度一般在200bp以下。21. 轉換(transition)同類型(嘌呤和嘌呤,或嘧啶和嘧啶)堿基之間的相互替換稱為轉換。22. 顛換(transversion

9、)不同類型(嘌呤和嘧啶)堿基之間的相互替換稱為顛換。23. RNA編輯(RNA editing)是指在mRNA水平上轉變遺傳信息的過程。具體來說,指基因轉錄產生的mRNA分子中,由于核苷酸的缺失,插入或置換,基因轉錄物的序列不與編碼序列互補,使翻譯生成的蛋白質的氨基酸組成,不同于基因序列中的編碼信息現象。24. 差異表達轉錄本(DifferentiallyExpressed Transcript,DET)指表達水平存在顯著差異的轉錄本。25. 差異表達基因(Differentially Expressed Gene,DEG)指在兩個不同條件(如對比與處理、野生型和突變型、不同時間點、不同組織等

10、)下,表達水平存在顯著差異的基因,稱之為差異表達基因。26. 生物學重復(Biological Replicates)可以定義為使用來自不同抽提的RNA樣本進行雜交,例如,同一來源獨立制備的樣本,或者不同來源的樣本(不同組織或者一個細胞系的不同培育物)。27. 技術重復使用同一個抽提的RNA進行試驗稱為技術重復。與生物學重復相比,技術重復不是完全獨立的,取平均值不能去除共有的系統偏差。28. 皮爾遜相關系數r(Pearsons Correlation Coefficient)用于度量兩個變量X和Y之間的相關(線性相關),其值介于-1與1之間。其中,1表示變量完全正相關,0表示無關,-1表示完全

11、負相關。在高通量測序中,將皮爾遜相關系數作為生物學重復相關性的評估指標。越接近1,說明兩個重復樣品相關性越強。29. UnigeneUnique Gene的英文縮寫,意為廣泛通用的基因數據庫,通過電腦對相同基因座(Locus)的收集整理集合形成一個非冗余的基因數據庫。30. Contig高通量測序中利用軟件將具有肯定長度overlap的reads連成更長的片段,這些通過reads overlap關系得到的不含N的組裝片段稱之為Contig。31. Scaffold高通量測序中reads經過拼接獲得Contigs,Contig經過確定先后挨次用N連接起來組成Scaffold。32. Contig

12、 N50Reads拼接后會得到長度不同的Contigs。將全部Contigs的長度相加后獲得一個Contig的總長度。之后將全部Contig依據序列長度由短到進步行排序,如獲得Contig1,Contig2,Contig3.。將Contig依據這個挨次一次相加,當相加的長度達到Contig總長度的一半時,最終一個加上的Contig長度即為Contig N50。33. componentTRINITY 軟件拼接過程中,由于contig的構造方法,使得各個contig之間不行能共享k個以上序列,因此這些 inchwormcontigs不能很好的表征各種可變剪切形式和同源基因等狀況,軟件中“chry

13、salis”這一步驟將那些有重疊的contigs聚類,構成ponent就成為一組可變剪切isoform或同源基因可能的表征的集合。34. de Bruijn graph使用 TRINITY 軟件拼接時,在“chrysalis”步驟中會將 component通過 overlap 關系構建成 de Bruijn圖,便于獵取可變剪切的序列。35. 數字基因表達譜(DigitalGene Expression Profile,DGE)利用新一代高通量測序技術和高性能的計算分析技術,能夠全面、經濟、快速地檢測某一物種特定組織在特定狀態下的基因表達狀況。36. small RN

14、A對長度在18-40bp的短 RNA 進行序列、結構、表達、功能上的分析,主要進行miRNA,siRNA,piRNA 幾種類型 sRNA 的分析;可與 mRNA 關聯分析。37. ncRNA(non-coding RNA)非編碼RNA。指不編碼蛋白質的RNA。其中包括 rRNA,tRNA,snRNA,snoRNA和microRNA 等多種已知功能的 RNA,及未知功能的 RNA。其共同特點是都能從基因組上轉錄而來,不需要翻譯成蛋白即可在 RNA 水平上行使各自的生物學功能。38. 降解組測序(Degradome Sequencing)利用高通量測序平臺,針對miRNA介導的剪切降解片段進行深度

15、測序,從中篩選miRNA作用的靶基因,并結合生物信息學分析確定降解片段與miRNA的精確配對信息。該技術能從細胞或組織中精確高效的篩選出 miRNA 的靶基因,為爭辯miRNA 與其對應的靶基因的相互關系供應精確、高效的篩選手段。39. lncRNA(long noncoding RNA)長鏈非編碼RNA。在長度200-100000nt之間,不具有編碼蛋白功能的轉錄本。40. 正鏈/負鏈(plus strand/minus strand)對于一個基因來說,DNA的兩條鏈中有一條鏈作為RNA合成時的模板,這條鏈叫負鏈,另一條叫正鏈。41. 反義鏈/有義鏈(antisense strand/sen

16、se strand)在雙鏈DNA中,用來轉錄mRNA的DNA鏈稱為模板鏈(template strand),不用于轉錄的鏈則稱為非模板鏈(nontemplate strand)。依據堿基互補配對原則,轉錄出的mRNA鏈的堿基序列與非模板鏈的堿基序列全都,惟一不同的是,非模板鏈中的T mRNA鏈中全部置換成了U。正是由于非模板鏈的堿基序列實際上代表了 mRNA的堿基序列(只不過在mRNA中T換成了U),因此非模板鏈又被稱為編碼鏈( coding strand),有義鏈(sense strand)和克里克鏈(crick strand),而用來轉錄mRNA的DNA鏈被稱為非編碼鏈(anticodin

17、g strand)或反義鏈(antisense strand)或沃森鏈(watson strand)。42. 鏈特異性(strand specific):鏈特異性建庫,可以確定轉錄原來自正鏈還是負鏈。以便更加精確的獲得基因的結構以及基因表達信息。并且可以更好的發覺新的基因。(爭辯表明:很多基因組區域具有正負鏈的轉錄本,反義轉錄是真核基因的一個特征,是一種重要的調控方式。對于原核以及低等真核生物的基因組,經常具有重疊基因。43. GO(Gene Ontology)基因本體聯合會(Gene Ontology Consortium)所建立的數據庫,旨在建立一個適用于各種物種的,積累因何蛋白質功能進行

18、限定和描述的,并能隨著爭辯不斷深化而更新的語言詞匯標準。GO 是多種生物本體語言中的一種,供應了三層結構(分子功能、生物學途徑、細胞組件)的系統定義方式,用于描述基因產物的功能。網址:/。44. BSR(Bulked Segregant RNA sequencing)將轉錄組測序與集群分別分析相結合,在轉錄組范圍內開發SNPs,篩選與性狀緊密連鎖的SNPs,進行功能基因的定位,同時進行基因差異表達分析等轉錄組常規分析的技術。45. eQTL以一個分別群體中不同個體(基因型)或者是其它有遺傳結構的群體作為樣本,運用QTL分析方法分析特定基因轉錄

19、豐度差異而得到的一些遺傳區域,轉錄豐度用于作為個體中基因表達水平的衡量方式,并且作為一共性狀來分析(e Trait)。46. COG/KOGCOG是Clusters of Orthologous Groups of proteins的簡稱,KOG 為euKaryotic Ortholog Groups。這兩個注釋系統都是NCBI中基于基因直系同源關系的數據庫,其中COG針對原核生物,KOG針對真核生物。COG/KOG結合進化關系將來自不同物種的同源基因分為不同的 Ortholog簇,目前COG有4873個分類,KOG有4852個分類。來自同一 ortholog 的基因具有相同的功能,這樣就可以將功能注釋直接繼承給同一 COG/KOG 簇的其他成員。詳見http:/www.ncbi.nlm.ni

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論