




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1真核生物基因結(jié)構(gòu)的真核生物基因結(jié)構(gòu)的預(yù)測(cè)分析預(yù)測(cè)分析樓小燕樓小燕 馮曄馮曄 陳曉龍陳曉龍 蔣華蔚蔣華蔚2實(shí)習(xí)一實(shí)習(xí)一基因組數(shù)據(jù)注釋和功能分析基因組數(shù)據(jù)注釋和功能分析實(shí)習(xí)二實(shí)習(xí)二真核生物基因結(jié)構(gòu)的預(yù)測(cè)分析真核生物基因結(jié)構(gòu)的預(yù)測(cè)分析 實(shí)習(xí)三實(shí)習(xí)三芯片的基本數(shù)據(jù)處理和分析芯片的基本數(shù)據(jù)處理和分析實(shí)習(xí)四實(shí)習(xí)四蛋白質(zhì)結(jié)構(gòu)與功能分析蛋白質(zhì)結(jié)構(gòu)與功能分析實(shí)習(xí)五實(shí)習(xí)五蛋白質(zhì)組學(xué)數(shù)據(jù)分析蛋白質(zhì)組學(xué)數(shù)據(jù)分析實(shí)習(xí)六實(shí)習(xí)六系統(tǒng)生物學(xué)軟件實(shí)習(xí)系統(tǒng)生物學(xué)軟件實(shí)習(xí)課程內(nèi)容課程內(nèi)容基因組學(xué)基因組學(xué)轉(zhuǎn)錄物組學(xué)轉(zhuǎn)錄物組學(xué)蛋白質(zhì)組學(xué)蛋白質(zhì)組學(xué)系統(tǒng)生物學(xué)系統(tǒng)生物學(xué)3編碼區(qū)預(yù)測(cè)編碼區(qū)預(yù)測(cè)Codon biasGC Content限制性
2、酶切位點(diǎn)限制性酶切位點(diǎn)基因結(jié)構(gòu)分析基因結(jié)構(gòu)分析選擇性剪切選擇性剪切轉(zhuǎn)錄調(diào)控因子轉(zhuǎn)錄調(diào)控因子序列比對(duì)序列比對(duì)功能注釋功能注釋KEGGGO系統(tǒng)發(fā)育樹系統(tǒng)發(fā)育樹蛋白質(zhì)序列蛋白質(zhì)序列翻翻譯譯蛋白質(zhì)理化性質(zhì)蛋白質(zhì)理化性質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)構(gòu)域分析結(jié)構(gòu)域分析重要信號(hào)位點(diǎn)分析重要信號(hào)位點(diǎn)分析三級(jí)結(jié)構(gòu)預(yù)測(cè)三級(jí)結(jié)構(gòu)預(yù)測(cè)基因組功能分析基因組功能分析4真核生物基因的主要結(jié)構(gòu)真核生物基因的主要結(jié)構(gòu)5基因結(jié)構(gòu)分析基因結(jié)構(gòu)分析開放讀碼框開放讀碼框GENSCANCpG島島CpGPlot轉(zhuǎn)錄終止信號(hào)轉(zhuǎn)錄終止信號(hào)POLYAH啟動(dòng)子啟動(dòng)子/轉(zhuǎn)錄起始位點(diǎn)轉(zhuǎn)錄起始位點(diǎn)PromoterScan密碼子偏好分析密碼子偏好分析Cod
3、onWmRNA剪切位點(diǎn)剪切位點(diǎn)NETGENE2Spidey選擇性剪切選擇性剪切ASTD基因結(jié)構(gòu)分析常用軟件基因結(jié)構(gòu)分析常用軟件6開放讀碼框的識(shí)別開放讀碼框的識(shí)別 開放讀碼框(open reading frame, ORF) 是一段起始密碼子和終止密碼子之間的堿基序列 ORF 是潛在的蛋白質(zhì)編碼區(qū)7基因開放閱讀框基因開放閱讀框/ /基因結(jié)構(gòu)分析識(shí)別工具基因結(jié)構(gòu)分析識(shí)別工具ORF Finder /gorf/gorf.html NCBI通用BestORFhttp:/ Finder/tools/genefind
4、er/Zhang lab人、小鼠、擬南芥、酵母FGENESHhttp:/ Maryland原核Fgeneshttp:/ /generation/ORNL原核FGENESBhttp:/ /genomescan.html MIT脊椎、擬南芥、玉米GeneWise2http:/www.ebi.ac.uk/Wise2/EBI人GRAIL/grailexp/ORNL人、小鼠、擬南芥、果蠅8ORF識(shí)別識(shí)別:GENSCAN/GENSCAN.h
5、tml結(jié)果返回到郵箱(可選)結(jié)果返回到郵箱(可選)提交序列提交序列提交序列文件提交序列文件運(yùn)行運(yùn)行GENSCAN顯示氨基酸或顯示氨基酸或CDS序列序列序列名稱(可選)序列名稱(可選)是否顯示非最優(yōu)外顯子是否顯示非最優(yōu)外顯子選擇物種類型選擇物種類型9 9GENSCAN輸出結(jié)果:文本輸出結(jié)果:文本10課堂練習(xí) 使用GENESCAN預(yù)測(cè)序列中可能的ORF。 練習(xí)用的序列文件在c:zcnishixi2文件下,名字為clone.txt,使用寫字板打開查看。11轉(zhuǎn)錄調(diào)控序列分析轉(zhuǎn)錄調(diào)控序列分析 CpG島、轉(zhuǎn)錄終止信號(hào)和啟動(dòng)子區(qū)域的預(yù)測(cè)12CpG島的預(yù)測(cè)CpG島常位于真核生物基因轉(zhuǎn)錄起始位點(diǎn),GC含50%
6、,長(zhǎng)度200bp的一段DNA序列。13CpG Island 分析常用軟件分析常用軟件CpG Island http:/ finderhttp:/ 預(yù)測(cè)結(jié)果起始為624bp 終止于51875bp16轉(zhuǎn)錄終止信號(hào)轉(zhuǎn)錄終止信號(hào)上游作用元件:AAUAAA下游作用元件:GC rich二重對(duì)稱區(qū)、UUUUUUC-GC-GG-CG-CU-AG-CG-CC-GG-CUUUUUUUUURNA53AAUAAACAAAAAAAAAAAAA成熟mRNA53AAUAAACAGUmRNA前體5317轉(zhuǎn)錄終止信號(hào)預(yù)測(cè):POLYAHhttp:/ 提交序列文件提交序列文件提交序列提交序列18polyA位置GENESCAN預(yù)測(cè)結(jié)
7、果PolyA位點(diǎn)52490bpPOLYAH輸出結(jié)果19啟動(dòng)子區(qū)結(jié)構(gòu)啟動(dòng)子區(qū)結(jié)構(gòu)啟動(dòng)子(Promoter) 位于結(jié)構(gòu)基因5端上游,能活化RNA聚合酶,使之與模板DNA結(jié)合并具有轉(zhuǎn)錄起始的特異性。轉(zhuǎn)錄起始位點(diǎn)(Transcription start site, TSS)PYCAPY(嘧啶)核心啟動(dòng)子元件(Core promoter element)TATA box,Pribnow box (TATAA)上游啟動(dòng)子元件(Upstream promoter element,UPE)CAAT box,GC box,SP1,Otc增強(qiáng)子(Enhancer)20原核和真核生物基因轉(zhuǎn)錄起始位點(diǎn)上游區(qū)原核和真核
8、生物基因轉(zhuǎn)錄起始位點(diǎn)上游區(qū)結(jié)構(gòu)結(jié)構(gòu)原核生物原核生物真核生物真核生物TTGACATATAATAmRNA11035PyAPyTATAATGC區(qū) CAAT區(qū)mRNA14025110增強(qiáng)子增強(qiáng)子上游啟動(dòng)子元件,上游啟動(dòng)子元件,UPE核心啟動(dòng)子元件核心啟動(dòng)子元件轉(zhuǎn)錄起始轉(zhuǎn)錄起始位點(diǎn)位點(diǎn)21PromoterScan:80/molbio/proscan/WebPromoser/zlab/PromoSer/WebNeural Network Promoter Prediction
9、/seq_tools/promoter.htmlWebSoftberry: BPROM, TSSP, TSSG, TSSWhttp:/ 啟動(dòng)子結(jié)合位點(diǎn)分析常用軟件啟動(dòng)子結(jié)合位點(diǎn)分析常用軟件22啟動(dòng)子預(yù)測(cè):PromoterScan/molbio/proscan/ 提交序列提交序列23PromoterScan輸出結(jié)果找到的TATA box和轉(zhuǎn)錄起始位點(diǎn)預(yù)測(cè)可能的轉(zhuǎn)錄因子預(yù)測(cè)可能的轉(zhuǎn)錄因子轉(zhuǎn)錄因子在提交序列中的位置轉(zhuǎn)錄因子在提交序列中的位置24課堂練習(xí) 1 使用CpG Plot預(yù)測(cè)基因的CpG island位置。 2 使用PolyAH預(yù)測(cè)基因可能
10、的轉(zhuǎn)錄終止的位置。 3 使用PromotorScan尋找基因上游序列里可能的轉(zhuǎn)錄因子調(diào)控區(qū)域。25基因密碼子偏好性基因密碼子偏好性261.研究研究蛋白質(zhì)結(jié)蛋白質(zhì)結(jié)構(gòu)功能構(gòu)功能中的作用中的作用2.在在表達(dá)外源基表達(dá)外源基因因方面的作用方面的作用3.在在生物信息學(xué)生物信息學(xué)研究中的作用研究中的作用基因密碼子偏好性基因密碼子偏好性: CodonW27粘帖目的序列粘帖目的序列密碼子表的選擇密碼子表的選擇http:/mobyle.pasteur.fr/cgi-bin/portal.py?form=codonw#forms:codonw計(jì)算所有指數(shù)計(jì)算所有指數(shù)28各項(xiàng)指數(shù)輸出結(jié)果各項(xiàng)指數(shù)輸出結(jié)果密碼子使用
11、頻率密碼子使用頻率CodonW結(jié)果界面 CAI (Codon Adaptation Index)密碼子適應(yīng)指數(shù)密碼子適應(yīng)指數(shù)目標(biāo)基因與高表達(dá)基因的密碼子偏好性的相似程度(1完全相同,0完全不相同,本例為0.173) CBI (Condon Bias Index)密碼子偏好指標(biāo)密碼子偏好指標(biāo)目標(biāo)基因與隨機(jī)序列的最優(yōu)密碼子的差異程度(1完全偏好,0隨機(jī)情況,可能為負(fù)值,本例為-0.049) Fop (Frequency of optimal codon)最優(yōu)密碼子頻率最優(yōu)密碼子頻率目標(biāo)基因的最優(yōu)密碼子數(shù)與全部同義密碼子數(shù)的比值(1完全偏好,0完全無(wú)偏好,本例為0.380)29課堂練習(xí) 使用Codo
12、nW分析基因的密碼子使用偏好,了解密碼子偏好分析中各指數(shù)的含義。3031內(nèi)含子內(nèi)含子/外顯子剪切位點(diǎn)識(shí)別外顯子剪切位點(diǎn)識(shí)別如何分析核酸序列中的外顯子組成?通過(guò)對(duì)特征序列(GT-AG)的分析進(jìn)行直接的預(yù)測(cè)基因預(yù)測(cè)軟件(NetGene2)與相應(yīng)的基因組序列比對(duì),分析比對(duì)片段的分布位置(Spidey)3233剪切位點(diǎn)識(shí)別:剪切位點(diǎn)識(shí)別:NetGene2http:/www.cbs.dtu.dk/services/NetGene2/提交序列提交序列選擇物種選擇物種34NetGene2輸出結(jié)果輸出結(jié)果供體位點(diǎn)供體位點(diǎn)受體位點(diǎn)受體位點(diǎn)可信度可信度 相位相位35mRNA剪切位點(diǎn)識(shí)別:剪切位點(diǎn)識(shí)別:Spidey
13、 NCBI開發(fā)的在線預(yù)測(cè)程序 用于mRNA序列同基因組序列比對(duì)分析 /spidey36Spidey同源序列的獲得同源序列的獲得:序列比對(duì)序列比對(duì) 通過(guò)BLAST進(jìn)行序列比對(duì),找到可能同源的相似性好的一系列mRNA序列。BLAST比對(duì)到的三條mRNA序列37輸入基因組序列或序列數(shù)據(jù)庫(kù)號(hào)輸入基因組序列或序列數(shù)據(jù)庫(kù)號(hào)輸入相似性序列輸入相似性序列判斷用于分析的序列間的判斷用于分析的序列間的差異,并調(diào)整比對(duì)參數(shù)差異,并調(diào)整比對(duì)參數(shù)不受默認(rèn)內(nèi)含子長(zhǎng)度限不受默認(rèn)內(nèi)含子長(zhǎng)度限制,制,默認(rèn)長(zhǎng)度:內(nèi)部?jī)?nèi)含子默認(rèn)長(zhǎng)度:內(nèi)部?jī)?nèi)含子為為35kb, 35kb, 末端內(nèi)含子為末端
14、內(nèi)含子為100kb100kb比對(duì)閾值比對(duì)閾值選擇物種選擇物種輸出格式選擇輸出格式選擇38Spidey輸出結(jié)果第一條藍(lán)色序列第一條藍(lán)色序列為基因組序列,為基因組序列,橘黃色為外顯子橘黃色為外顯子外顯子對(duì)應(yīng)于外顯子對(duì)應(yīng)于基因組上的基因組上的起始起始/ /結(jié)束位置結(jié)束位置外顯子對(duì)應(yīng)于外顯子對(duì)應(yīng)于mRNA/cDNAmRNA/cDNA上的上的起始起始/ /結(jié)束位置結(jié)束位置供體、受體位點(diǎn)供體、受體位點(diǎn)外顯子外顯子長(zhǎng)度長(zhǎng)度一致性一致性百分比百分比錯(cuò)配和錯(cuò)配和gapgap外顯子外顯子序號(hào)序號(hào)序列聯(lián)配結(jié)果序列聯(lián)配結(jié)果39課堂練習(xí) 1 練習(xí)兩種預(yù)測(cè)剪切位點(diǎn)的軟件的使用,NetGene2和Spidey。 2 Spi
15、dey的同源序列文件保存在c:zcnishixi2文件下,名字為Spidey.txt,使用寫字板打開查看。40選擇性剪切選擇性剪切(Alternative splicing)分析分析選擇性剪接是調(diào)控基因表達(dá)的重要機(jī)制了解不同物種、細(xì)胞、發(fā)育階段、環(huán)境壓力下基因的調(diào)控表達(dá)機(jī)制41選擇性剪接的類型選擇性剪接的類型選擇性剪切的五種基本類型: 內(nèi)含子保留. 5端選擇性剪切位點(diǎn). 3端選擇性剪切位點(diǎn). 外顯子遺漏. 互斥外顯子. 42查詢選擇性剪切相關(guān)的網(wǎng)站查詢選擇性剪切相關(guān)的網(wǎng)站http:/www.ebi.ac.uk/astd/main.html 綜合綜合http:/splicenest.molgen
16、.mpg.de/綜合綜合/new_alt_exon_db2/綜合綜合.tw/.au/altExtron人人/kent/intronerator/altsplice.html線蟲線蟲/tdb/e2k1/ath1/altsplicing/splicing_variations.shtml擬南芥擬南芥從已知基因的功能推測(cè)剪切機(jī)制從已知基因的功能推測(cè)剪切機(jī)制43選擇性剪切查詢:選擇性剪切查詢:ASTD數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)http:/www.ebi.ac.uk/astd/main.html 輸入基因名稱輸入基因名稱選擇物種類型選擇物種類型44ASTD數(shù)據(jù)庫(kù)檢索結(jié)果:基因描述信息 導(dǎo)出序列文件導(dǎo)出序列文件45ASTD數(shù)據(jù)庫(kù)檢索結(jié)果:選擇性剪切的mRNA十十一一種種選選擇擇
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司聯(lián)歡策劃方案
- 公司答謝晚宴策劃方案
- 公司每周一歌活動(dòng)方案
- 公司花藝團(tuán)建活動(dòng)方案
- 公司獻(xiàn)愛心慈善活動(dòng)方案
- 公司老員工激勵(lì)活動(dòng)方案
- 公司每月之星策劃方案
- 公司植物園活動(dòng)策劃方案
- 公司聚辦相親活動(dòng)方案
- 公司氣球游戲小活動(dòng)方案
- 石灰廠中控室管理制度
- 抵押車輛合同范本
- 2025至2030年中國(guó)汽車抵押貸款行業(yè)市場(chǎng)研究分析及發(fā)展?jié)摿ρ信袌?bào)告
- 2024年杭州市蕭山區(qū)機(jī)關(guān)事業(yè)單位招聘真題
- 第三方外包管理制度
- 2025年重慶市中考生物試卷真題(含標(biāo)準(zhǔn)答案)
- 2025高考英語(yǔ)解析及其范文
- 2025年6月8日北京市事業(yè)單位面試真題及答案解析(下午卷)
- 人力資源測(cè)評(píng)期末考試試題及答案
- 2024年貴州省糧食儲(chǔ)備集團(tuán)有限公司招聘真題
- 護(hù)理生物學(xué)試題及答案
評(píng)論
0/150
提交評(píng)論