




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基因家族分析——挖掘與物種特性相關的生物學問題張
龍華中農業大學&廣東省農科院2539570165@qq.cm基本內容一、獲取目標物種基因二、目標物種基因基本信息的獲取(命名、理化性質、亞細
胞
定
位
等
)●蛋白物理化學性質分析/protparam/●亞細胞定位ttp://www.csbio.sjtu.e/bioinf/plant-multi/#一般將以上信息匯總在一張
表格中在文章中展示。alP/三、構建系統發育樹——構建、評估、解讀1、構建·
序列比對,選擇保守區域·
有根樹or
無根樹:一般由于信息不足,采用無根樹·
建樹方法的選擇:NJ
法(常用,遠緣)、ML
法(進化模型)、MP
法
(近緣)等2、評估自展檢驗(Bootstrap
method)法,檢驗次數一般1000次,可將分支上的
百分數視為這支結果的可信度。三、構建系統發育樹——構建、評估、解讀3、解讀闡明系統進化關系。注意:系統發育樹并不能
確切指示進化方向FpTPS1pTF
S120eGpTPS
522GppsiAGo輸入的序分7進化關系,數字是評估,長度是進化距離亞家族分類ss2四、染色體定位分析1、基因主要分布于哪條染色體?2、是否能形成基因簇?基因簇的形成一般與基因家族的來源和特定功能有關。T
patop名言名名的
師0pToptmTPS4五
、motif分析(保守基序分析)在文章中,motif
分布圖通常與基因家族進化樹合并,這樣有助于直觀查看不同分支保守和特異性motif。如果對某些motif
感興趣,還可進一
步用CDD注釋motif
功能。可見每一推測同一亞家族成員有類似的功能亞家族成員中Motif
組成和
排列順序的與功能相關六、基因結構分析了解基因家族成員的基本分類信息、提供對某些基因家族內進化關系的見解。在文章中,基因結構圖通常與基因家族進化樹合并,這樣有助于直觀查看不同分支在基因結構上的保守性和特征。同一亞家族成員的基因結構是否類似,反證建樹是否可靠。UTR(非編碼區、內含子組)、CDS
(編碼區、外顯子組)數量與基因結構、功能有關七、基因復制和共線性分析闡明目標物種基因家族的潛在進化機制,有無串聯重復和大片段復制。研
究目標物種和其他物種基因家族成員之間的直系同源對關系。一般來說,基因長度和相似性大于70%則為基因復制;兩個重復基因的物理間隔小于100kb
且被少于5個基因分隔,則為串聯重復基因。紅線越多,直系同源基因對越多,親緣關系越近,基因功能越相似紅色:高表達藍色:低表達一般有以下幾種類型:·不同組織表達分析:根、莖、葉·不同時間表達分析:1d、2d、3d·不同處理表達分析:干旱、鹽堿、水漬
明確基因家族的表達情況八
、基因表達分析基因家族的表達分析與基因功能的關系最緊密九、啟動子分析獲得基因家族功能相關的上游調控通路或因子,或響應的上游信號。是否含有某些脅迫響應順式元件或激素響應相關的基因。十、其他分析1、蛋白互作網絡分析:·分析家族成員之間的蛋白互作情況,分析是否需要形成同源或異源二聚體或多聚體來發揮功能;·
目標基因家族蛋白發揮作用時是否需要和其他蛋白形成復合體;·分析目標基因家族蛋白的上下游互作調控蛋白,比如轉錄因子通過結合基因啟
動子來調控基因表達,或者激酶通過蛋白互作磷酸化該蛋白從而進行信號轉導;·可以靶向下游基因發揮作用,比如酶催化底物蛋白進行生化反應等2、蛋白domian
比對分析和可視化3、蛋白3D結構分析和可視化4、基因家族特殊結構域分析基因家族分析簡明教程1、獲取目標物種基因2、目標物種目標基因家族鑒定3、基因家族成員理化性質分析4、亞細胞定位預測5、染色體定位分析6、系統進化分析7、基因結構分析8、motif分析9、啟動子分析10、基因共線性分析11、其他分析目
錄已超鏈接,點擊跳轉1.基因家族的鑒定·1.1獲取參考基因組信息NCBI(https://www.ncbi.nlm.nih.gov)在此輸入物種拉丁名+基因家族名稱如:TriticumaestivumTCP1.2獲取目標物種相關基因組數據(
DNA,cDNA,CDS,Proteinsequence,Genesets(GTF&GFF3)等)——使用EnsemblPlants
數據庫http://plants.ensembl.org/info/data/ftp/index.htmlLoginRegister2
基因家族成員鑒定:hummer
鑒定在Pfam網站https:
//pfam.xfam.org
/下載隱馬爾可夫模型2
.2在Pfam
網站https://pfam.xfam.org
/下載隱馬爾可夫模型12.3
以下載好的HMM
模型向目標物種基因組序列(蛋白)搜索,以篩選得到大
致的基因家族成員(候選基因)。hmmer程序/
下的子程序hmmsearch2.4.1將候選基因提交到
NCBI
中的
Batch
CDDsearch
和
Pf
am
數據庫比對,驗證是否具有目標基因特征,刪除假陽性基因。
首先是Batch
CDD
search。·打開NCBI——CDD——batch—CD—search·輸入剛剛提取得到的蛋白序列,點擊Browse
result,全選序列:2.4.2再點擊show
selected
queries,查看蛋白結構域將不含有目
的基因家族結構域的蛋白刪除,最后得到的蛋白序列即為該基因家族的序
列。或者使用TBtools
中的VisualizeNCBICDDDomainPattern
可視化結構域圖。2.5.1Pfam數據庫驗證比對(
http://pfam-
legacy.xfam.org/search)2.5.2.Pfam結果可視化2.6根據驗證結果確定基因,除去以下序列,最終得到確定的基因序列·無典型結構域·結構不完整·冗余序列3.1
蛋白物理和生化特征分析,預測蛋白質分子量、等電點、相對分子質量、穩定性等(/protparam/)。只輸入氨基酸序列即可,單個依次分析3.2
結果解讀ExpasyProtParamHomel
Contact Molecular
weight:29563.71
Theoretical
pI:6.124
亞細胞定位預測(http://wwW.csbio.sjtu.edu.cn/bioinf/plant-multi/#)5
基因位置分析及可視化6.
進化樹構建6.1
目標物種基因家族文件與擬南芥等參考物種基因家族文件合并。
將兩個序列信息文件粘貼復制進一個新的fasta
文件中即可6
.2
MEGA比對,將新合并的fasta
文件拖入ME
GA軟件中,選擇對齊進入。進化樹構建6.3
分析,完成后關閉當前頁面網
Molecular
EvolutionaryGenetics
Analysis□
×File
Analysis
Help點擊建樹DATA進化樹構建6.4
建樹,一般選擇NJ
法進化樹構建6.5
導出建樹文件,并保存。其他分析有用進化樹構建6
.6進化樹美化(https://evolgenius.info//evolviewv2/#login)
-進化樹構建6、進化樹美化。改變樹各部分顏色,可點擊下圖紅框框處查看官方詳細
配置說明。具體參考文章https://WWW.csdn.net/tags/0tDaQg4sODkzNjQtYmxvZw0000000000.html添加顏色的分組信息,編輯模板如下:AT2G04880.1,AT2G30250.1blue
adAT4G01250.1,AT4G31550.1red
adAT4G39410.1,AT5G49520.1yellow
ad《7.基因結構分析TBtools8
motif分析8.1
序列提取motif分析8.2
MEME文件提取(
/meme/tools/meme)motif分析8.3motif可視化9.啟動子分析9.1
提取基因組文件中前2000bp
作為啟動子區域序列啟動子分析9.2
簡化所提取的啟動子區域序列TBtools
(Toolbox
forBiologists)v1.098774SequenceToolkitBLASTGO&KEGGGraphicsOthersAbout?RepotIHelp0區
Fasta
stats
區
sequence
Manipulate
(Rev&Comp)區
AboutTBtools區
GXFSequencesExtractFastaID
SimplifySeta
Input
Fasta
FileE:
研究生穿心蓮TCP\8啟動子分析12000bp.fasta
目標物種啟動子序列信息Note:Ifthe
input
file
is
a
table,the
last
column
must
be
the
sequences.□Removeversion輸出文件SimplifyMy
Sequences"IDFile
OutputOutputTextAreaSetanOutput
FileE:研究生穿心蓮TCP\8啟動子分析2000bp.simpliy.fasta啟動子分析9.3提取目標基因家族啟動子序列信息啟動子分析9.4反向驗證提取序列是否是前2000bp啟動子分析9.
5
將目標基因家族啟動子序列信息轉化大寫(所得大寫化的信息需手
動復制進新建文本文檔中并修改格式為fasta)啟動子分析9.6大寫化的目標基因家族序列信息提交至plant
care在線網站(
htttml/)
進行,等待結果發送至郵箱,下載郵箱中的附件,解壓后用execl打開其中的xxx.tab
文件p://bioinformatics.psb.ugent.be/webtools/plantcare/h啟動子分析9.7
根據作圖形式整理TAB
文件數據,刪除無用列,保留有需要的信息,
對location列進行加減20得出起始、終止位置信息,根據功能描述列篩選所研究的順勢作用元件進行進一步分析。啟動子分析9.8.1.作
圖
,TBtools
線形圖需用文件準備:①整理篩選后的TAB文件信息格式為:第一列基因ID
、第二列起始位置、
第三列終止位置、第四列順式作用元件。ABCDCXN00000643-RA2000CXN00001195-RA2000CXN00002762-RA2000CXN00002878-RA2000CXN00004183-RA2000CXN00004279-RA2000CXN00004746-RA2000CXN00007220-RA2000CXN00008155-RA2000CXN00008471-RA2000CXN00008509-RA2000CXN00008780-RA2000CXN00010818-RA2000啟動子分析9.8.1.作
圖
,Tbtools線形圖需用文件準備:②2000bp
文件準備:第一列基因ID
,
第二列均為2000。Ex
cel
準備數
據后粘貼復制進新建文本文檔方可使用啟動子分析9.8.1.作
圖
,Tbtools線形圖需用文件準備:③進化樹文件準備:將只含有目標物種目標基因家族的序列信息文件放入
MEGA軟件中,進行構建進化樹操作至導出建樹文件(本教程進化樹構建
第5步)粘貼復制進新建文本文檔中。ABCDEFCXN00001195-RAApTCP2CXN00004183-RAApTCP5CXN00004746-RAApTCP7CXN00008155-RAApTCP9CXN00008780-RAApTCP12CXN00011342-RAApTCP14CXN00011470-RAApTCP15CXN00017071-RAApTCP17CXN00018640-RAApTCP18CXN00019468-RAApTCP19CXN00004279-RAApTCP6CXN00008509-RAApTCP11CXN00020943-RAApTCP22CXN00000643-RAApTCP1CXN00002762-RAApTCP3啟動子分析9.8.1.作
圖
,Tbtools線形圖需用文件準備:④重命名文件:第一列基因ID,
第二列新命名。Excel
準備數據后粘貼
復制進新建文本文檔方可使用。啟動子分析9.8.2作圖可視化,將準備的文件信息導入TBtools
中。ABCDE基因號順勢作用元件CXN00000643-RAI-boxCXN00000643-RAI-boxCXN00000643-RAGATA-motifCXN00000643-RAGT1-motifCXN00000643-RALTRCXN00000643-RAMRECXN00000643-RATGA-elementCXN00000643-RAARECXN00000643-RAARECXN00000643-RAAE-boxCXN00000643-RAMBSCXN00000643-RAABRECXN00000643-RAG-boxCXN00000643-RABox
4ICXN00001195-RAGT1-motif啟動子分析9.9.1.TBtools
熱圖制作,與上述線性圖一致選用一個即可。文件準備:①篩選后的TAB文件信息只保留基因ID和順式作用元件兩列即
可,使用Excel中的數據透視表功能處理數據如右圖所示。ABCDE基因號順勢作用元件CXN00000643-RAI-boxCXN00000643-RAI-boxCXN00000643-RAGATA-motifCXN00000643-RAGT1-motifCXN00000643-RALTRCXN00000643-RAMRECXN00000643-RATGA-elementCXN00000643-RAARECXN00000643-RAARECXN00000643-RAAE-boxCXN00000643-RAMBSCXN00000643-RAABRECXN00000643-RAG-boxCXN00000643-RABox
4ICXN00001195-RAGT1-motif啟動子分析9.9.1.TBtools
熱圖制作,與上述線性圖一致選用一個即可。文件準備:①篩選后的TAB文件信息只保留基因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物聯網與物流的關系
- 合伙人合同協議書掉了
- 西寧航空工裝項目商業計劃書參考模板
- 天氣安全課件
- 中老年奶粉行業調研與市場研究報告2025年
- 石材裝修施工合同協議書
- 攝影項目創業計劃書怎么寫
- 咨詢-智慧校園行業市場調查、產業鏈全景、需求規模預測報告2025
- 鶴崗市大數據項目商業計劃書
- 別墅預制合同協議書模板
- 土木工程CAD-終結性考核-國開(SC)-參考資料
- 放射性皮膚損傷的護理-中華護理學會團體標準
- 帕金森病的護理教學查房
- 智能手環項目財務分析報告
- 金屬加工余熱回收利用
- 廣東省2019年中考化學試卷(含答案)
- 2024年國家低壓電工證理論考試題庫(含答案)
- 甲狀腺手術甲狀旁腺保護
- 血液凈化室應急預案
- 專題01運動學中的圖像問題(共15種圖像類型)講義-2025版高考物理圖像專題
- 2024年工會專業知識考試題庫及答案
評論
0/150
提交評論