生物信息學題矩陣的構建_第1頁
生物信息學題矩陣的構建_第2頁
生物信息學題矩陣的構建_第3頁
生物信息學題矩陣的構建_第4頁
生物信息學題矩陣的構建_第5頁
已閱讀5頁,還剩29頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Exchange your mind張閃閃關于PAM矩陣的討論歷史蹤跡 最大的成績或許就是得分矩陣的出現, Dayhoff被稱作生物信息學之父或許更合適。 Dr. Margaret Oakley Dayhoff, credited as the founder of Bio-Informatics, ca. 1980 Margaret Dayhoff, 1978; Accepted point mutation :(可接受的點突變PAM)若蛋白質序列中的一個點突變不會改變或僅有微小改變蛋白質的功能,且這樣的突變能夠通過遺傳傳給下一代,稱這樣的點突變為可接受的點突變。 蛋白質進化中哪些點突變是可

2、接受的呢? 34個蛋白質超家族的71個蛋白質組中的1572種變化; 序列相似性 85%; 功能同源的蛋白質 通過中性進化,引入可接受的點突變; PAM:設有兩條蛋白質序列s和t,使用一系列的可接受突變將s變換為t,若平均每100個殘基發生一次點突變,則稱這兩條序列相距1個PAM單位。 Dayhoff等計算了各氨基酸的相對突變能力,這只是描述了在較短進化時期內每個氨基酸發生變化的頻度。為了計算相對突變的能力,他們把每種氨基酸發生突變的次數除以該氨基酸出現的總次數。氨基酸相對突變的可能性(氨基酸相對突變的可能性(Mj)丙氨酸的值主觀設定為100 每種氨基酸相對突變率mi1002iifAAim總替換

3、數所有總共發生替換數氨基酸100iifMi:第i種氨基酸;Mi :氨基酸i的突變率fi :每種氨基酸出現的頻率;100:每100個殘基發生一次突變(1%)氨基酸歸一化頻率(fj)甘氨酸丙氨酸亮氨酸賴氨酸絲氨酸纈氨酸蘇氨酸脯氨酸谷氨酸天冬氨酸0.0890.0870.0850.0810.0700.0650.0580.0510.0500.047精氨酸天冬酰胺苯丙氨酸谷氨酰胺異亮氨酸組氨酸半胱氨酸酪氨酸甲硫氨酸色氨酸0.0410.0400.0400.0380.0370.0340.0330.0300.0150,010總共發生替換數氨基酸相互替換的次數與氨基酸ijimmiji氨基酸氨基酸i替換為替換為j的

4、突變率的突變率mij ( )ji突變Q2:iiimm1:時ji :時ji 總共發生替換數氨基酸相互替換的次數與氨基酸總替換數總共發生替換數氨基酸ijifij1002因此,因此,mij與與mji差別僅是由差別僅是由fi fi 和和fjfj的不同而引起的的不同而引起的總共發生替換數氨基酸相互替換的次數與氨基酸ijimmiji1002jfji總替換數相互替換的次數與氨基酸表示i的突變率PAM1矩陣的構建 1. 兩個蛋白質序列的1%氨基酸發生變化的時間; 2. 定義進化時間以氨基酸的變異比例為準,而不是時間;因為各個蛋白質家族進化的速度并不相等; 3. PAM2 = PAM1*PAM1 PAM3 =

5、(PAM1)3 PAM250= (PAM1)250PAM2矩陣 1. 基本假設:每個氨基酸的突變的概率獨立于前次突變。因此,PAM2=PAM1*PAM1舉個例子 已知3個蛋白質家族若干保守序列片段: 家族一:FKILK,FKIKK,FFILL,FFIKL 家族二:IIFFF, IIFIF , IKFFL , IKFIL 家族三: KIFKK,KIFLK,KLFKL,KLFLL按Doyhoff方法構建PAM1矩陣 位置對齊,多重比對(不考慮空位) 統計每種氨基酸出現的頻率;fi = 氨基酸i的數目/總氨基酸數目fL = 12/60 = 0.200 fK = 16/60 = 0.267 .家族一家

6、族二家族三F K I L KI I F F FK I F K KF K I K KI I F I FK I F L KF F I L LI K F F LK L F K LF F I K LI K F I LK L F L L 最大簡約法(N代表氨基酸互換次數)家族一:N(LK) = 3 N(KF) = 1家族二: N(FI) = 2 N(KI) = 1 N(FL) = 1家族三: N(LK) = 3 N(IL) = 1FKILKFKIKKFKIKKFFIKLFFILLFFIKL(LK)(KF)(LK)(LK) 計算每種氨基酸轉換成其它氨基酸的次數。 假設兩種氨基酸間相互轉換一樣。e.g. N

7、(LK)= 3 + 0 + 3 = 6KFILK116F121I121L611 每種氨基酸相對突變率mi i:第i種氨基酸; :氨基酸i的突變率fi :每種氨基酸出現的頻率;mK = 8/(122 fK 100) = 0.0125 fK = 16/60=0.267mF =4/(122 fK 100) =0.0056.1001002iiiifMfim總替換數總共發生替換數氨基酸iM 氨基酸i替換為j的突變率mije.g.mKK = 1- mK = 0.9875mKF = mK 1/4 = 0.001389 iiiiijmmjijjimmji1時,總共發生替換數氨基酸相互替換的次數與氨基酸時, 氨基酸突變概率一步轉移概率矩陣M1ij原氨基酸KFIL替換氨基酸K0.98750.0015630.0015630.009375F0.0013890.9944440.0027780.001389I0.0017860.0035710.9928570.001786L0.01250.0020830.0020830.983333 由突變率mij計算計分矩陣中的分值rij: 將rij 和rji取平均值,再取整數;(按先前假設, rij = rji) rKK = 10 log(mkk/ fk) = 10 log (0.9875/0.267

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論