




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
同源模建的方法與結果分析Version1.0.2-------------------------------------------------------序言:作為一個以實驗為主的生化工作者來說,很多時候可以通過分子生物學手段獲取自己需要的目的基因,并在各種表達載體和宿主中進行對應蛋白的表達,隨后對于這些蛋白的特性進行研究,這也是一般酶學研究的特定套路。而近十幾年來,人們開始思考是否能夠將特性與蛋白質的三級結構進行關聯,從分子水平理解蛋白質與底物之間的相互作用呢?于是類似于蛋白結構模建、分子對接、分子動力學模擬、量化計算等多種手段相繼被創造以及應用。在這些方法中,同源模建無疑是最基礎也是最重要的一個步驟,因為其質量的好壞直接決定了后續工作是否可信。因此,本文打算就同源模建的基本原理、常用軟件及服務器以及結果分析與改進提供一些個人的經驗,并希望各位朋友能夠給予批評指正。同源模建的原理及應用限制兩點基本原理:1.一個蛋白質的結構由其氨基酸序列唯一的決定。知道其一級序列,至少在理論上足以獲取其結構2.結構在進化中更穩定,變化比序列層面的變化要緩慢許多。應用限制:模板蛋白和目標蛋白的序列一致性需要大于30%,且越大建模準確性越有保障。了解了基本的原理,我們需要知道在實際操作中,同源模建都需要怎么樣進行。同源模建的過程從實踐中可分為以下7個步驟:模板識別和初始比對在序列一致性比較高的時候,可以通過簡單的序列比對程序如BLAST獲取目標蛋白的結構(將比對的數據庫選擇為PDB數據庫)。比對結果的校正用以上的方法確定一個或多個建模模板后,應該采用更為精確的方法已取得更優的比對結果。有時在序列一致性較低的區域比對兩條序列可能會具有困難,這個時候,我們可以采取其他同源蛋白序列一起參與比對來找到解決的辦法。主鏈生成比對完成后,就可以開始實際的建模過程了,相對與后面幾步來說,主鏈建模時最沒有難度的一步了,因為大部分軟件都是通過簡單的拷貝模板蛋白的主鏈坐標來實現這一目的的。環區建模這一部分主要是目標蛋白和模板蛋白的比對結果中存在缺口的部分如何處理的問題。第一種解決的方式是略去模板蛋白存在的殘基,留下一個必須補上的缺口。另一種情況是將主鏈截斷,插入缺少的殘基。側鏈建模當我們比較結構相似的蛋白質中保守殘基的側鏈構象時,我們會發現他們的側鏈構象通常會比較相似。這就告訴我們如果加保守殘基的側鏈構象完整的拷貝到模建蛋白上時,在某些時候比先拷貝主鏈構象之后,再預測側鏈構象來的可靠。但是這一經驗規則在實際運用中僅在兩者序列一致性較高,并且保守殘基之間形成接觸的情況下才能實現。因此,在現有的測序中,都是構造各種可能的構象體,并利用基于能量的函數打分來實現側鏈構象的選擇的。模型優化模型優化其實是一個比較復雜的問題,其質量依賴于高精確性的預測側鏈構象體,而為了達到這種目的,我們需要正確的主鏈,這一步驟實際又依賴于側鏈構象體正確的堆積。因此,這一優化過程是迭代直至收斂的過程。需要注意的是,對于結構進行能量優化需要十分謹慎。因此偏離正確結構的途徑比指向正確結構的途徑多很多。在優化中的每一步可以排除一些大的誤差,但是也會引入很多小的誤差,這些小的誤差經過多步積累,就有可能使你的結果更加偏離正確的結構。模型驗證所有的模型都包含誤差,誤差的多少主要依賴于兩方面的內容:1.序列一致性的高低,越低的話引入誤差的可能性就越大。2.模板蛋白中的誤差:如果這種誤差是局域性的,尤其是遠離活性位點的,對于你最后進行分子對接等研究室幾乎沒有影響的。如果是蛋白整體的,則需要小心處理。常用軟件、服務器2.1常用服務器:=1\*GB3①SWISS-MODEL:網址/SWISS-MODEL可能是目前非專業人士應用最為廣泛的一個在線建模服務器了。其常見的模式可分為:Automatedmode:自動模式,可以稱為是最傻瓜的方式了進去之后只需要填上你的email以及在底下的框框內輸入你所想模建的蛋白序列,再點擊submitmodelingrequest即可,底下還有高級選項,支持自定義模板蛋白的pdb以及chain,或者自己上傳模板文件,簡而言之,真是非常易于操作。這種方法適用于PDB數據庫中存在高度同源的蛋白結構時的建模(蛋白序列一致性最好大于80%,個人經驗)Alignmentmode:比對模式基本的操作和自動模式類似,但是其序列提交的時候可以提交目標蛋白與模板蛋白的序列比對結果(FASTA,MSF,ClustalW等格式),如下所示:這個服務器最好的一點就是可以提供處于各個區域的氨基酸殘基占總數的百分比。拉氏圖的結果主要分成4個區域:核心區域,允許區,大致允許區以及禁阻區。從圖中可以看到大部分的氨基酸殘基均位于核心區域(95.9%),落在允許區和大致允許區的各有1個殘基,而處于禁阻區的只有殘基Ser112。通過我們對這個蛋白本身的了解可知,Ser112為該水解酶的催化三聯體,其模板蛋白的Ser112同樣處于禁阻區。接下來我們看看ERRAT的結果,該結果中Overallqualityfactor值越高越好,一般高解析度的晶體結構該值可以達到95,而對于解析度一般的來說該值只能到91%左右。本例中的ERRAT值為89.928,已經比較接近低解析度的晶體結構了,但是應該還有繼續改進的空間。在圖中存在的兩條誤差限表示的是位于其線以上的區域有多大的可能性是有問題的區域。根據這一結果,可以看出從殘基120-150之間是一個需要高度注意的區域,另一個需要注意的區域是250-255。從BphD的PDB結構來看這兩段主要是loop區,本身具有較大的彈性,因此再接下來的過程中可能需要重點關注這一段結構的優化。
其他的參數如verify_3D等數值較好,在本例中未詳細給出,將在下一個修改版中放出首先,我們考慮采用計算量較少的chiron服務器對模建結構的clash進行處理。其結果給出原始蛋白結構中存在的結構間的沖突以及其修正后的結果與原始結構的疊合結果。接下來我們利用SAVES對于經過處理的蛋白結構進行評價:首先從拉氏圖來看,兩者的差別不大。而從ERRAT圖中我們可以看到250-255這段區域的結構明顯改善,但是135-140這個區域的結構似乎變得更為糟糕。這時候,俺們就需要考慮利用MD對整個結構進行進一步的松弛,以去除不合適的clash。以下我們可以考慮利用Gromacs對蛋白結構進行能量最小化。待補充-------
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 吉林省白山市名校2024年物理八年級第一學期期末考試試題含解析
- 2025版物流運輸采購合同追加協議模板下載
- 二零二五年海鮮餐廳員工聘用合同示范
- 二零二五年度裝配式建筑預制構件運輸與安裝勞務合同規范模板
- 2025版保安行業安全防范技術研發與應用聘用合同
- 2025版年度財務代理與稅務籌劃服務合同范本
- 二零二五年度智能測量儀器研發合作合同
- 二零二五年度網絡安全托管與安全事件響應服務合同
- 二零二五年度智能家居APP應用委托開發合同
- 2025版餐飲店合資經營合伙人合同兩人聯營
- 2025年安徽交控集團財務有限公司招聘筆試參考題庫含答案解析
- 《個人信息保護法》考試參考試題庫100題(含答案)
- DL∕T 5776-2018 水平定向鉆敷設電力管線技術規定
- GB/T 1665-2008增塑劑皂化值及酯含量的測定
- 甘肅地質災害危險性評估規程DB62-2023
- GA/T 1073-2013生物樣品血液、尿液中乙醇、甲醇、正丙醇、乙醛、丙酮、異丙醇和正丁醇的頂空-氣相色譜檢驗方法
- GA 6-2004消防員滅火防護靴
- 臨床心電向量圖-沈絮華課件
- 肝門部膽管癌診療治療指南
- 《紫閨祕書》杏溪浣香主人撰演示教學
- 中國服裝發展史(完整版)
評論
0/150
提交評論