




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第五章蛋白質結構預測和分子設計蛋白質結構的預測概述由于用X光晶體衍射和NMR核磁共振技術測定蛋白質的三維結構,以及用生化方法研究蛋白質的功能效率不高,無法適應蛋白質序列數量飛速增長的需要。蛋白質序列——結構——功能….-Gly-Ala-Glu-Phe-….功能
蛋白質結構預測問題就是通過理論計算和統計模擬等方法尋找一種從蛋白質的氨基酸線性序列到蛋白質所有原子三維坐標的一種映射。!蛋白質結構預測主要有兩大類方法:(1)理論分析方法通過理論計算(如分子力學、分子動力學計算)進行結構預測。這種方法由于折疊前后的能量差太小、蛋白質可能的構象空間龐大和質折疊的計算量太大等原因不大可行。(2)統計的方法對已知結構的蛋白質進行統計分析,建立序列到結構的映射模型,進而對未知結構的蛋白質根據映射模型直接從氨基酸序列預測結構。主要方法包括:經驗性方法根據一定序列形成一定結構的傾向進行結構預測。結構規律提取方法從蛋白質結構數據庫中提取關于蛋白質結構形成的一般性規則,指導建立未知結構的蛋白質的模型。同源模型化方法通過同源序列分析或者模式匹配預測蛋白質的空間結構或者結構單元(如鋅指結構、螺旋-轉角-螺旋結構、DNA結合區域等)。這是目前預測結果最可靠的方法。預測蛋白質的物理性質由蛋白質序列可以預測出蛋白質的許多基本性質:氨基酸組成、等電點(pI)、分子質量、酶切特性、親水性和疏水性、電荷分布等。相關工具有:ComputepI/MW(http://www.expasy.ch/tools/)是ExPASy工具包中的程序,計算蛋白質的等電點和分子量。對于堿性蛋白質,計算出的等電點可能不準確。PeptideMass(http://www.expasy.ch/tools/)是ExPASy工具包中的程序,分析蛋白質在各種蛋白酶和化學試劑處理后的內切產物(肽片段的相對分子質量、理論等電點等)。TGREASE(/pub/fasta/)是FASTA工具包中的程序,分析蛋白質序列的疏水性。這個程序延序列計算每個殘基位點的移動平均疏水性,并給出疏水性-序列曲線,用這個程序可以發現膜蛋白的跨膜區和高疏水性區的明顯相關性。SAPS(http://www.isrec.isb-sib.ch/software/SAPS_form.html)蛋白質序列統計分析,對提交的序列給出大量全面的分析數據,包括氨基酸組成統計、電荷分布分析、電荷聚集區域、高度疏水區域、跨膜區段等。AACompIdent(http://www.expasy.ch/tools/)或PROSEARCH(http://www.embl-heidelberg.de/prs.html)利用未知蛋白的氨基酸組成檢索具有相同組成的已知蛋白。將查詢蛋白與庫中已知蛋白進行比較,給出相似蛋白及其所打分數,分數越高,可能性越大。蛋白質二級結構預測二級結構是指α螺旋和β折疊等規則的蛋白質局部結構元件。二級結構預測的基本依據:每一段相鄰的氨基酸殘基具有形成一定二級結構的傾向。二級結構預測的目標:判斷每一段中心的殘基是否處于螺旋(H)、折疊(E)、轉角(-)(或其它狀態)之一的二級結構態,即三態。總的來說,二級結構預測仍是未能完全解決的問題,一般對于α螺旋預測精度較好,對β折疊差些,而對除α螺旋和β折疊等之外的無規則二級結構則效果很差。二級結構預測的基本策略:(1)相似序列→相似結構QLMGERIRARRKKLKQLMGAERIRARRKKLK結構?(2)分類分析α螺旋提取樣本聚類分析學習分類規則預測….-Gly-Ala-Glu-Phe-….二級結構預測的方法:經驗參數法又稱Chou-Fasman方法,是一種基于單個氨基酸殘基統計的經驗預測方法。通過統計分析,獲得的每個殘基出現于特定二級結構構象的傾向性因子,進而利用這些傾向性因子預測蛋白質的二級結構。基本過程:掃描輸入的氨基酸序列,利用一組規則發現可能成為特定二級結構成核區域的短序列,然后對于成核區域進行擴展,不斷擴大成核區域,直到傾向性因子小于1.0為止。經驗規則:(i)α螺旋規則(ii)β折疊規則(iii)轉角規則(iv)重疊規則延伸成核區延伸(2)GOR方法基本過程:首先對已知二級結構的蛋白樣本集進行分析,計算出中心殘基的二級結構分別為螺旋、折疊和轉角時每種氨基酸出現在窗口中各個位置的頻率,從而產生一個得分矩陣。然后利用矩陣中的值來計算待預測的序列中每個殘基形成螺旋、折疊或者轉角的概率。序列窗口中心殘基窗口中各個殘基對中心殘基二級結構的支持程度(3)基于氨基酸疏水性的預測方法這種方法是一種用物理化學方法進行二級結構預測的方法,或稱為立體化學方法。在蛋白質中,氨基酸的理化性質對蛋白質的二級結構影響較大,因此在進行結構預測時需要考慮氨基酸殘基的物理化學性質,如疏水性、極性、側鏈基團的大小等,根據氨基酸殘基各方面的性質及殘基之間的組合預測可能形成的二級結構。“疏水性”是氨基酸的一種重要性質,疏水性的氨基酸傾向于遠離周圍水分子,將自己包埋進蛋白質的內部。這一趨勢加上空間立體條件和其它一些因素決定了一個蛋白質最終折疊成的三維空間構象。目前已經總結出α螺旋和β折疊的預測規則。(4)同源分析法將待預測的片段與數據庫中已知二級結構的片段進行相似性比較,利用打分矩陣計算出相似性得分,根據相似性得分以及數據庫中的構象態,構建出待預測片段的二級結構。該方法對數據庫中同源序列的存在非常敏感,若數據庫中有相似性大于30%的序列,則預測準確率可大大上升。(5)綜合方法在實際進行蛋白質二級結構預測時,往往會綜合應用各種分析方法和相關數據。綜合方法不僅包括各種預測方法的綜合,而且也包括結構實驗結果、序列對比結果、蛋白質結構分類預測結果等信息的綜合。最常見的綜合方法是同時使用多個軟件進行預測,通過分析各個軟件的特點以及各個軟件預測結果,最終形成二級結構一致性的預測結果。nnPredict(/~nomi/nnpredict.html)預測每個氨基酸的二級結構類型。它將蛋白質結構類型分為全α蛋白、全β蛋白和α/β蛋白,輸出結果包括“H”(螺旋)、“E”(折疊)和“-”(轉角)。這個方法對全α蛋白能達到79%的準確率。二級結構預測的程序:PredictProtein(/predictprotein/)提供了序列搜索和結構預測服務。它先在SWISS-PROT中搜索相似序列,構建多序列比對的特征簡圖,再在數據庫中搜索相似的特征簡圖,然后來預測相應的結構特征,包括二級結構。返回的結果包含大量預測過程中產生的信息,還包含每個殘基位點的預測可信度。這個方法的平均預測準確率達到72%。SOPMA(http://pbil.ibcp..fr/)一種獨特的自優化預測方法,它是用五種相互獨立的方法進行預測,然后將預測結果匯集成“一致預測結果”,采用的二級結構預測方法包括GOR方法、Levin同源預測方法、雙重預測方法、PHD方法和SOPMA方法。其它特殊局部結構的預測蛋白質還存在一些特殊的局部結構,如膜蛋白的跨膜螺旋、信號肽、卷曲螺旋等,具有明顯的序列特征和結構特征,也可用計算方法加以預測。COILS(/software/COILS_form.html)卷曲螺旋預測方法,將序列與已知的平行雙鏈卷曲螺旋數據庫進行比較,得到相似性得分,并據此算出序列形成卷曲螺旋的概率。TMpred(/software/TMPRED_form.html)預測蛋白質的跨膜區段和在膜上的取向,它根據來自SWISS-PROT的跨膜蛋白數據庫Tmbase,利用跨膜結構區段的數量、位置以及側翼信息,通過加權打分進行預測。SignalP(http://www.cbs.dtu.dk/services/SignalP/)信號肽(signalpeptide)是未成熟蛋白質中,可被細胞轉運系統識別的特征氨基酸序列。預測蛋白質序列中信號肽的剪切位點。蛋白質的三維結構的預測蛋白質三維結構預測是最復雜和最困難的預測技術。研究發現,序列差異較大的蛋白質序列也可能折疊成類似的三維構象,自然界里的蛋白質結構骨架的多樣性遠少于蛋白質序列的多樣性。盡管由于蛋白質的折疊過程仍然不十分清楚,但也發展出了一些有一定作用的三維結構預測方法。三維結構的預測方法:1.同源模型化方法主要思想:對于一個未知結構的蛋白質,找到一個已知結構的同源蛋白質,以該蛋白質的結構為模板,為未知結構的蛋白質建立結構模型。依據:任何一對蛋白質,如果兩者的序列等同部分超過30%,則它們具有相似的三維結構,即兩個蛋白質的基本折疊相同,只是在非螺旋和非折疊區域的一些細節部分有所不同。對于具有60%等同的序列,用上述方法所建立的三維模型非常準確。若序列的等同部分超過60%,則預測結果將接近于實驗得到的測試結果。一般如果序列的等同部分大于30%,則可以期望得到比較好的預測結果。2.線索化方法(折疊識別方法)遠程同源:有很多蛋白質具有相似的空間結構,但它們的序列等同部分小于25%。線索化的主要思想:建立一個從目標序列到已知結構的線索,利用氨基酸的結構傾向(如形成二級結構的傾向、疏水性、極性等),評價一個序列所對應的結構是否能夠適配到一個給定的結構環境中。建立序列到結構的線索的過程稱為線索化,線索技術又稱折疊識別技術。線索化目標是為目標蛋白質尋找合適的蛋白質模板,這些模板蛋白質與未知序列沒有顯著的序列相似性,但卻是遠程同源的。未知序列與結構數據庫核心折疊比對取最佳核心折疊建立結構模型3.從頭預測方法在既沒有已知結構的同源蛋白質、也沒有已知結構的遠程同源蛋白質的情況下,上述兩種蛋白質結構預測的方法都不能用,這時只能采用從頭預測方法,即(直接)僅僅根據序列本身來預測其結構。目前這種方法還難以產生準確的預測結構。相關資源:SWISS-MODEL(http://www.expasy.ch/swissmod/SWISS-MODEL.html)自動蛋白質同源模建服務器。CPHmodels(http://www.cbs.dtu.dk/services/CPHmodels/)同源模建預測蛋白質結構。預測方法評價對各種方法所得到的蛋白質結構預測結果需要進行驗證,以確定預測方法是否可行,確定其適應面。驗證的方法是取已知結構的蛋白質,對這些蛋白質進行模擬結構預測,并將預測結構與真實結構進行比較,分析兩者之間的差距。為了客觀地評價各種預測方法,已經設立了權威的評判機構,建立公共認可的蛋白質結構測試數據集。設立在馬里蘭生物技術研究中心的CASP就是這樣一個系統(/casp4/)。
蛋白質分子設計蛋白質工程通過生物技術手段對蛋白質的分子結構或者對編碼蛋白質的基因進行改造,以便獲的更適合人類需要的蛋白質產品的技術。蛋白質的分子設計是為有目的的蛋白質工程改造提供設計方案。這是一門新興的研究領域,其本身在不斷地發展,其內容也在不斷地更新。蛋白質分子設計的過程首先建立所研究對象的結構模型,在此基礎上進行結構-功能關系研究,然后提出設計方案,通過實驗驗證后進一步修正設計,往往需要幾次循環才能達到目的。具體步驟:(1)建立所研究蛋白質的結構模型。可通過PDB等蛋白質三維結構數據庫查閱蛋白結構,也可通過X射線晶體學、二維核磁共振等測定結構,還可根據類似物的結構或其他結構預測方法建立起結構模型。(2)找出對所要求的性質有重要影響的位置。可蛋白質的序列對比、分析找出影響蛋白質功能的重要位點,這是分子設計工作的關鍵。(3)構建和篩選突變體利用生物技術手段構建突變體,然后從中選擇一系列的蛋白質功能重要位點上殘基被改變的突變體。(4)預測突變體的結構。預測新蛋白質的二級和三級結構,是否符合分子設計的預期結構。(5)定性或定量計算優化所得到的突變體結構是否具有所要求的性質能否成功地進行分子設計,需要實驗數據的驗證新蛋白質的功能是否達到預期目標。按照改造部位的多寡將蛋白質的分子設計分為三類:(1)“小改”通過基因突變或化學修飾等方法改變個別氨基酸或刪除
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業廢水處理與排放標準解讀
- 工業廢水處理技術與設備選擇
- 工業污染治理與環保法規的協同作用
- 工業廢水處理及回收利用技術
- 工業機器人技術及其產業前景
- 工業物聯網技術發展趨勢及挑戰
- 工業自動化中的智能巡檢技術應用研究
- 工業機械的自動化帶式輸送機的技術解析
- 工業節能減排技術推廣與應用
- 工業遺址改造為生態公園的實踐案例
- 膽管癌的相關知識
- 構建可持續發展的社區醫養結合服務模式
- 液體的壓強創新實驗及教學設計
- 上海對外經貿大學《市場營銷學通論》2023-2024學年第一學期期末試卷
- 《酒店禮儀知識培訓》課件
- 《復合巖棉板外墻外保溫應用技術規程》
- 《產業經濟學》期末考試復習題及答案
- 重組人胰島素
- 護理信息安全管理制度
- 退役軍人服務站工作匯報
- 醫療器械維修質量控制制度
評論
0/150
提交評論