




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精選優質文檔-傾情為你奉上一、名詞解釋1. 生物信息學:1)生物信息學包含了生物信息的獲取、處理、分析、和解釋等在內的一門交叉學科;2)它綜合運用了數學、計算機學和生物學的各種工具來進行研究;3)目的在于闡明大量生物學數據所包含的生物學意義。2. BLAST(Basic Local Alignment Search Tool) 直譯:基本局部排比搜索工具意譯:基于局部序列排比的常用數據庫搜索工具含義:蛋白質和核酸序列數據庫搜索軟件系統及相關數據庫3. PSI-BLAST:是一種迭代的搜索方法,可以提高BLAST和FASTA的相似序列發現率。4. 一致序列:這些序列是指把多序列聯配的信息壓縮至單
2、條序列,主要的缺點是除了在特定位置最常見的殘基之外,它們不能表示任何概率信息。5. HMM 隱馬爾可夫模型:一種統計模型,它考慮有關匹配、錯配和間隔的所有可能的組合來生成一組序列排列。(課件定義)是蛋白質結構域家族序列的一種嚴格的統計模型,包括序列的匹配,插入和缺失狀態,并根據每種狀態的概率分布和狀態間的相互轉換來生成蛋白質序列。6. 信息位點:由位點產生的突變數目把其中的一課樹與其他樹區分開的位點。7. 非信息位點:對于最大簡約法來說沒有意義的點。8. 標度樹:分支長度與相鄰節點對的差異程度成正比的樹。9. 非標度樹:只表示親緣關系無差異程度信息。10. 有根樹:單一的節點能指派為共同的祖先
3、,從祖先節點只有唯一的路徑歷經進化到達其他任何節點。11. 無根樹:只表明節點間的關系,無進化發生方向的信息,通過引入外群或外部參考物種,可以在無根樹中指派根節點。12. 注釋:指從原始序列數據中獲得有用的生物學信息。這主要是指在基因組DNA中尋找基因和其他功能元件(結構注釋),并給出這些序列的功能(功能注釋)。13. 聚類分析:一種通過將相似的數據劃分到特定的組中以簡化大規模數據集的方法。14. 無監督分析法:這種方法沒有內建的分類標準,組的數目和類型只決定于所使用的算法和數據本身的分析方法。15. 有監督分析法:這種方法引入某些形式的分類系統,從而將表達模式分配到一個或多個預定義的類目中。
4、16. 微陣列芯片:將探針有規律地排列固定于載體上,與標記熒光分子的樣品進行雜交,通過掃描儀掃描對熒光信號的強度進行檢測,從而迅速得出所要的信息。17. 虛擬消化:是基于已知蛋白序列和切斷酶的特異性的情況下進行的理論酶切(課件定義)。是在已知蛋白質序列和蛋白外切酶之類切斷試劑的已知特異性的基礎上, 由計算機進行的一種理論上的蛋白裂解反應。18. 質譜(MS)是一種準確測定真空中離子的分子質量/電荷比(m/z)的方法,從而使分子質量的準確確定成為可能。19. 分子途徑是指一組連續起作用以達到共同目標的蛋白質。20. 虛擬細胞:一種建模手段,把細胞定義為許多結構,分子,反應和物質流的集合體。21.
5、 先導化合物:是指具有一定藥理活性的、可通過結構改造來優化其藥理特性而可能導致藥物發現的特殊化合物。就是利用計算機在含有大量化合物三維結構的數據庫中,搜索能與生物大分子靶點匹配的化合物,或者搜索能與結合藥效團相符的化合物,又稱原型物,簡稱先導物,是通過各種途徑或方法得到的具有生物活性的化學結構22. 權重矩陣(序列輪廓):它們表示完全結構域序列,多序列聯配中每個位點的氨基酸都有分值,并且特定位置插入或缺失的可能性均有一定的衡量方法(課件定義)。基礎上針對特定的應用目標而建立的數據庫。23. 系統發育學(phylogenetic):確定生物體間進化關系的科學分支。24. 系統生物學(system
6、s biology):是研究一個生物系統中所有組分成分(基因、mRNA、蛋白質等)的構成以及在特定條件下這些組分間的相互關系,并分析生物系統在一定時間內的動力學過程25. 蛋白質組(proteome):是指一個基因組、一種生物或一個細胞/組織的基因組所表達的全套蛋白質。26. ESI電噴霧離子化:一種適合大分子如蛋白質離子化沒有明顯降解的質譜技術。二.填空題1. 常用的三種序列格式:NBRF/PIR,FASTA和GDE2. 初級序列數據庫:GenBank,EMBL和DDBJ3. 蛋白質序列數據庫:SWISS-PROT和TrEMBL4. 提供蛋白質功能注釋信息的數據庫:KEGG(京都基因和基因組
7、百科全書)和PIR(蛋白質信息資源)5. 目前由NCBI維護的大型文獻資源是PubMed6. 數據庫常用的數據檢索工具:Entrez,SRS,DBGET7. 常用的序列搜索方法:FASTA和BLAST8. 高分值局部聯配的BLAST參數是HSPs(高分值片段對),E(期望值)9. 多序列聯配的常用軟件:Clustal10. 蛋白質結構域家族的數據庫有:Pfam,SMART11. 系統發育學的研究方法有:表現型分類法,遺傳分類法和進化分類法 12. 系統發育樹的構建方法: 距離矩陣法,最大簡約法和最大似然法13. 常用系統發育分析軟件:PHYLIP14. 檢測系統發育樹可靠性的技術:bootst
8、rapping和Jack-knifing15. 原核生物和真核生物基因組中的注釋所涉及的問題是不同的16. 檢測原核生物ORF的程序:NCBI ORF finder17. 測試基因預測程序正確預測基因的能力的項目是GASP(基因預測評估項目)18. 二級結構的三種狀態:螺旋,折疊和轉角19. 用于蛋白質二級結構預測的基本神經網絡模型為三層的前饋網絡,包括輸入層,隱含層和輸出層20. 通過比較建模預測蛋白質結構的軟件有SWISS-PDBVIEWER(SWISSMODEL網站)21. 蛋白質質譜數據搜索工具:SEQUEST22. 分子途徑最廣泛數據庫:KEGG23. 聚類分析方法,分為有監督學習方
9、法,無監督學習方法24. 質譜的兩個數據庫搜索工具:SEQEST和Lutkefish三.問答題1. FASTA序列格式 第一行以“>”開頭但并沒有指明是蛋白質還是核酸序列。后跟代碼,接著是注釋(在同一行),通常注釋要以“|”符號相隔,第一行沒有長度限制。值得注意的是FASTA文件允許以小寫字母表示氨基酸。文件擴展名為“.fasta”。 (NBIR/PIR序列格式 第一行以“>”開頭,后面緊跟兩字母編碼(P1代表蛋白質序列,N1代表核酸),再接一個分號,分號后緊跟序列標識號。后面是說明行,該行可長可短,沒有長度限制。接下來是序列本身,以“*”號終止。文件的擴展名為“.pir”或“.s
10、eq”。 GDE序列格式 與FASTA的格式基本相同,但行首為“%”,文件擴展名為“.gde”。)2. BLAST的五個子程序程序查詢序列數據庫種類簡述方法Blastp蛋白質蛋白質可以找到具有遠源進化關系的匹配序列待搜索蛋白序列與蛋白數據庫比較Blastn核苷酸核苷酸適合尋找分值較高的匹配,不適合遠源關系待搜索核酸序列與核酸數據庫比較Blastx核苷酸(已翻譯)蛋白質適合新DNA序列和EST序列的分析將待搜索核酸序列按6個讀框翻譯成蛋白質序列,然后與數據庫中的蛋白質比較TBlastn蛋白質核苷酸(已翻譯)適合尋找數據庫中尚未標注的編碼區將數據庫中核酸序列按6個讀框翻譯成蛋白序列,然后與待搜索蛋
11、白序列對比TBlastx核苷酸(已翻譯)核苷酸(已翻譯)適合分析EST序列無論是待搜索核酸序列還是數據庫中核酸序列,都按6個讀框翻譯成蛋白序列3. 生物類的數據庫類別: 一級數據庫:數據庫中的數據直接來源于實驗獲得的原始數據,只經過簡單的歸類整理和注釋;二級數據庫:對原始生物分子數據進行整理、分類的結果,是在一級數據庫、實驗數據和理論分析的基礎上針對特定的應用目標而建立的。4. PSI-Blast的原理:PSI-BLAST是一種將雙序列比對和多序列比對結合在一起的數據庫搜索方法。其主要思想是通過多次迭代找出最佳結果。每次迭代都發現一些中間序列,用于在接下去的迭代中尋找查詢序列的更多疏遠相關序列
12、(拓展了序列進化關系的覆蓋面積)。具體做法是最初對查詢序列進行BLAST搜索,接著把查找得到的每一擊中項作為BLAST搜索第二次迭代的查詢序列,重復這個過程直到找不到有意義的相似序列為止。(以下為研究生課件部分)PSI-BLAST的基本思路在于根據最初的搜索結果,依照預先定義的相似性閾值將序列分成不同的組,構建一個位點特異性的序列譜,并通過多次迭代不斷改進這一序列譜以提高搜索的靈敏度。 利用第一次搜索結果構建位置特異性分數矩陣,并用于第二次的搜索,第二次搜索結果用于第三次搜索,依此類推,直到找出最佳搜索結果。此外,BLAST不僅可用于檢測序列對數據庫的搜索,還可用于兩個序列之間的比對。 5.
13、多序列聯配的意義: 1)分析多個序列的一致序列;2)用于進化分析,是用系統發育方法構建進化樹的初始步驟;3)尋找個體間單核苷酸多態性;4)通過序列比對發現直親同源與旁系同源基因;5)尋找同源基因(相似的序列往往具有同源性);6)尋找蛋白家族識別多個序列的保守區域;7)相似的蛋白序列往往具有相似的結構與功能;8)輔助預測新序列的二級或三級結構;9)可以直觀地看到基因的哪些區域對突變敏感;10)PCR引物設計。6. 系統發育學的研究方法: 1)表現型分類法:將表型相像的物種歸類在一起,所有特征都要被考慮到; 2)遺傳分類法:具有共有起源的物種歸類在一起,也就是說,這些字符并沒有出現在離它們較遠的祖
14、先序列; 3)進化分類法:該方法綜合了表現型分類法和遺傳分類法的原理,進化方法被普遍認為是最好的系統發育分析方法,因為該方法承認并采用目前的進化理論;7. 系統發育樹的構建方法: 1)距離矩陣法:首先通過各個物種之間的比較,根據一定的假設(進化距離模型)推到得出分類群之間的進化距離,構建一個進化距離矩陣,其次基于這個矩陣中的進化距離關系構建進化樹; 2)最大簡約法:該法依據在任何位置將一條序列轉變成另一條序列所需要突變的最少數量對序列進行比較和聚類; 3)最大似然法:該模型可將一個給定替代發生在序列中任何位置的概率融合進算法,該方法計算序列中每個位置的一個給定序列變化的可能性,最可靠的樹為總的
15、可能性最大的那棵。8. 簡述人工神經網絡預測蛋白質二級結構的基本步驟。1)輸入數據(來自PDB)2)產生一個神經網絡(一個計算程序)3)用已知的蛋白質二級結構來訓練這個模型4)由訓練好的模型來給出未知蛋白的一個可能的結構5)最后從生物角度來檢驗預測的一系列氨基酸是否合理9. 預測蛋白質三級結構的三種方法 1)同源建模法:依據蛋白質與已知結構蛋白比對信息構建3D模型; 2)折疊識別法:尋找與未知蛋白最合適的模板,進行序列與結構比對,最終建立結構模型; 3)從頭預測法:根據序列本身從頭預測蛋白質結構。10. 分子途徑和網絡的特點:1)分子途徑和網絡的結構隨意性大。圖可以很簡單,也可以非常復雜。它們
16、可能包含了多個分支,盤繞的連接和回路。2)它們通常也顯示出節點間關系的方向,例如表示出代謝通路或信號傳導的方向。調控途徑和網絡的圖也應該說明相互作用是正的還是負的。正的相互作用(促進或者活化作用)常常用箭頭表示,而負的交互效應(抑制或者失活作用)常常用T型棒表示。11. 先導化合物的來源有四種來源: 1)通過偶然性觀察發現的先導化合物(這個方法最著名的例子就是亞歷山大.弗萊明發現的青霉素,今天所用的許多抗生素皆由其發展出來) 2)也可以通過替代療法的藥物開發中發現的藥物副作用來識別先導化合物(例如,鎮定劑氯化物丙嫀是在試驗中發現用在抗組胺劑時被發現的) 3)先導化合物也可以來自傳統醫藥學(如奎
17、寧化合物就來自金雞納的樹皮) 4)先導化合物也可以來自天然的底物或是配體(比如說,腎上腺素作為舒喘寧的類似物用來治療哮喘) 12. 簡述DNA計算機的基本原理:1)以編碼生命信息的遺傳物質DNA序列,作為信息編碼的載體,利用DNA分子的雙螺旋結構和堿基互補配對的性質,將所要處理的問題映射為特定的DNA分子;2)在生物酶的作用下,通過可控的生化反應生成問題的解空間;最后利用各種現代分子生物技術如聚合酶鏈反應RCR、超聲波降解、親和層析、分子純化、電泳、磁珠分離等手段破獲運算結果。DNA計算機優點:低能耗、存儲容量高、運算速度快,可真正實現并行工作。13. 簡述DNA計算實現方式中,表面方式與試管
18、方式相比具有哪些優點?試管方式:就是在一個或多個試管的溶液里進行生化反應;表面方式:是將對應的解空間的DNA分子固定在一塊固體上,其次進行各種生化反應,或是在表面逐步形成解空間,然后根據具體問題對所有可能的解進行篩選,最后得到運算結果。(1)操作簡單,易于實現自動化操作;(2)減少人為操作過程中造成的DNA分子的丟失及其它操作失誤;(3)減少分子在表面上的相互作用,同時增強分子間的特異性結合;(4)信息儲存密度大,據估計,10毫克DNA表面上的儲存密度是傳統計算姬的10的8次方倍,而在溶液中僅為10的5次方倍;(5)結果易于純化。14. 簡述PCR引物設計的基本原則及其注意要點原則:首先引物與
19、模板的序列要緊密互補,其次引物與引物之間避免形成穩定的二聚體或發夾結構,再次引物不能再模板的非等位點引發DNA聚合反應(即錯配)。注意要點:1、引物的長度一般為15-30bp,常用的是18-27bp,但不應大于38,因為過長會導致其延伸溫度大于74,不適合于TaqDNA聚合酶進行反應。2、引物序列在模板內應當沒有相似性較高,尤其是3端相似性較高的序列,否則容易導致錯配。引物3端出現3個以上的連續堿基,如GGG或CCC,也會使錯誤引發幾率增加。3、引物3端的末位堿基對Taq酶的DNA合成效率有較大的影響。不同的末位堿基在錯配位置導致不同的擴增效率,末位堿基為A的錯配效率明顯高于其他3個堿基,因此
20、應當避免在引物的3端使用堿基。另外,引物二聚體或發夾結構也可能導致PCR反應失敗。5端序列對PCR影響不太大,因此常用來引進修飾位點或標記物。4、引物序列的GC含量一般為40-60%,過高或過低都不利于引發反應。上下游引物的GC含量不能相差太大。5、引物所對應模板位置序列的Tm值在72左右可使復性條件最佳。Tm值的計算有很多種方法,如按公式Tm=4(G+C)+2(A+T),在Oligo軟件中使用的是最鄰近法(thenearestneighbormethod)。6、G值是指DNA雙鏈形成所需的自由能,該值反映了雙鏈結構內部堿基對的相對穩定性。應當選用3端G值較低(絕對值不超過9),而在5端和中間G值相對較高的引物。引物的3端的G值過高,容易在錯配位點形成雙鏈結構并引發DNA聚合反應。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛生縣城工作管理制度
- 勞務派遣績效管理制度
- 幼兒活動過程管理制度
- 應急工程搶修方案(3篇)
- 發展公司規矩管理制度
- 小學安全健康管理制度
- 典當公司日常管理制度
- 公司工程業務管理制度
- 執勤人員比武方案(3篇)
- 外出銷售日常管理制度
- 2020-2021學年浙江省寧波市鎮海區七年級(下)期末數學試卷(附答案詳解)
- GB/T 9162-2001關節軸承推力關節軸承
- GB/T 34560.2-2017結構鋼第2部分:一般用途結構鋼交貨技術條件
- 閱讀繪本《小種子》PPT
- 醫院清潔消毒與滅菌課件
- 2022年小學生詩詞大賽參考題庫200題(含答案)
- 水泥廠工藝流程圖
- 提高腸鏡患者腸道準備合格率課件
- 公司物品采購申請單
- 《卓有成效的管理者》Word電子版電子版本
- 喪假證明模板
評論
0/150
提交評論