




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、生物信息學(xué)教材趙國(guó)屏 生物信息學(xué) 科學(xué)出版社考核方法平時(shí)成績(jī)作業(yè)考試Introduction to Bioinformatics生物科學(xué)的發(fā)展階段描述生物學(xué)階段(19世紀(jì)中期以前)主要從形態(tài)特征觀察描述、記載各種類型生物,尋找他們之間的異同和進(jìn)化脈絡(luò)代表人物,達(dá)爾文1859年,物種起源實(shí)驗(yàn)生物學(xué)階段(19世紀(jì)中20世紀(jì)中)利用各種儀器工具,通過(guò)實(shí)驗(yàn)過(guò)程探索生命活動(dòng)的內(nèi)在規(guī)律代表人物, 孟德?tīng)?866年,植物雜交試驗(yàn) 分子生物學(xué)階段(20世紀(jì)中期以后)代表人物, 沃森和克里克DNA雙螺旋模型1962年,諾貝爾生理學(xué)獎(jiǎng)?wù)麄€(gè)生物界是一個(gè)多層次的有序結(jié)構(gòu): 細(xì)胞 組織 器官 系統(tǒng) 個(gè)體 生態(tài)系統(tǒng) 群落
2、 種群引自J Postlethwait & J Hopson著The Nature of Life,1989從基本粒子到生物圈Half day on the web,half month in the lab.saves you- Alan Bleasby2000年2月2日,北京大學(xué)燕北園300多位教師的家用計(jì)算機(jī)接入Internet;2001年2月12日,北京大學(xué)2000多個(gè)本科生宿舍的計(jì)算機(jī)接入Internet.2022/9/25一、概述二十一世紀(jì)是生命科學(xué)的時(shí)代,也是信息時(shí)代 近年來(lái),隨著現(xiàn)代分子生物學(xué)的發(fā)展,特別是人類基組計(jì)劃的實(shí)施,不斷產(chǎn)生出巨量的分子生物學(xué)數(shù)據(jù),這些數(shù)據(jù)有著數(shù)量巨大
3、、關(guān)系復(fù)雜,以至于不利用計(jì)算機(jī)根本無(wú)法實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)和分析。這樣,生物信息學(xué)最終形成一門獨(dú)立的學(xué)科并被推上了生物科學(xué)發(fā)展的最前沿。Bioinformatics: 科技界一顆耀眼的新星在BIOINFORMATICS 沒(méi)有誕生之前, 一個(gè)新藥的問(wèn)世需要十年時(shí)間,數(shù)億美元的R&D,而B(niǎo)IOINFORMATICS已將這個(gè)過(guò)程減少三分之二,R&D的費(fèi)用也相應(yīng)大大減少。許多中小BIOTECH 公司也看到了BIOINFORMATICS 的巨大作用和潛在的商機(jī),紛紛投資BIOINFORMATICS 研究項(xiàng)目。生物信息學(xué)一、什么是生物信息學(xué)?二、生物信息學(xué)門戶網(wǎng)站三、生物信息數(shù)據(jù)庫(kù)四、數(shù)據(jù)庫(kù)查詢和數(shù)據(jù)庫(kù)搜索五、
4、序列的同源比較六、生物信息學(xué)應(yīng)用生 物 信 息 學(xué) 概 論主要介紹的內(nèi)容:什么是生物信息學(xué)?生物信息學(xué)的研究?jī)?nèi)容和科學(xué)目標(biāo)。生物信息學(xué)的發(fā)展歷史國(guó)內(nèi)外生物信息學(xué)的研究歷史和現(xiàn)狀。一. 什么是生物信息學(xué)?Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation. 它是一個(gè)學(xué)科領(lǐng)域,包含著基因組信息的獲取、處理、
5、存儲(chǔ)、分配 、分析和解釋的所有方面。 (The U.S. Human Genome Project: The First Five Years FY 1991-1995, by NIH and DOE) 早在1956年,在美國(guó)田納西州蓋特林堡召開(kāi)的首次“生物學(xué)中的信息理論研討會(huì)”上,便產(chǎn)生了生物信息學(xué)的概念。1987年,林華安博士正式把這一學(xué)科命名為“生物信息學(xué)”(Bioinformatics)。被尊稱為“生物信息學(xué)之父”。生物信息學(xué)的誕生和發(fā)展生物信息學(xué)的誕生和發(fā)展隨著人類基因計(jì)劃過(guò)程中出現(xiàn)的爆炸性增長(zhǎng)的序列信息加速了生物信息學(xué)的發(fā)展,促進(jìn)了生物信息學(xué)這一門學(xué)科的發(fā)展。分子生物學(xué)和遺傳學(xué)的文
6、獻(xiàn)積累從60年代中期的接近10萬(wàn)篇迅速增長(zhǎng)至60年代末期的20多萬(wàn)篇,即在3-4年間,翻了一番。此后,至80年代中期,上升至約30萬(wàn)篇,即平均每年增長(zhǎng)6-7千篇。至90年代中期,文獻(xiàn)數(shù)已上升至40多萬(wàn)篇;即在10年中,平均每年增長(zhǎng)1萬(wàn)篇。到2000年,則增長(zhǎng)至約50萬(wàn)篇,即在約5年間,又增長(zhǎng)了10萬(wàn)篇(根據(jù)有關(guān)PubMed數(shù)據(jù)整理)。 美國(guó)的核酸數(shù)據(jù)庫(kù)GenBankBanson,D.A. et al. (1998) Nucleic Acids Res. 26, 1-7從1979年開(kāi)始建設(shè),1982年正式運(yùn)行;歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL數(shù)據(jù)庫(kù)也于1982年開(kāi)始服務(wù);日本于1984年開(kāi)始建立國(guó)
7、家級(jí)的核酸數(shù)據(jù)庫(kù)DDBJ,并于1987年正式服務(wù)。從那個(gè)時(shí)候以來(lái),DNA序列的數(shù)據(jù)已經(jīng)從80年代初期的百把條序列,幾十萬(wàn)堿基上升至現(xiàn)在的110億堿基!這就是說(shuō),在短短的約18年間,數(shù)據(jù)量增長(zhǎng)了近十萬(wàn)倍。 近年來(lái)GenBank中的DNA堿基數(shù)目呈指數(shù)增加,大約每14個(gè)月增加一倍。到1999年12月其數(shù)目已達(dá)30億,它們來(lái)自47000種生物。2000年4月DNA堿基數(shù)目是60億。2001年初這一數(shù)目已達(dá)110億。計(jì)算機(jī)運(yùn)算速度: 18個(gè)月增長(zhǎng)一倍;DNA序列數(shù)據(jù): 14個(gè)月增長(zhǎng)一倍;分析、篩選大量新數(shù)據(jù)理論生物學(xué)計(jì)算生物學(xué)傳統(tǒng)生物學(xué):實(shí)驗(yàn)科學(xué)現(xiàn)代生物學(xué)的發(fā)展:海量數(shù)據(jù) 難以完全依賴實(shí)驗(yàn)手段對(duì)新數(shù)據(jù)
8、進(jìn)行分析,必須借助計(jì)算機(jī)實(shí)現(xiàn)分析和篩選生物信息學(xué)是一門新興的、正在迅速發(fā)展的交叉學(xué)科,國(guó)內(nèi)外對(duì)生物信息學(xué)的定義眾說(shuō)紛紜。美國(guó)國(guó)家基因組研究中心Bioinformatics is an emerging scientific discipline representing the combined power of biology, mathematics, and computers.美國(guó)喬治亞理工大學(xué)Bioinformatics is an integration of mathematical, statistical and computer methods to analyze bio
9、logical, biochemical and biophysical data.生物信息學(xué)的概念美國(guó)密蘇里大學(xué)Bioinformatics is the science and technology about learning, managing and processing biological information.美國(guó)加利福尼亞大學(xué)洛杉磯分校Bioinformatics is the study of the inherent structure of biological information and biological systems. It brings togethe
10、r the avalanche of systematic biological data with the analytic theory and practical tools of mathematics and computer science. 生物信息學(xué)(bioinformatics)是生物學(xué)與計(jì)算機(jī)科學(xué)以及應(yīng)用數(shù)學(xué)等學(xué)科相互交叉而形成的一門新興學(xué)科。它通過(guò)對(duì)生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的獲取、加工、存儲(chǔ)、檢索與分析,進(jìn)而達(dá)到揭示數(shù)據(jù)所蘊(yùn)含的生物學(xué)意義的目的。生物信息學(xué)的概念生物信息學(xué)是多學(xué)科交叉產(chǎn)生的一門新興學(xué)科生物信息學(xué)的概念在推動(dòng)生物信息學(xué)發(fā)展的各種動(dòng)力中,人類基因組計(jì)劃(HGP)和生物醫(yī)
11、藥工業(yè)是其中的兩個(gè)主要力量。現(xiàn)代分子生物學(xué)的發(fā)展,特別是人基因組計(jì)劃的實(shí)施,使生物學(xué)家所面對(duì)的數(shù)據(jù)不再是實(shí)驗(yàn)記錄本上或文獻(xiàn)上的幾行簡(jiǎn)單數(shù)字,而是公共數(shù)據(jù)庫(kù)中數(shù)以千兆計(jì)的記錄。由于當(dāng)前生物信息學(xué)發(fā)展的主要推動(dòng)力來(lái)自分子生物學(xué),生物信息學(xué)的研究主要集中于核苷酸和氨基酸序列的存儲(chǔ)、分類、檢索和分析等方面,所以目前生物信息學(xué)可以狹義地定義為:將計(jì)算機(jī)科學(xué)和數(shù)學(xué)應(yīng)用于生物大分子信息的獲取、加工、存儲(chǔ)、分類、檢索與分析,以達(dá)到理解這些生物大分子信息的生物學(xué)意義的交叉學(xué)科。生物信息學(xué)的概念生物信息學(xué)(Bioinformatics)是一門新興的交叉學(xué)科。很多人會(huì)認(rèn)為:生物信息學(xué)既涉及生物又涉及計(jì)算機(jī)科學(xué),一定
12、是一個(gè)內(nèi)容十分廣泛的學(xué)科領(lǐng)域。其實(shí)它的內(nèi)涵十分具體,范圍非常明確。生物信息學(xué)的概念生物信息學(xué)是伴隨基因組研究而產(chǎn)生的,因此它的研究?jī)?nèi)容就緊隨著基因組研究而發(fā)展。廣義地說(shuō),生物信息學(xué)從事對(duì)基因組研究相關(guān)生物信息的獲取、加工、儲(chǔ)存、分配、分析和解釋,并綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)工具,以達(dá)到理解數(shù)據(jù)中的生物學(xué)含義的目標(biāo)。這一定義包括了兩層含義一是對(duì)海量數(shù)據(jù)的收集、整理與服務(wù),也就是管好這些數(shù)據(jù);另一個(gè)是從中發(fā)現(xiàn)新的規(guī)律,也就是用好這些數(shù)據(jù)。生物信息學(xué)的概念 具體地說(shuō),生物信息學(xué)是把基因組DNA序列信息分析作為源頭,找到基因組序列中代表蛋白質(zhì)和RNA基因的編碼區(qū);同時(shí),闡明基因組中大量存在的非編
13、碼區(qū)的信息實(shí)質(zhì),破譯隱藏在DNA序列中的遺傳語(yǔ)言規(guī)律;在此基礎(chǔ)上,歸納、整理與基因組遺傳信息釋放及其調(diào)控相關(guān)的轉(zhuǎn)錄譜和蛋白質(zhì)譜的數(shù)據(jù),從而認(rèn)識(shí)代謝、發(fā)育、分化、進(jìn)化的規(guī)律。 生物信息學(xué)的研究?jī)?nèi)容1、 獲取人和各種生物的完整基因組2 、發(fā)現(xiàn)新基因和新的單核苷酸多態(tài)性3 、基因組中非編碼區(qū)信息結(jié)構(gòu)分析4 、在基因組水平研究生物進(jìn)化5 、完整基因組的比較研究6 、從功能基因組到系統(tǒng)生物學(xué)7 、蛋白質(zhì)結(jié)構(gòu)模擬與藥物設(shè)計(jì)主要研究?jī)?nèi)容一獲取人和各種生物的完整基因組 基因組研究的首要目標(biāo)是獲得人的整套遺傳密碼。在自然、科學(xué)兩雜志上公布的人類基因組工作草圖報(bào)道,它含有約29億堿基,其序列覆蓋率為94。有大于9
14、0的連續(xù)序列群已大于10萬(wàn)堿基;有約25的連續(xù)序列群已等于或大于千萬(wàn)堿基。在這些序列中發(fā)現(xiàn)了34萬(wàn)個(gè)編碼蛋白質(zhì)的基因。得到這樣的圖就是相當(dāng)于把人類基因組測(cè)了大約5遍才實(shí)現(xiàn)的。要作到這一點(diǎn)就需要把幾千萬(wàn)個(gè)小片段通過(guò)比對(duì)再連接起來(lái),這就是常說(shuō)的基因組序列數(shù)據(jù)的拼接和組裝。 在基因組大規(guī)模測(cè)序的每一個(gè)環(huán)節(jié)都與信息分析緊密相關(guān)。序列拼接和填補(bǔ)序列間隙是最為關(guān)鍵的首要難題。其困難不僅來(lái)自它巨大的海量數(shù)據(jù),而且在于它含有高度重復(fù)的序列。為此,這一過(guò)程特別需要把實(shí)驗(yàn)設(shè)計(jì)和信息分析時(shí)刻聯(lián)系在一起。另一方面,必須按照不同步驟的要求,發(fā)展適當(dāng)?shù)乃惴跋鄳?yīng)的軟件,以應(yīng)對(duì)各種復(fù)雜的問(wèn)題。國(guó)際上很多著名的基因組研究中心
15、,都有自己的拼接和組裝策略,并且這樣的工作都是在超級(jí)計(jì)算機(jī)上完成的。 有了完整基因組,人類對(duì)自身的認(rèn)識(shí)就更為細(xì)致、更為精確。比如:發(fā)現(xiàn)在我們的基因組中真正編碼蛋白質(zhì)(稱為外顯子)的部分很少,只占11;外顯子與外顯子之間的區(qū)域(稱為內(nèi)含子)占了24;也就是說(shuō)在人類基因組中不編碼蛋白質(zhì)的區(qū)域占了絕大部分。發(fā)現(xiàn)人類編碼蛋白的基因較之其它生物體的基因更為復(fù)雜,有更為豐富的剪接方式。發(fā)現(xiàn)基因組中片段重復(fù)現(xiàn)象很普遍,這反映了人類復(fù)雜的進(jìn)化歷史。發(fā)現(xiàn)人的第13號(hào)染色體比較穩(wěn)定,而男性的第12號(hào)染色體和女性的第16號(hào)染色體是易變的,等等。二發(fā)現(xiàn)新基因和新的單核苷酸多態(tài)性發(fā)現(xiàn)新基因是當(dāng)前國(guó)際上基因組研究的熱點(diǎn),
16、使用生物信息學(xué)的方法是發(fā)現(xiàn)新基因的重要手段。發(fā)現(xiàn)單核苷酸多態(tài)性(SNP)現(xiàn)在普遍認(rèn)為SNP研究是人類基因組計(jì)劃走向應(yīng)用的重要步驟。SNP在基因組中分布相當(dāng)廣泛。大量存在的SNP位點(diǎn),使人們有機(jī)會(huì)發(fā)現(xiàn)與各種疾病,包括腫瘤相關(guān)的基因組突變;從實(shí)驗(yàn)操作來(lái)看,通過(guò)SNP發(fā)現(xiàn)疾病相關(guān)基因突變要比通過(guò)家系來(lái)得容易;有些SNP并不直接導(dǎo)致疾病基因的表達(dá),但由于它與某些疾病基因相鄰,而成為重要的標(biāo)記。三基因組中非編碼蛋白質(zhì)區(qū)域的結(jié)構(gòu)與功能研究 近年來(lái)的研究表明,在細(xì)菌這樣的微生物中,非編碼蛋白質(zhì)的區(qū)域只占整個(gè)基因組序列的10到20。隨著生物的進(jìn)化,非編碼區(qū)越來(lái)越多,在高等生物和人的基因組中非編碼序列已占到基因
17、組序列的絕大部分。這表明:這些非編碼序列必定具有重要的生物功能。普遍的認(rèn)識(shí)是,它們與基因的表達(dá)調(diào)控有關(guān)。 對(duì)人類基因組來(lái)說(shuō),迄今為止,人們真正掌握規(guī)律的只有DNA上的編碼蛋白質(zhì)的區(qū)域(基因)95-97非編碼區(qū)蘊(yùn)含的成果數(shù)量將是十分可觀的,因此尋找這些區(qū)域的編碼特征、信息調(diào)節(jié)與表達(dá)規(guī)律是未來(lái)相當(dāng)長(zhǎng)時(shí)間內(nèi)的熱點(diǎn)課題,是取得重要成果的源泉。 非蛋白編碼區(qū)約占人類基因組的95-97%,其生物學(xué)意義目前尚不是很清楚,但從演化觀點(diǎn)來(lái)看,其中必然蘊(yùn)含著重要的生物學(xué)功能。對(duì)非蛋白編碼區(qū)進(jìn)行生物學(xué)意義分析的策略有兩種,一種是基于已有的已經(jīng)為實(shí)驗(yàn)證實(shí)的所有功能已知的DNA元件的序列特征,預(yù)測(cè)非蛋白編碼區(qū)中可能含有
18、的功能已知的DNA元件,從而預(yù)測(cè)其可能的生物學(xué)功能,并通過(guò)實(shí)驗(yàn)進(jìn)行驗(yàn)證;另一種則是通過(guò)數(shù)理理論直接探索非蛋白編碼區(qū)的新的未知的序列特征,并從理論上預(yù)測(cè)其可能的信息含義,最后同樣通過(guò)實(shí)驗(yàn)驗(yàn)證。 四在基因組水平研究生物進(jìn)化自20世紀(jì)中葉以來(lái),隨著分子生物學(xué)的不斷發(fā)展,進(jìn)化論的研究也進(jìn)入了分子水平。相似性”和“同源性”是兩個(gè)不同的概念。相似性只反映兩者類似,并不包含任何與進(jìn)化相關(guān)的暗示。同源性則是與共同祖先相關(guān)的相似性。五完整基因組的比較研究在后基因組時(shí)代,完整基因組數(shù)據(jù)越來(lái)越多,有了這些資料人們就能對(duì)若干重大生物學(xué)問(wèn)題進(jìn)行分析研究,如: 生命是從哪里起源的?生命是如何進(jìn)化的?遺傳密碼是如何起源的?
19、估計(jì)最小獨(dú)立生活的生物體至少需要多少基因?這些基因是如何使生物體活起來(lái)的?等等。這些重大的問(wèn)題只有在基因組水平上才能回答。開(kāi)創(chuàng)了比較基因組學(xué)科學(xué)家們發(fā)現(xiàn):全部基因可以按照功能和系統(tǒng)發(fā)生分為若干類,其中包括與復(fù)制、轉(zhuǎn)錄、翻譯、能量產(chǎn)生、離子轉(zhuǎn)運(yùn)、各種代謝相關(guān)的基因。這一工作也為蛋白質(zhì)分類提供了新的途徑。六從功能基因組到系統(tǒng)生物學(xué) 同一組織在不同的個(gè)體生長(zhǎng)發(fā)育階段,表達(dá)基因的種類、數(shù)量也是不同的,有些基因是在幼年時(shí)期表達(dá)的,有些是中年階段表達(dá)的,有些要到老年時(shí)期才表達(dá)。我們不僅需要了解基因的序列,還要了解基因的功能,也就是要了解在不同的時(shí)間、不同的組織中基因的表達(dá)譜。這就是通常所說(shuō)的功能基因組研究
20、。 功能基因組研究將朝著復(fù)雜系統(tǒng)的方向發(fā)展,即:探討生物系統(tǒng)中各部分、各層次的相互作用,從而進(jìn)入系統(tǒng)生物學(xué)的領(lǐng)域。七蛋白質(zhì)結(jié)構(gòu)模擬與藥物設(shè)計(jì)預(yù)測(cè)蛋白的空間結(jié)構(gòu),進(jìn)而實(shí)現(xiàn)針對(duì)性的藥物設(shè)計(jì),這也是大規(guī)模的計(jì)算問(wèn)題。 近期任務(wù)大規(guī)模基因組測(cè)序中的信息分析新基因和新SNPS(單核苷酸多態(tài)性)的發(fā)現(xiàn)與鑒定完整基因組的比較研究大規(guī)模基因功能表達(dá)譜的分析生物大分子的結(jié)構(gòu)模擬與藥物設(shè)計(jì)遠(yuǎn)期任務(wù)讀懂人類基因組,發(fā)現(xiàn)人類遺傳語(yǔ)言的根本規(guī)律,從而闡明若干生 物學(xué)中的重大自然哲學(xué)問(wèn)題,像生命的起源與進(jìn)化等。這一研究的關(guān)鍵和核心是了解非編碼區(qū)非編碼區(qū)信息結(jié)構(gòu)分析遺傳密碼起源和生物進(jìn)化的研究近期任務(wù)由于未來(lái)幾年蛋白質(zhì)和核
21、酸的測(cè)序數(shù)據(jù)將以指數(shù)方式增加,近期生物信息學(xué)將在以下幾方面迅速發(fā)展大規(guī)模測(cè)序是基因組研究的最基本任務(wù),它的每一個(gè)環(huán)節(jié)都與信息分析緊密相關(guān)。1、大規(guī)模基因組測(cè)序中的信息分析憑借基因組序列可以通過(guò)理論方法尋找新基因和SNPs。當(dāng)人類基因找到之后,自然要解決的問(wèn)題是:不同人種間基因有什么差別;正常人和病人基因又有什么差別。”這就是通常所說(shuō)的SNPs(單核苷酸多態(tài)性)。構(gòu)建SNPs及其相關(guān)數(shù)據(jù)庫(kù)是基因組研究走向應(yīng)用的重要步驟。2、新基因和新SNPs(單核苷酸多態(tài)性)的發(fā)現(xiàn)與鑒定盡管已經(jīng)在分子演化方面取得了許多重要的成就,但僅僅依靠某些基因或者分子的演化現(xiàn)象,就想闡明物種整體的演化歷史似乎不太可靠。例如
22、,智人與黑猩猩之間有98%-99%的結(jié)構(gòu)基因和蛋白質(zhì)是相同的,然而表型上卻具有如此巨大的差異,這就不能不使我們聯(lián)想到形形色色千差萬(wàn)別的建筑樓群,它們的外觀如此不同,但基礎(chǔ)的部件組成卻是幾乎一樣的,差別就在于這些基礎(chǔ)部件的組織方式不同,這就提示我們基因組整體組織方式而不僅僅是個(gè)別基因在研究物種演化歷史中的重要作用。由于基因組是物種所有遺傳信息的儲(chǔ)藏庫(kù),從根本上決定著物種個(gè)體的發(fā)育和生理,因此,從基因組整體結(jié)構(gòu)組織和整體功能調(diào)節(jié)網(wǎng)絡(luò)方面,結(jié)合相應(yīng)的生理表征現(xiàn)象,進(jìn)行基因組整體的演化研究,將是揭示物種真實(shí)演化歷史的最佳途徑。 由完整基因組研究所導(dǎo)致的比較基因組學(xué)必將為基因組研究開(kāi)辟新的領(lǐng)域。3、完整
23、基因組的比較研究隨著人類基因組測(cè)序完成、一些學(xué)者就提出如下的問(wèn)題:即使我們已經(jīng)獲得了人的完整基因圖譜,那我們對(duì)人的生命活動(dòng)能說(shuō)明到什么程度呢?一系列由上述數(shù)據(jù)所不能說(shuō)明的問(wèn)題,例如:基因表達(dá)的產(chǎn)物是否出現(xiàn)與何時(shí)出現(xiàn);基因表達(dá)產(chǎn)物的濃度是多少;是否存在翻譯后的修飾過(guò)程等。概括這些問(wèn)題,其實(shí)質(zhì)應(yīng)該是:我們雖然知道了基因,知道了核酸序列,但我們不知道它們是如何發(fā)揮功能的,或者說(shuō)它們是如何按照特定的時(shí)間、空間進(jìn)行基因表達(dá)的,表達(dá)量有多少。 4、大規(guī)模基因功能表達(dá)譜的分析隨著人類基因組計(jì)劃的執(zhí)行,可找到人類的一級(jí)序列。然而要了解他們的功能、要找到這些蛋白質(zhì)功能的分子基礎(chǔ),必須進(jìn)一步知道它們的三維結(jié)構(gòu)。與
24、此同時(shí),要設(shè)計(jì)藥物也需要了解相應(yīng)的蛋白質(zhì)受體的三維結(jié)構(gòu)。這是擺在科學(xué)家面前的緊迫任務(wù)。 5、生物大分子的結(jié)構(gòu)模擬與藥物設(shè)計(jì)近幾年來(lái),隨著基因組序列數(shù)據(jù)的大量增加,對(duì)序列差異和進(jìn)化關(guān)系的爭(zhēng)論也越來(lái)越激烈。特別是:在分子進(jìn)化分析中,“相似性”和“同源性”是兩個(gè)不同的概念。相似性只反映兩者類似,并不包含任何與進(jìn)化相關(guān)的暗示。同源性則是與共同祖先相關(guān)的相似性。6、在基因組水平研究生物進(jìn)化在不同的組織中表達(dá)基因的數(shù)目差別是很大的,腦中基因表達(dá)的數(shù)目最多,有的組織中只有幾十或幾百個(gè)基因表達(dá)。同一組織在不同的個(gè)體生長(zhǎng)發(fā)育階段,表達(dá)基因的種類、數(shù)量也是不同的,有些基因是在幼年時(shí)期表達(dá)的,有些是中年階段表達(dá)的,
25、有些要到老年時(shí)期才表達(dá)。我們不僅需要了解基因的序列,還要了解基因的功能,也就是要了解在不同的時(shí)間、不同的組織中基因的表達(dá)譜。這就是通常所說(shuō)的功能基因組研究。 功能基因組研究將朝著復(fù)雜系統(tǒng)的方向發(fā)展,即:探討生物系統(tǒng)中各部分、各層次的相互作用,從而進(jìn)入系統(tǒng)生物學(xué)的領(lǐng)域。7、從功能基因組到系統(tǒng)生物學(xué)遠(yuǎn)期任務(wù)生物信息學(xué)的遠(yuǎn)期任務(wù)是讀懂人類基因組,發(fā)現(xiàn)人類遺傳語(yǔ)言的根本規(guī)律。從而闡明若干生物學(xué)中的重大自然哲學(xué)問(wèn)題,像生命的起源與進(jìn)化等。這一研究的關(guān)鍵和核心是了解非編碼區(qū)。 從生物進(jìn)化的觀點(diǎn)看來(lái),隨著生物體功能的完善和復(fù)雜化,非編碼區(qū)序列明顯增加的趨勢(shì)表明:這部分序列必定具有重要的生物功能。因此尋找這些
26、區(qū)域的編碼特征以及信息調(diào)節(jié)與表達(dá)規(guī)律是未來(lái)相當(dāng)長(zhǎng)時(shí)間內(nèi)的熱點(diǎn)課題。 對(duì)人類基因組來(lái)說(shuō),迄今為止,人們真正掌握規(guī)律的只有DNA上的編碼蛋白質(zhì)的區(qū)域(基因),這部分序列只占基因組的3到5,也就是說(shuō),人類基因組中多達(dá) 95到97是非編碼區(qū)。如何深人了解這些非編碼區(qū)序列的功能是當(dāng)前科學(xué)家們面臨的一個(gè)真正的挑戰(zhàn)。1、非編碼區(qū)信息結(jié)構(gòu)分析自 1859年Darwin的物種起源發(fā)表以來(lái),進(jìn)化論成為對(duì)人類自然科學(xué)和自然哲學(xué)發(fā)展的最重大貢獻(xiàn)之一。進(jìn)化論研究的核心是描述生物進(jìn)化的歷史和探索進(jìn)化過(guò)程的機(jī)制。自本世紀(jì)中葉以來(lái),隨著分子生物學(xué)的不斷發(fā)展,進(jìn)化論的研究也進(jìn)入了分子水平。當(dāng)前分子進(jìn)化的研究已是進(jìn)化論研究的重要
27、手段,并建立了一套依賴于核酸、蛋白質(zhì)序列信息的理論方法。2、遺傳密碼起源和生物進(jìn)化的研究近年來(lái),隨著序列數(shù)據(jù)的大量增加,對(duì)序列差異和進(jìn)化關(guān)系的爭(zhēng)論也越來(lái)越激烈。我們要徹底了解進(jìn)化的規(guī)律必須使用整個(gè)基因組的信息。相應(yīng)地必須發(fā)展新的理論方法。 總之,當(dāng)前是生物信息學(xué)研究的一個(gè)有活力的新時(shí)代。不少科學(xué)家還說(shuō)它是人類基因組研究的收獲時(shí)代,它不僅將賦予人們各種基礎(chǔ)研究的重要成果,也會(huì)帶來(lái)巨大的經(jīng)濟(jì)效益和社會(huì)效益。DNA序列數(shù)據(jù)正以意想不到的速度增長(zhǎng),這是一個(gè)難得的機(jī)會(huì),我國(guó)應(yīng)盡早利用這些數(shù)據(jù)就可能走在國(guó)際科學(xué)界的最前沿。 生物信息學(xué)的研究目標(biāo)以核酸、蛋白質(zhì)等生物大分子數(shù)據(jù)庫(kù)為主要對(duì)象,以數(shù)學(xué)、信息學(xué)、計(jì)
28、算機(jī)科學(xué)為主要手段,以計(jì)算機(jī)硬件、軟件和計(jì)算機(jī)網(wǎng)絡(luò)為主要工具,對(duì)浩如煙海的原始數(shù)據(jù)進(jìn)行存儲(chǔ)、管理、注釋、加工,使之成為具有明確生物意義的生物信息。并通過(guò)對(duì)生物信息的查詢、搜索、比較、分析,從中獲取基因編碼、基因調(diào)控、核酸和蛋白質(zhì)結(jié)構(gòu)功能及其相互關(guān)系等理性知識(shí)。生物信息學(xué)的發(fā)展歷史生物信息學(xué)基本思想的產(chǎn)生 生物信息學(xué) 的迅速發(fā)展二十世紀(jì)50年代二十世紀(jì)80-90年代生物科學(xué)和技術(shù)的發(fā)展人類基因組計(jì)劃的推動(dòng) 生物信息學(xué)的發(fā)展過(guò)程生物信息學(xué)的誕生及其重要性:早在1956年,在美國(guó)田納西州蓋特林堡召開(kāi)的首次“生物學(xué)中的信息理論研討會(huì)”上,便產(chǎn)生了生物信息學(xué)的概念。但是,就生物信息學(xué)的發(fā)展而言,它還是一
29、門相當(dāng)年輕的學(xué)科。直到20世紀(jì)8090年代,伴隨著計(jì)算機(jī)科學(xué)技術(shù)的進(jìn)步,生物信息學(xué)才獲得突破性進(jìn)展。1987年,林華安博士正式把這一學(xué)科命名為“生物信息學(xué)”(Bioinformatics)。此后,其內(nèi)涵隨著研究的深入和現(xiàn)實(shí)需要的變化而幾經(jīng)更迭。1995年,在美國(guó)人類基因組計(jì)劃第一個(gè)五年總結(jié)報(bào)告中,給出了一個(gè)較為完整的生物信息學(xué)定義:生物信息學(xué)是一門交叉科學(xué),它包含了生物信息的獲取、加工、存儲(chǔ)、分配、分析、解釋等在內(nèi)的所有方面,它綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來(lái)闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。生物信息學(xué)的發(fā)展過(guò)程世紀(jì)后期,生物科學(xué)技術(shù)迅猛發(fā)展,無(wú)論從數(shù)量上還是從質(zhì)量上都極大地
30、豐富了生物科學(xué)的數(shù)據(jù)資源。數(shù)據(jù)資源的急劇膨脹迫使人們尋求一種強(qiáng)有力的工具去組織這些數(shù)據(jù),以利于儲(chǔ)存、加工和進(jìn)一步利用。而海量的生物學(xué)數(shù)據(jù)中必然蘊(yùn)含著重要的生物學(xué)規(guī)律,這些規(guī)律將是解釋生命之謎的關(guān)鍵,人們同樣需要一種強(qiáng)有力的工具來(lái)協(xié)助人腦完成對(duì)這些數(shù)據(jù)的分析工作。另一方面,以數(shù)據(jù)分析、處理為本質(zhì)的計(jì)算機(jī)科學(xué)技術(shù)和網(wǎng)絡(luò)技術(shù)迅猛發(fā)展,并日益滲透到生物科學(xué)的各個(gè)領(lǐng)域。于是,一門嶄新的、擁有巨大發(fā)展?jié)摿Φ男聦W(xué)科生物信息學(xué)悄然興起。20世紀(jì)50年代,生物信息學(xué)開(kāi)始孕育20世紀(jì)60年代,生物分子信息在概念上將計(jì)算 生物學(xué)和計(jì)算機(jī)科學(xué)聯(lián)系起來(lái)20世紀(jì)70年代,生物信息學(xué)的真正開(kāi)端20世紀(jì)70年代到80年代初期
31、 ,出現(xiàn)了一系列著 名的序列比較方法和生物信息分析方法 20世紀(jì)80年代以后,出現(xiàn)一批生物信息服務(wù)機(jī) 構(gòu)和生物信息數(shù)據(jù)庫(kù)20世紀(jì)90年代后 ,HGP促進(jìn)生物信息學(xué)的迅速 發(fā)展生物信息學(xué)的發(fā)展歷程 生物信息學(xué)自誕生以來(lái),經(jīng)歷了三個(gè)階段:基因組前期的生物信息學(xué)基因組年代的生物信息學(xué)后基因組年代的生物信息學(xué)人類基因組計(jì)劃時(shí)代的生物信息學(xué)生物信息數(shù)據(jù)庫(kù)的建立及基因組信息學(xué)傳輸網(wǎng)絡(luò)的形成基因組序列信息的提取及分析后基因組時(shí)代的生物信息學(xué)后基因組時(shí)代,(post-genome era) 主要揭示基因組及其包含的全部基因的功能,以及對(duì)基因產(chǎn)物-蛋白質(zhì)結(jié)構(gòu)和功能的研究和語(yǔ)。 后基因組時(shí)代,生物學(xué)家們的研究重心
32、已經(jīng)從揭示生命的所有遺傳信息轉(zhuǎn)移到在整體水平上對(duì)生物功能的研究。標(biāo)志, 功能基因組學(xué)生物信息學(xué)的應(yīng)用與發(fā)展研究生物信息學(xué)的研究結(jié)果不僅具有重要的理論價(jià)值,也可直接應(yīng)用到工農(nóng)業(yè)生產(chǎn)和醫(yī)療實(shí)踐當(dāng)中去。因此,生物信息學(xué)相關(guān)的分析與應(yīng)用算法、軟件和數(shù)據(jù)庫(kù),都具有重要的經(jīng)濟(jì)價(jià)值,最終都會(huì)形成商品,提供經(jīng)濟(jì)和社會(huì)效益。 很多疾病與基因突變或基因多態(tài)有關(guān),有人估計(jì)與癌癥相關(guān)的原癌基因約有1000個(gè),抑癌基因約有100個(gè)。約有6000種以上的人類疾患與各種人類基因的變化相關(guān)聯(lián)。更多的疾病是環(huán)境(包括致病微生物)與人類基因(基因產(chǎn)物)相互作用的結(jié)果。隨著人類基因組計(jì)劃的深入,當(dāng)我們知道了人類全部基因在染色體上的
33、位置、它們的序列特征以及它們表達(dá)規(guī)律和產(chǎn)物(RNA和蛋白質(zhì))特征以后,人們就可以有效地判定各種疾患的分子機(jī)制,進(jìn)而發(fā)展合適的診斷和治療手段。1、 疾病相關(guān)的基因信息及相關(guān)算法和軟件開(kāi)發(fā)根據(jù)不同物種間的進(jìn)化距離和功能基因的同源性,可以比較容易地找到各種家畜、經(jīng)濟(jì)作物與其經(jīng)濟(jì)效益相關(guān)的基因,并進(jìn)一步認(rèn)識(shí)它們發(fā)育、生長(zhǎng)和抗逆的各種途徑和機(jī)制。2、 建立與動(dòng)、植物良種繁育相關(guān)的基因組數(shù)據(jù)庫(kù)人類基因組信息為藥物發(fā)展提供了新的候選分子和新的候選藥靶基因。同時(shí),分子生物學(xué)常用的表達(dá)載體、PCR和雜交引物以及各種試劑盒(包括DNA芯片)的設(shè)計(jì)必須依賴于核酸的序列信息。基因組信息學(xué)提供的大量信息為這類技術(shù)的發(fā)展
34、提供了廣闊的天地。 3、 研究與發(fā)展藥物設(shè)計(jì)軟件和基于生物信息的分子生物學(xué)技術(shù)美國(guó)一些最著名的大學(xué),如哈佛大學(xué)、普林斯頓大學(xué)、斯坦福大學(xué)、伯克利加州大學(xué)等都投資幾千萬(wàn)到一億多美元成立了生物學(xué)、物理學(xué)、數(shù)學(xué)等學(xué)科交叉的新中心,諾貝爾獎(jiǎng)獲得者朱棣文領(lǐng)導(dǎo)的斯坦福大學(xué)的中心還命名為BioX。1999年6月3日,美國(guó)NIH的一個(gè)顧問(wèn)小組建議在生物計(jì)算領(lǐng)域設(shè)立總額為數(shù)億美元的重大科研基金,并成立5到20個(gè)計(jì)算中心以處理海量的基因組相關(guān)信息。 生物信息學(xué)的發(fā)展,不僅導(dǎo)致生物學(xué)、物理學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)等多種科學(xué)文化的融合,也必將造就一批新的從事交叉學(xué)科研究的科學(xué)工作者。科學(xué)家們普遍相信本世紀(jì)是人類基因組研究
35、取得輝煌成果的時(shí)代,也是它創(chuàng)造巨大的經(jīng)濟(jì)效益和社會(huì)效益的時(shí)代。讓我們作為見(jiàn)證人欣賞生物信息學(xué)的蓬勃發(fā)展吧!發(fā)展現(xiàn)狀生物信息學(xué)的發(fā)展將會(huì)對(duì)生命科學(xué)帶來(lái)革命性的變革。它的成果不僅對(duì)相關(guān)基礎(chǔ)學(xué)科起巨大的推動(dòng)作用,而且還將對(duì)醫(yī)藥、衛(wèi)生、食品、農(nóng)業(yè)等產(chǎn)業(yè)產(chǎn)生巨大的影響,甚至引發(fā)新的產(chǎn)業(yè)革命。國(guó)外發(fā)展現(xiàn)狀各國(guó)政府和工業(yè)界對(duì)此極為重視,投入了大量資金。歐美各國(guó)及日本相繼成立了生物信息中心,如美國(guó)的國(guó)家生物技術(shù)信息中心(National Center for Biotechnology Informatics,NCBI)、歐洲生物信息學(xué)研究所 (European Bioinformatic Institute
36、,EBI)、日本信息生物學(xué)中心(Center for Information Biology,CIB)等。NCBI、EBI和CIB相互合作,共同維護(hù)著GenBank、EMBL、DDBJ三大基因序列數(shù)據(jù)庫(kù)。它們每天通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)互相交換數(shù)據(jù),使得三個(gè)數(shù)據(jù)庫(kù)能同時(shí)獲得最新數(shù)據(jù)。此外,他們每年召開(kāi)兩個(gè)年會(huì)討論合作事宜。國(guó)內(nèi)發(fā)展現(xiàn)狀國(guó)內(nèi)的一些科研單位清華大學(xué)在基因調(diào)控及基因功能分析、蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方面、天津大學(xué)物理系和中科院理論物理所在相關(guān)算法方面、中科院生物物理所在基因組大規(guī)模測(cè)序數(shù)據(jù)的組裝和標(biāo)識(shí)方面、北京大學(xué)化學(xué)學(xué)院物理化學(xué)研究所在蛋白質(zhì)分子設(shè)計(jì)方面、華大基因組研究中心(中科院遺傳所人類基因組研究中心)在大規(guī)模測(cè)序數(shù)據(jù)處理自動(dòng)化流程體系及數(shù)據(jù)庫(kù)系統(tǒng)建立方面均已展開(kāi)相關(guān)研究。北京大學(xué)已建立了EMBL中國(guó)鏡像數(shù)據(jù)庫(kù),將該數(shù)據(jù)庫(kù)移植到中國(guó)本地,并提供部分的檢索服務(wù)。復(fù)旦大學(xué)遺傳學(xué)研究所為克隆新基因而建立的一整套生物信息系統(tǒng)也已初具規(guī)模;中科院上海生化所、生物物理所等單位在結(jié)構(gòu)生物學(xué)和基因預(yù)測(cè)研究方面也有相當(dāng)?shù)幕A(chǔ)。我國(guó)主要研究單位中科院遺傳所人類基因
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 國(guó)際銷售代理協(xié)議書4篇
- 婚宴上女方家長(zhǎng)致辭15篇
- 內(nèi)蒙興安盟圖書館招聘試題帶答案分析2024年
- 河南洛陽(yáng)圖書館招聘試題帶答案分析2024年
- 《筆盒添功能》教案-2025-2026學(xué)年贛美版(2024)小學(xué)美術(shù)一年級(jí)上冊(cè)
- 2024年梅河口康美職業(yè)技術(shù)學(xué)院?jiǎn)握小段锢怼纺芰μ嵘鼴卷題庫(kù)含完整答案詳解
- 安全故事演講稿8篇
- 建筑公司工程資料電子簽章使用制度
- 建筑公司市政工程雨水口標(biāo)高復(fù)核制度
- 建筑公司電焊機(jī)接地保護(hù)裝置檢查制度
- 常用型鋼理論重量速查表
- 離婚登記申請(qǐng)受理回執(zhí)單
- 鍋爐標(biāo)書范本
- 第章 細(xì)菌藥敏試驗(yàn)及其耐藥表型檢測(cè)
- 員工筆記本電腦租用協(xié)議書律師版(4篇)
- 西藏日喀則市從優(yōu)秀鄉(xiāng)村振興等專干中招錄(聘)公務(wù)員(事業(yè)編制人員)筆試題庫(kù)含答案解析
- 手術(shù)風(fēng)險(xiǎn)評(píng)估制度表及流程優(yōu)質(zhì)資料
- 塑料模具課程設(shè)計(jì)-罩蓋模具設(shè)計(jì)畢業(yè)論文
- 酒店入住登記表
- 大學(xué)體育:輪滑教案
- 馬太效應(yīng)課件完整版
評(píng)論
0/150
提交評(píng)論