




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、生物信息學(xué)教材趙國屏 生物信息學(xué) 科學(xué)出版社考核方法平時(shí)成績(jī)作業(yè)考試Introduction to Bioinformatics生物科學(xué)的發(fā)展階段描述生物學(xué)階段(19世紀(jì)中期以前)主要從形態(tài)特征觀察描述、記載各種類型生物,尋找他們之間的異同和進(jìn)化脈絡(luò)代表人物,達(dá)爾文1859年,物種起源實(shí)驗(yàn)生物學(xué)階段(19世紀(jì)中20世紀(jì)中)利用各種儀器工具,通過實(shí)驗(yàn)過程探索生命活動(dòng)的內(nèi)在規(guī)律代表人物, 孟德爾1866年,植物雜交試驗(yàn) 分子生物學(xué)階段(20世紀(jì)中期以后)代表人物, 沃森和克里克DNA雙螺旋模型1962年,諾貝爾生理學(xué)獎(jiǎng)?wù)麄€(gè)生物界是一個(gè)多層次的有序結(jié)構(gòu): 細(xì)胞 組織 器官 系統(tǒng) 個(gè)體 生態(tài)系統(tǒng) 群落
2、 種群引自J Postlethwait & J Hopson著The Nature of Life,1989從基本粒子到生物圈Half day on the web,half month in the lab.saves you- Alan Bleasby2000年2月2日,北京大學(xué)燕北園300多位教師的家用計(jì)算機(jī)接入Internet;2001年2月12日,北京大學(xué)2000多個(gè)本科生宿舍的計(jì)算機(jī)接入Internet.2022/9/25一、概述二十一世紀(jì)是生命科學(xué)的時(shí)代,也是信息時(shí)代 近年來,隨著現(xiàn)代分子生物學(xué)的發(fā)展,特別是人類基組計(jì)劃的實(shí)施,不斷產(chǎn)生出巨量的分子生物學(xué)數(shù)據(jù),這些數(shù)據(jù)有著數(shù)量巨大
3、、關(guān)系復(fù)雜,以至于不利用計(jì)算機(jī)根本無法實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)和分析。這樣,生物信息學(xué)最終形成一門獨(dú)立的學(xué)科并被推上了生物科學(xué)發(fā)展的最前沿。Bioinformatics: 科技界一顆耀眼的新星在BIOINFORMATICS 沒有誕生之前, 一個(gè)新藥的問世需要十年時(shí)間,數(shù)億美元的R&D,而BIOINFORMATICS已將這個(gè)過程減少三分之二,R&D的費(fèi)用也相應(yīng)大大減少。許多中小BIOTECH 公司也看到了BIOINFORMATICS 的巨大作用和潛在的商機(jī),紛紛投資BIOINFORMATICS 研究項(xiàng)目。生物信息學(xué)一、什么是生物信息學(xué)?二、生物信息學(xué)門戶網(wǎng)站三、生物信息數(shù)據(jù)庫四、數(shù)據(jù)庫查詢和數(shù)據(jù)庫搜索五、
4、序列的同源比較六、生物信息學(xué)應(yīng)用生 物 信 息 學(xué) 概 論主要介紹的內(nèi)容:什么是生物信息學(xué)?生物信息學(xué)的研究?jī)?nèi)容和科學(xué)目標(biāo)。生物信息學(xué)的發(fā)展歷史國內(nèi)外生物信息學(xué)的研究歷史和現(xiàn)狀。一. 什么是生物信息學(xué)?Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation. 它是一個(gè)學(xué)科領(lǐng)域,包含著基因組信息的獲取、處理、
5、存儲(chǔ)、分配 、分析和解釋的所有方面。 (The U.S. Human Genome Project: The First Five Years FY 1991-1995, by NIH and DOE) 早在1956年,在美國田納西州蓋特林堡召開的首次“生物學(xué)中的信息理論研討會(huì)”上,便產(chǎn)生了生物信息學(xué)的概念。1987年,林華安博士正式把這一學(xué)科命名為“生物信息學(xué)”(Bioinformatics)。被尊稱為“生物信息學(xué)之父”。生物信息學(xué)的誕生和發(fā)展生物信息學(xué)的誕生和發(fā)展隨著人類基因計(jì)劃過程中出現(xiàn)的爆炸性增長(zhǎng)的序列信息加速了生物信息學(xué)的發(fā)展,促進(jìn)了生物信息學(xué)這一門學(xué)科的發(fā)展。分子生物學(xué)和遺傳學(xué)的文
6、獻(xiàn)積累從60年代中期的接近10萬篇迅速增長(zhǎng)至60年代末期的20多萬篇,即在3-4年間,翻了一番。此后,至80年代中期,上升至約30萬篇,即平均每年增長(zhǎng)6-7千篇。至90年代中期,文獻(xiàn)數(shù)已上升至40多萬篇;即在10年中,平均每年增長(zhǎng)1萬篇。到2000年,則增長(zhǎng)至約50萬篇,即在約5年間,又增長(zhǎng)了10萬篇(根據(jù)有關(guān)PubMed數(shù)據(jù)整理)。 美國的核酸數(shù)據(jù)庫GenBankBanson,D.A. et al. (1998) Nucleic Acids Res. 26, 1-7從1979年開始建設(shè),1982年正式運(yùn)行;歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL數(shù)據(jù)庫也于1982年開始服務(wù);日本于1984年開始建立國
7、家級(jí)的核酸數(shù)據(jù)庫DDBJ,并于1987年正式服務(wù)。從那個(gè)時(shí)候以來,DNA序列的數(shù)據(jù)已經(jīng)從80年代初期的百把條序列,幾十萬堿基上升至現(xiàn)在的110億堿基!這就是說,在短短的約18年間,數(shù)據(jù)量增長(zhǎng)了近十萬倍。 近年來GenBank中的DNA堿基數(shù)目呈指數(shù)增加,大約每14個(gè)月增加一倍。到1999年12月其數(shù)目已達(dá)30億,它們來自47000種生物。2000年4月DNA堿基數(shù)目是60億。2001年初這一數(shù)目已達(dá)110億。計(jì)算機(jī)運(yùn)算速度: 18個(gè)月增長(zhǎng)一倍;DNA序列數(shù)據(jù): 14個(gè)月增長(zhǎng)一倍;分析、篩選大量新數(shù)據(jù)理論生物學(xué)計(jì)算生物學(xué)傳統(tǒng)生物學(xué):實(shí)驗(yàn)科學(xué)現(xiàn)代生物學(xué)的發(fā)展:海量數(shù)據(jù) 難以完全依賴實(shí)驗(yàn)手段對(duì)新數(shù)據(jù)
8、進(jìn)行分析,必須借助計(jì)算機(jī)實(shí)現(xiàn)分析和篩選生物信息學(xué)是一門新興的、正在迅速發(fā)展的交叉學(xué)科,國內(nèi)外對(duì)生物信息學(xué)的定義眾說紛紜。美國國家基因組研究中心Bioinformatics is an emerging scientific discipline representing the combined power of biology, mathematics, and computers.美國喬治亞理工大學(xué)Bioinformatics is an integration of mathematical, statistical and computer methods to analyze bio
9、logical, biochemical and biophysical data.生物信息學(xué)的概念美國密蘇里大學(xué)Bioinformatics is the science and technology about learning, managing and processing biological information.美國加利福尼亞大學(xué)洛杉磯分校Bioinformatics is the study of the inherent structure of biological information and biological systems. It brings togethe
10、r the avalanche of systematic biological data with the analytic theory and practical tools of mathematics and computer science. 生物信息學(xué)(bioinformatics)是生物學(xué)與計(jì)算機(jī)科學(xué)以及應(yīng)用數(shù)學(xué)等學(xué)科相互交叉而形成的一門新興學(xué)科。它通過對(duì)生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的獲取、加工、存儲(chǔ)、檢索與分析,進(jìn)而達(dá)到揭示數(shù)據(jù)所蘊(yùn)含的生物學(xué)意義的目的。生物信息學(xué)的概念生物信息學(xué)是多學(xué)科交叉產(chǎn)生的一門新興學(xué)科生物信息學(xué)的概念在推動(dòng)生物信息學(xué)發(fā)展的各種動(dòng)力中,人類基因組計(jì)劃(HGP)和生物醫(yī)
11、藥工業(yè)是其中的兩個(gè)主要力量?,F(xiàn)代分子生物學(xué)的發(fā)展,特別是人基因組計(jì)劃的實(shí)施,使生物學(xué)家所面對(duì)的數(shù)據(jù)不再是實(shí)驗(yàn)記錄本上或文獻(xiàn)上的幾行簡(jiǎn)單數(shù)字,而是公共數(shù)據(jù)庫中數(shù)以千兆計(jì)的記錄。由于當(dāng)前生物信息學(xué)發(fā)展的主要推動(dòng)力來自分子生物學(xué),生物信息學(xué)的研究主要集中于核苷酸和氨基酸序列的存儲(chǔ)、分類、檢索和分析等方面,所以目前生物信息學(xué)可以狹義地定義為:將計(jì)算機(jī)科學(xué)和數(shù)學(xué)應(yīng)用于生物大分子信息的獲取、加工、存儲(chǔ)、分類、檢索與分析,以達(dá)到理解這些生物大分子信息的生物學(xué)意義的交叉學(xué)科。生物信息學(xué)的概念生物信息學(xué)(Bioinformatics)是一門新興的交叉學(xué)科。很多人會(huì)認(rèn)為:生物信息學(xué)既涉及生物又涉及計(jì)算機(jī)科學(xué),一定
12、是一個(gè)內(nèi)容十分廣泛的學(xué)科領(lǐng)域。其實(shí)它的內(nèi)涵十分具體,范圍非常明確。生物信息學(xué)的概念生物信息學(xué)是伴隨基因組研究而產(chǎn)生的,因此它的研究?jī)?nèi)容就緊隨著基因組研究而發(fā)展。廣義地說,生物信息學(xué)從事對(duì)基因組研究相關(guān)生物信息的獲取、加工、儲(chǔ)存、分配、分析和解釋,并綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)工具,以達(dá)到理解數(shù)據(jù)中的生物學(xué)含義的目標(biāo)。這一定義包括了兩層含義一是對(duì)海量數(shù)據(jù)的收集、整理與服務(wù),也就是管好這些數(shù)據(jù);另一個(gè)是從中發(fā)現(xiàn)新的規(guī)律,也就是用好這些數(shù)據(jù)。生物信息學(xué)的概念 具體地說,生物信息學(xué)是把基因組DNA序列信息分析作為源頭,找到基因組序列中代表蛋白質(zhì)和RNA基因的編碼區(qū);同時(shí),闡明基因組中大量存在的非編
13、碼區(qū)的信息實(shí)質(zhì),破譯隱藏在DNA序列中的遺傳語言規(guī)律;在此基礎(chǔ)上,歸納、整理與基因組遺傳信息釋放及其調(diào)控相關(guān)的轉(zhuǎn)錄譜和蛋白質(zhì)譜的數(shù)據(jù),從而認(rèn)識(shí)代謝、發(fā)育、分化、進(jìn)化的規(guī)律。 生物信息學(xué)的研究?jī)?nèi)容1、 獲取人和各種生物的完整基因組2 、發(fā)現(xiàn)新基因和新的單核苷酸多態(tài)性3 、基因組中非編碼區(qū)信息結(jié)構(gòu)分析4 、在基因組水平研究生物進(jìn)化5 、完整基因組的比較研究6 、從功能基因組到系統(tǒng)生物學(xué)7 、蛋白質(zhì)結(jié)構(gòu)模擬與藥物設(shè)計(jì)主要研究?jī)?nèi)容一獲取人和各種生物的完整基因組 基因組研究的首要目標(biāo)是獲得人的整套遺傳密碼。在自然、科學(xué)兩雜志上公布的人類基因組工作草圖報(bào)道,它含有約29億堿基,其序列覆蓋率為94。有大于9
14、0的連續(xù)序列群已大于10萬堿基;有約25的連續(xù)序列群已等于或大于千萬堿基。在這些序列中發(fā)現(xiàn)了34萬個(gè)編碼蛋白質(zhì)的基因。得到這樣的圖就是相當(dāng)于把人類基因組測(cè)了大約5遍才實(shí)現(xiàn)的。要作到這一點(diǎn)就需要把幾千萬個(gè)小片段通過比對(duì)再連接起來,這就是常說的基因組序列數(shù)據(jù)的拼接和組裝。 在基因組大規(guī)模測(cè)序的每一個(gè)環(huán)節(jié)都與信息分析緊密相關(guān)。序列拼接和填補(bǔ)序列間隙是最為關(guān)鍵的首要難題。其困難不僅來自它巨大的海量數(shù)據(jù),而且在于它含有高度重復(fù)的序列。為此,這一過程特別需要把實(shí)驗(yàn)設(shè)計(jì)和信息分析時(shí)刻聯(lián)系在一起。另一方面,必須按照不同步驟的要求,發(fā)展適當(dāng)?shù)乃惴跋鄳?yīng)的軟件,以應(yīng)對(duì)各種復(fù)雜的問題。國際上很多著名的基因組研究中心
15、,都有自己的拼接和組裝策略,并且這樣的工作都是在超級(jí)計(jì)算機(jī)上完成的。 有了完整基因組,人類對(duì)自身的認(rèn)識(shí)就更為細(xì)致、更為精確。比如:發(fā)現(xiàn)在我們的基因組中真正編碼蛋白質(zhì)(稱為外顯子)的部分很少,只占11;外顯子與外顯子之間的區(qū)域(稱為內(nèi)含子)占了24;也就是說在人類基因組中不編碼蛋白質(zhì)的區(qū)域占了絕大部分。發(fā)現(xiàn)人類編碼蛋白的基因較之其它生物體的基因更為復(fù)雜,有更為豐富的剪接方式。發(fā)現(xiàn)基因組中片段重復(fù)現(xiàn)象很普遍,這反映了人類復(fù)雜的進(jìn)化歷史。發(fā)現(xiàn)人的第13號(hào)染色體比較穩(wěn)定,而男性的第12號(hào)染色體和女性的第16號(hào)染色體是易變的,等等。二發(fā)現(xiàn)新基因和新的單核苷酸多態(tài)性發(fā)現(xiàn)新基因是當(dāng)前國際上基因組研究的熱點(diǎn),
16、使用生物信息學(xué)的方法是發(fā)現(xiàn)新基因的重要手段。發(fā)現(xiàn)單核苷酸多態(tài)性(SNP)現(xiàn)在普遍認(rèn)為SNP研究是人類基因組計(jì)劃走向應(yīng)用的重要步驟。SNP在基因組中分布相當(dāng)廣泛。大量存在的SNP位點(diǎn),使人們有機(jī)會(huì)發(fā)現(xiàn)與各種疾病,包括腫瘤相關(guān)的基因組突變;從實(shí)驗(yàn)操作來看,通過SNP發(fā)現(xiàn)疾病相關(guān)基因突變要比通過家系來得容易;有些SNP并不直接導(dǎo)致疾病基因的表達(dá),但由于它與某些疾病基因相鄰,而成為重要的標(biāo)記。三基因組中非編碼蛋白質(zhì)區(qū)域的結(jié)構(gòu)與功能研究 近年來的研究表明,在細(xì)菌這樣的微生物中,非編碼蛋白質(zhì)的區(qū)域只占整個(gè)基因組序列的10到20。隨著生物的進(jìn)化,非編碼區(qū)越來越多,在高等生物和人的基因組中非編碼序列已占到基因
17、組序列的絕大部分。這表明:這些非編碼序列必定具有重要的生物功能。普遍的認(rèn)識(shí)是,它們與基因的表達(dá)調(diào)控有關(guān)。 對(duì)人類基因組來說,迄今為止,人們真正掌握規(guī)律的只有DNA上的編碼蛋白質(zhì)的區(qū)域(基因)95-97非編碼區(qū)蘊(yùn)含的成果數(shù)量將是十分可觀的,因此尋找這些區(qū)域的編碼特征、信息調(diào)節(jié)與表達(dá)規(guī)律是未來相當(dāng)長(zhǎng)時(shí)間內(nèi)的熱點(diǎn)課題,是取得重要成果的源泉。 非蛋白編碼區(qū)約占人類基因組的95-97%,其生物學(xué)意義目前尚不是很清楚,但從演化觀點(diǎn)來看,其中必然蘊(yùn)含著重要的生物學(xué)功能。對(duì)非蛋白編碼區(qū)進(jìn)行生物學(xué)意義分析的策略有兩種,一種是基于已有的已經(jīng)為實(shí)驗(yàn)證實(shí)的所有功能已知的DNA元件的序列特征,預(yù)測(cè)非蛋白編碼區(qū)中可能含有
18、的功能已知的DNA元件,從而預(yù)測(cè)其可能的生物學(xué)功能,并通過實(shí)驗(yàn)進(jìn)行驗(yàn)證;另一種則是通過數(shù)理理論直接探索非蛋白編碼區(qū)的新的未知的序列特征,并從理論上預(yù)測(cè)其可能的信息含義,最后同樣通過實(shí)驗(yàn)驗(yàn)證。 四在基因組水平研究生物進(jìn)化自20世紀(jì)中葉以來,隨著分子生物學(xué)的不斷發(fā)展,進(jìn)化論的研究也進(jìn)入了分子水平。相似性”和“同源性”是兩個(gè)不同的概念。相似性只反映兩者類似,并不包含任何與進(jìn)化相關(guān)的暗示。同源性則是與共同祖先相關(guān)的相似性。五完整基因組的比較研究在后基因組時(shí)代,完整基因組數(shù)據(jù)越來越多,有了這些資料人們就能對(duì)若干重大生物學(xué)問題進(jìn)行分析研究,如: 生命是從哪里起源的?生命是如何進(jìn)化的?遺傳密碼是如何起源的?
19、估計(jì)最小獨(dú)立生活的生物體至少需要多少基因?這些基因是如何使生物體活起來的?等等。這些重大的問題只有在基因組水平上才能回答。開創(chuàng)了比較基因組學(xué)科學(xué)家們發(fā)現(xiàn):全部基因可以按照功能和系統(tǒng)發(fā)生分為若干類,其中包括與復(fù)制、轉(zhuǎn)錄、翻譯、能量產(chǎn)生、離子轉(zhuǎn)運(yùn)、各種代謝相關(guān)的基因。這一工作也為蛋白質(zhì)分類提供了新的途徑。六從功能基因組到系統(tǒng)生物學(xué) 同一組織在不同的個(gè)體生長(zhǎng)發(fā)育階段,表達(dá)基因的種類、數(shù)量也是不同的,有些基因是在幼年時(shí)期表達(dá)的,有些是中年階段表達(dá)的,有些要到老年時(shí)期才表達(dá)。我們不僅需要了解基因的序列,還要了解基因的功能,也就是要了解在不同的時(shí)間、不同的組織中基因的表達(dá)譜。這就是通常所說的功能基因組研究
20、。 功能基因組研究將朝著復(fù)雜系統(tǒng)的方向發(fā)展,即:探討生物系統(tǒng)中各部分、各層次的相互作用,從而進(jìn)入系統(tǒng)生物學(xué)的領(lǐng)域。七蛋白質(zhì)結(jié)構(gòu)模擬與藥物設(shè)計(jì)預(yù)測(cè)蛋白的空間結(jié)構(gòu),進(jìn)而實(shí)現(xiàn)針對(duì)性的藥物設(shè)計(jì),這也是大規(guī)模的計(jì)算問題。 近期任務(wù)大規(guī)?;蚪M測(cè)序中的信息分析新基因和新SNPS(單核苷酸多態(tài)性)的發(fā)現(xiàn)與鑒定完整基因組的比較研究大規(guī)?;蚬δ鼙磉_(dá)譜的分析生物大分子的結(jié)構(gòu)模擬與藥物設(shè)計(jì)遠(yuǎn)期任務(wù)讀懂人類基因組,發(fā)現(xiàn)人類遺傳語言的根本規(guī)律,從而闡明若干生 物學(xué)中的重大自然哲學(xué)問題,像生命的起源與進(jìn)化等。這一研究的關(guān)鍵和核心是了解非編碼區(qū)非編碼區(qū)信息結(jié)構(gòu)分析遺傳密碼起源和生物進(jìn)化的研究近期任務(wù)由于未來幾年蛋白質(zhì)和核
21、酸的測(cè)序數(shù)據(jù)將以指數(shù)方式增加,近期生物信息學(xué)將在以下幾方面迅速發(fā)展大規(guī)模測(cè)序是基因組研究的最基本任務(wù),它的每一個(gè)環(huán)節(jié)都與信息分析緊密相關(guān)。1、大規(guī)?;蚪M測(cè)序中的信息分析憑借基因組序列可以通過理論方法尋找新基因和SNPs。當(dāng)人類基因找到之后,自然要解決的問題是:不同人種間基因有什么差別;正常人和病人基因又有什么差別。”這就是通常所說的SNPs(單核苷酸多態(tài)性)。構(gòu)建SNPs及其相關(guān)數(shù)據(jù)庫是基因組研究走向應(yīng)用的重要步驟。2、新基因和新SNPs(單核苷酸多態(tài)性)的發(fā)現(xiàn)與鑒定盡管已經(jīng)在分子演化方面取得了許多重要的成就,但僅僅依靠某些基因或者分子的演化現(xiàn)象,就想闡明物種整體的演化歷史似乎不太可靠。例如
22、,智人與黑猩猩之間有98%-99%的結(jié)構(gòu)基因和蛋白質(zhì)是相同的,然而表型上卻具有如此巨大的差異,這就不能不使我們聯(lián)想到形形色色千差萬別的建筑樓群,它們的外觀如此不同,但基礎(chǔ)的部件組成卻是幾乎一樣的,差別就在于這些基礎(chǔ)部件的組織方式不同,這就提示我們基因組整體組織方式而不僅僅是個(gè)別基因在研究物種演化歷史中的重要作用。由于基因組是物種所有遺傳信息的儲(chǔ)藏庫,從根本上決定著物種個(gè)體的發(fā)育和生理,因此,從基因組整體結(jié)構(gòu)組織和整體功能調(diào)節(jié)網(wǎng)絡(luò)方面,結(jié)合相應(yīng)的生理表征現(xiàn)象,進(jìn)行基因組整體的演化研究,將是揭示物種真實(shí)演化歷史的最佳途徑。 由完整基因組研究所導(dǎo)致的比較基因組學(xué)必將為基因組研究開辟新的領(lǐng)域。3、完整
23、基因組的比較研究隨著人類基因組測(cè)序完成、一些學(xué)者就提出如下的問題:即使我們已經(jīng)獲得了人的完整基因圖譜,那我們對(duì)人的生命活動(dòng)能說明到什么程度呢?一系列由上述數(shù)據(jù)所不能說明的問題,例如:基因表達(dá)的產(chǎn)物是否出現(xiàn)與何時(shí)出現(xiàn);基因表達(dá)產(chǎn)物的濃度是多少;是否存在翻譯后的修飾過程等。概括這些問題,其實(shí)質(zhì)應(yīng)該是:我們雖然知道了基因,知道了核酸序列,但我們不知道它們是如何發(fā)揮功能的,或者說它們是如何按照特定的時(shí)間、空間進(jìn)行基因表達(dá)的,表達(dá)量有多少。 4、大規(guī)?;蚬δ鼙磉_(dá)譜的分析隨著人類基因組計(jì)劃的執(zhí)行,可找到人類的一級(jí)序列。然而要了解他們的功能、要找到這些蛋白質(zhì)功能的分子基礎(chǔ),必須進(jìn)一步知道它們的三維結(jié)構(gòu)。與
24、此同時(shí),要設(shè)計(jì)藥物也需要了解相應(yīng)的蛋白質(zhì)受體的三維結(jié)構(gòu)。這是擺在科學(xué)家面前的緊迫任務(wù)。 5、生物大分子的結(jié)構(gòu)模擬與藥物設(shè)計(jì)近幾年來,隨著基因組序列數(shù)據(jù)的大量增加,對(duì)序列差異和進(jìn)化關(guān)系的爭(zhēng)論也越來越激烈。特別是:在分子進(jìn)化分析中,“相似性”和“同源性”是兩個(gè)不同的概念。相似性只反映兩者類似,并不包含任何與進(jìn)化相關(guān)的暗示。同源性則是與共同祖先相關(guān)的相似性。6、在基因組水平研究生物進(jìn)化在不同的組織中表達(dá)基因的數(shù)目差別是很大的,腦中基因表達(dá)的數(shù)目最多,有的組織中只有幾十或幾百個(gè)基因表達(dá)。同一組織在不同的個(gè)體生長(zhǎng)發(fā)育階段,表達(dá)基因的種類、數(shù)量也是不同的,有些基因是在幼年時(shí)期表達(dá)的,有些是中年階段表達(dá)的,
25、有些要到老年時(shí)期才表達(dá)。我們不僅需要了解基因的序列,還要了解基因的功能,也就是要了解在不同的時(shí)間、不同的組織中基因的表達(dá)譜。這就是通常所說的功能基因組研究。 功能基因組研究將朝著復(fù)雜系統(tǒng)的方向發(fā)展,即:探討生物系統(tǒng)中各部分、各層次的相互作用,從而進(jìn)入系統(tǒng)生物學(xué)的領(lǐng)域。7、從功能基因組到系統(tǒng)生物學(xué)遠(yuǎn)期任務(wù)生物信息學(xué)的遠(yuǎn)期任務(wù)是讀懂人類基因組,發(fā)現(xiàn)人類遺傳語言的根本規(guī)律。從而闡明若干生物學(xué)中的重大自然哲學(xué)問題,像生命的起源與進(jìn)化等。這一研究的關(guān)鍵和核心是了解非編碼區(qū)。 從生物進(jìn)化的觀點(diǎn)看來,隨著生物體功能的完善和復(fù)雜化,非編碼區(qū)序列明顯增加的趨勢(shì)表明:這部分序列必定具有重要的生物功能。因此尋找這些
26、區(qū)域的編碼特征以及信息調(diào)節(jié)與表達(dá)規(guī)律是未來相當(dāng)長(zhǎng)時(shí)間內(nèi)的熱點(diǎn)課題。 對(duì)人類基因組來說,迄今為止,人們真正掌握規(guī)律的只有DNA上的編碼蛋白質(zhì)的區(qū)域(基因),這部分序列只占基因組的3到5,也就是說,人類基因組中多達(dá) 95到97是非編碼區(qū)。如何深人了解這些非編碼區(qū)序列的功能是當(dāng)前科學(xué)家們面臨的一個(gè)真正的挑戰(zhàn)。1、非編碼區(qū)信息結(jié)構(gòu)分析自 1859年Darwin的物種起源發(fā)表以來,進(jìn)化論成為對(duì)人類自然科學(xué)和自然哲學(xué)發(fā)展的最重大貢獻(xiàn)之一。進(jìn)化論研究的核心是描述生物進(jìn)化的歷史和探索進(jìn)化過程的機(jī)制。自本世紀(jì)中葉以來,隨著分子生物學(xué)的不斷發(fā)展,進(jìn)化論的研究也進(jìn)入了分子水平。當(dāng)前分子進(jìn)化的研究已是進(jìn)化論研究的重要
27、手段,并建立了一套依賴于核酸、蛋白質(zhì)序列信息的理論方法。2、遺傳密碼起源和生物進(jìn)化的研究近年來,隨著序列數(shù)據(jù)的大量增加,對(duì)序列差異和進(jìn)化關(guān)系的爭(zhēng)論也越來越激烈。我們要徹底了解進(jìn)化的規(guī)律必須使用整個(gè)基因組的信息。相應(yīng)地必須發(fā)展新的理論方法。 總之,當(dāng)前是生物信息學(xué)研究的一個(gè)有活力的新時(shí)代。不少科學(xué)家還說它是人類基因組研究的收獲時(shí)代,它不僅將賦予人們各種基礎(chǔ)研究的重要成果,也會(huì)帶來巨大的經(jīng)濟(jì)效益和社會(huì)效益。DNA序列數(shù)據(jù)正以意想不到的速度增長(zhǎng),這是一個(gè)難得的機(jī)會(huì),我國應(yīng)盡早利用這些數(shù)據(jù)就可能走在國際科學(xué)界的最前沿。 生物信息學(xué)的研究目標(biāo)以核酸、蛋白質(zhì)等生物大分子數(shù)據(jù)庫為主要對(duì)象,以數(shù)學(xué)、信息學(xué)、計(jì)
28、算機(jī)科學(xué)為主要手段,以計(jì)算機(jī)硬件、軟件和計(jì)算機(jī)網(wǎng)絡(luò)為主要工具,對(duì)浩如煙海的原始數(shù)據(jù)進(jìn)行存儲(chǔ)、管理、注釋、加工,使之成為具有明確生物意義的生物信息。并通過對(duì)生物信息的查詢、搜索、比較、分析,從中獲取基因編碼、基因調(diào)控、核酸和蛋白質(zhì)結(jié)構(gòu)功能及其相互關(guān)系等理性知識(shí)。生物信息學(xué)的發(fā)展歷史生物信息學(xué)基本思想的產(chǎn)生 生物信息學(xué) 的迅速發(fā)展二十世紀(jì)50年代二十世紀(jì)80-90年代生物科學(xué)和技術(shù)的發(fā)展人類基因組計(jì)劃的推動(dòng) 生物信息學(xué)的發(fā)展過程生物信息學(xué)的誕生及其重要性:早在1956年,在美國田納西州蓋特林堡召開的首次“生物學(xué)中的信息理論研討會(huì)”上,便產(chǎn)生了生物信息學(xué)的概念。但是,就生物信息學(xué)的發(fā)展而言,它還是一
29、門相當(dāng)年輕的學(xué)科。直到20世紀(jì)8090年代,伴隨著計(jì)算機(jī)科學(xué)技術(shù)的進(jìn)步,生物信息學(xué)才獲得突破性進(jìn)展。1987年,林華安博士正式把這一學(xué)科命名為“生物信息學(xué)”(Bioinformatics)。此后,其內(nèi)涵隨著研究的深入和現(xiàn)實(shí)需要的變化而幾經(jīng)更迭。1995年,在美國人類基因組計(jì)劃第一個(gè)五年總結(jié)報(bào)告中,給出了一個(gè)較為完整的生物信息學(xué)定義:生物信息學(xué)是一門交叉科學(xué),它包含了生物信息的獲取、加工、存儲(chǔ)、分配、分析、解釋等在內(nèi)的所有方面,它綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。生物信息學(xué)的發(fā)展過程世紀(jì)后期,生物科學(xué)技術(shù)迅猛發(fā)展,無論從數(shù)量上還是從質(zhì)量上都極大地
30、豐富了生物科學(xué)的數(shù)據(jù)資源。數(shù)據(jù)資源的急劇膨脹迫使人們尋求一種強(qiáng)有力的工具去組織這些數(shù)據(jù),以利于儲(chǔ)存、加工和進(jìn)一步利用。而海量的生物學(xué)數(shù)據(jù)中必然蘊(yùn)含著重要的生物學(xué)規(guī)律,這些規(guī)律將是解釋生命之謎的關(guān)鍵,人們同樣需要一種強(qiáng)有力的工具來協(xié)助人腦完成對(duì)這些數(shù)據(jù)的分析工作。另一方面,以數(shù)據(jù)分析、處理為本質(zhì)的計(jì)算機(jī)科學(xué)技術(shù)和網(wǎng)絡(luò)技術(shù)迅猛發(fā)展,并日益滲透到生物科學(xué)的各個(gè)領(lǐng)域。于是,一門嶄新的、擁有巨大發(fā)展?jié)摿Φ男聦W(xué)科生物信息學(xué)悄然興起。20世紀(jì)50年代,生物信息學(xué)開始孕育20世紀(jì)60年代,生物分子信息在概念上將計(jì)算 生物學(xué)和計(jì)算機(jī)科學(xué)聯(lián)系起來20世紀(jì)70年代,生物信息學(xué)的真正開端20世紀(jì)70年代到80年代初期
31、 ,出現(xiàn)了一系列著 名的序列比較方法和生物信息分析方法 20世紀(jì)80年代以后,出現(xiàn)一批生物信息服務(wù)機(jī) 構(gòu)和生物信息數(shù)據(jù)庫20世紀(jì)90年代后 ,HGP促進(jìn)生物信息學(xué)的迅速 發(fā)展生物信息學(xué)的發(fā)展歷程 生物信息學(xué)自誕生以來,經(jīng)歷了三個(gè)階段:基因組前期的生物信息學(xué)基因組年代的生物信息學(xué)后基因組年代的生物信息學(xué)人類基因組計(jì)劃時(shí)代的生物信息學(xué)生物信息數(shù)據(jù)庫的建立及基因組信息學(xué)傳輸網(wǎng)絡(luò)的形成基因組序列信息的提取及分析后基因組時(shí)代的生物信息學(xué)后基因組時(shí)代,(post-genome era) 主要揭示基因組及其包含的全部基因的功能,以及對(duì)基因產(chǎn)物-蛋白質(zhì)結(jié)構(gòu)和功能的研究和語。 后基因組時(shí)代,生物學(xué)家們的研究重心
32、已經(jīng)從揭示生命的所有遺傳信息轉(zhuǎn)移到在整體水平上對(duì)生物功能的研究。標(biāo)志, 功能基因組學(xué)生物信息學(xué)的應(yīng)用與發(fā)展研究生物信息學(xué)的研究結(jié)果不僅具有重要的理論價(jià)值,也可直接應(yīng)用到工農(nóng)業(yè)生產(chǎn)和醫(yī)療實(shí)踐當(dāng)中去。因此,生物信息學(xué)相關(guān)的分析與應(yīng)用算法、軟件和數(shù)據(jù)庫,都具有重要的經(jīng)濟(jì)價(jià)值,最終都會(huì)形成商品,提供經(jīng)濟(jì)和社會(huì)效益。 很多疾病與基因突變或基因多態(tài)有關(guān),有人估計(jì)與癌癥相關(guān)的原癌基因約有1000個(gè),抑癌基因約有100個(gè)。約有6000種以上的人類疾患與各種人類基因的變化相關(guān)聯(lián)。更多的疾病是環(huán)境(包括致病微生物)與人類基因(基因產(chǎn)物)相互作用的結(jié)果。隨著人類基因組計(jì)劃的深入,當(dāng)我們知道了人類全部基因在染色體上的
33、位置、它們的序列特征以及它們表達(dá)規(guī)律和產(chǎn)物(RNA和蛋白質(zhì))特征以后,人們就可以有效地判定各種疾患的分子機(jī)制,進(jìn)而發(fā)展合適的診斷和治療手段。1、 疾病相關(guān)的基因信息及相關(guān)算法和軟件開發(fā)根據(jù)不同物種間的進(jìn)化距離和功能基因的同源性,可以比較容易地找到各種家畜、經(jīng)濟(jì)作物與其經(jīng)濟(jì)效益相關(guān)的基因,并進(jìn)一步認(rèn)識(shí)它們發(fā)育、生長(zhǎng)和抗逆的各種途徑和機(jī)制。2、 建立與動(dòng)、植物良種繁育相關(guān)的基因組數(shù)據(jù)庫人類基因組信息為藥物發(fā)展提供了新的候選分子和新的候選藥靶基因。同時(shí),分子生物學(xué)常用的表達(dá)載體、PCR和雜交引物以及各種試劑盒(包括DNA芯片)的設(shè)計(jì)必須依賴于核酸的序列信息。基因組信息學(xué)提供的大量信息為這類技術(shù)的發(fā)展
34、提供了廣闊的天地。 3、 研究與發(fā)展藥物設(shè)計(jì)軟件和基于生物信息的分子生物學(xué)技術(shù)美國一些最著名的大學(xué),如哈佛大學(xué)、普林斯頓大學(xué)、斯坦福大學(xué)、伯克利加州大學(xué)等都投資幾千萬到一億多美元成立了生物學(xué)、物理學(xué)、數(shù)學(xué)等學(xué)科交叉的新中心,諾貝爾獎(jiǎng)獲得者朱棣文領(lǐng)導(dǎo)的斯坦福大學(xué)的中心還命名為BioX。1999年6月3日,美國NIH的一個(gè)顧問小組建議在生物計(jì)算領(lǐng)域設(shè)立總額為數(shù)億美元的重大科研基金,并成立5到20個(gè)計(jì)算中心以處理海量的基因組相關(guān)信息。 生物信息學(xué)的發(fā)展,不僅導(dǎo)致生物學(xué)、物理學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)等多種科學(xué)文化的融合,也必將造就一批新的從事交叉學(xué)科研究的科學(xué)工作者??茖W(xué)家們普遍相信本世紀(jì)是人類基因組研究
35、取得輝煌成果的時(shí)代,也是它創(chuàng)造巨大的經(jīng)濟(jì)效益和社會(huì)效益的時(shí)代。讓我們作為見證人欣賞生物信息學(xué)的蓬勃發(fā)展吧!發(fā)展現(xiàn)狀生物信息學(xué)的發(fā)展將會(huì)對(duì)生命科學(xué)帶來革命性的變革。它的成果不僅對(duì)相關(guān)基礎(chǔ)學(xué)科起巨大的推動(dòng)作用,而且還將對(duì)醫(yī)藥、衛(wèi)生、食品、農(nóng)業(yè)等產(chǎn)業(yè)產(chǎn)生巨大的影響,甚至引發(fā)新的產(chǎn)業(yè)革命。國外發(fā)展現(xiàn)狀各國政府和工業(yè)界對(duì)此極為重視,投入了大量資金。歐美各國及日本相繼成立了生物信息中心,如美國的國家生物技術(shù)信息中心(National Center for Biotechnology Informatics,NCBI)、歐洲生物信息學(xué)研究所 (European Bioinformatic Institute
36、,EBI)、日本信息生物學(xué)中心(Center for Information Biology,CIB)等。NCBI、EBI和CIB相互合作,共同維護(hù)著GenBank、EMBL、DDBJ三大基因序列數(shù)據(jù)庫。它們每天通過計(jì)算機(jī)網(wǎng)絡(luò)互相交換數(shù)據(jù),使得三個(gè)數(shù)據(jù)庫能同時(shí)獲得最新數(shù)據(jù)。此外,他們每年召開兩個(gè)年會(huì)討論合作事宜。國內(nèi)發(fā)展現(xiàn)狀國內(nèi)的一些科研單位清華大學(xué)在基因調(diào)控及基因功能分析、蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方面、天津大學(xué)物理系和中科院理論物理所在相關(guān)算法方面、中科院生物物理所在基因組大規(guī)模測(cè)序數(shù)據(jù)的組裝和標(biāo)識(shí)方面、北京大學(xué)化學(xué)學(xué)院物理化學(xué)研究所在蛋白質(zhì)分子設(shè)計(jì)方面、華大基因組研究中心(中科院遺傳所人類基因組研究中心)在大規(guī)模測(cè)序數(shù)據(jù)處理自動(dòng)化流程體系及數(shù)據(jù)庫系統(tǒng)建立方面均已展開相關(guān)研究。北京大學(xué)已建立了EMBL中國鏡像數(shù)據(jù)庫,將該數(shù)據(jù)庫移植到中國本地,并提供部分的檢索服務(wù)。復(fù)旦大學(xué)遺傳學(xué)研究所為克隆新基因而建立的一整套生物信息系統(tǒng)也已初具規(guī)模;中科院上海生化所、生物物理所等單位在結(jié)構(gòu)生物學(xué)和基因預(yù)測(cè)研究方面也有相當(dāng)?shù)幕A(chǔ)。我國主要研究單位中科院遺傳所人類基因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 部編版二下語文聽力提升計(jì)劃他
- 2025美容院年度客戶關(guān)懷計(jì)劃
- 九年級(jí)數(shù)學(xué)教師教學(xué)研討計(jì)劃
- 礦山復(fù)綠工程安全文明施工措施費(fèi)提取和使用計(jì)劃
- 教師在線教學(xué)工具操作能力提升計(jì)劃
- 八年級(jí)語文拓展閱讀教學(xué)計(jì)劃
- 學(xué)生環(huán)保志愿者社團(tuán)計(jì)劃
- 2023-2029年中國糖精行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及投資方向研究報(bào)告
- 2025年中國向心球軸承行業(yè)發(fā)展?jié)摿︻A(yù)測(cè)及投資策略研究報(bào)告
- 2020-2025年中國烤肉器行業(yè)市場(chǎng)調(diào)查研究及未來發(fā)展趨勢(shì)報(bào)告
- 常用型鋼理論重量速查表
- 離婚登記申請(qǐng)受理回執(zhí)單
- 鍋爐標(biāo)書范本
- 第章 細(xì)菌藥敏試驗(yàn)及其耐藥表型檢測(cè)
- 員工筆記本電腦租用協(xié)議書律師版(4篇)
- 西藏日喀則市從優(yōu)秀鄉(xiāng)村振興等專干中招錄(聘)公務(wù)員(事業(yè)編制人員)筆試題庫含答案解析
- 手術(shù)風(fēng)險(xiǎn)評(píng)估制度表及流程優(yōu)質(zhì)資料
- 塑料模具課程設(shè)計(jì)-罩蓋模具設(shè)計(jì)畢業(yè)論文
- 酒店入住登記表
- 大學(xué)體育:輪滑教案
- 馬太效應(yīng)課件完整版
評(píng)論
0/150
提交評(píng)論