




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、GenBank數(shù)據(jù)庫和PubMed數(shù)據(jù)庫中序列數(shù)據(jù)信息檢索比擬GenBank數(shù)據(jù)庫和PubMed數(shù)據(jù)庫中序列數(shù)據(jù)信息檢索比擬李軼(重慶醫(yī)科大學(xué)圖書館,重慶400016)摘要:通過對GenBank數(shù)據(jù)庫和PubMed數(shù)據(jù)庫的數(shù)據(jù)來源,檢索界面和檢索結(jié)果等的比照分析,發(fā)現(xiàn)2個檢索庫檢索的序列數(shù)據(jù)信息存在差異,GenBank數(shù)據(jù)庫檢索結(jié)果和檢準(zhǔn)率均高于PubMed數(shù)據(jù)庫.關(guān)鍵詞:GenBank;PubMed;Entrez;生物信息學(xué);醫(yī)學(xué)文獻檢索中圖分類號:G252.7;R一05文獻標(biāo)志碼:A文章編號:16713982(2021)03一O)4403II一s0岫ofsequentialdataretr
2、ievalresultsfromGenBankandPubMedLI(nbraryofUongclingMedicalUniversity,Chongqing400016,China)Abstract:Acomparativeanalysisofthedatasource,retrievalinterfaeeandresultsshowedthattherewasadif-racyrationwerehigherinGenbankthaninnlbMed.KeyWords:C,enbar;ed;Entrez;bioinfomatics;medicalliteratureretrievalGen
3、Bank數(shù)據(jù)庫是由美國國立生物技術(shù)信息中心(NCBI)維護的一級核酸序列數(shù)據(jù)庫,包含了目前所有的核苷酸序列和蛋白質(zhì)序列以及與它們相關(guān)NCBI維護的數(shù)據(jù)庫,提供對MEDLINE,PreMED.LINE等文獻數(shù)據(jù)庫的引用查詢和大量網(wǎng)絡(luò)科學(xué)類電子期刊的鏈接.GenBank數(shù)據(jù)庫和PubMed數(shù)據(jù)庫位于同一檢索平臺上,其檢索查詢系統(tǒng)都是Entrez,用戶在檢索序列數(shù)據(jù)信息時可以通過GenBank數(shù)據(jù)庫的檢索結(jié)果直接鏈接PubMed數(shù)據(jù)庫,也可以通過PubMed數(shù)據(jù)庫的種途徑檢索對上述2個數(shù)據(jù)庫的數(shù)據(jù)來源,檢索界面和檢索結(jié)果等進行比擬分析,旨在指導(dǎo)用戶正確查詢生物信息學(xué)文獻.1數(shù)據(jù)來源分析洲分子生物學(xué)實
4、驗室(EMBL)的數(shù)據(jù)庫以及日本的DNA數(shù)據(jù)庫(DI)BJ)共同構(gòu)成了國際核苷酸序列數(shù)據(jù)實驗室和測序機構(gòu)所提交的核苷酸序列信息,每天交收稿日期:20210l一16作者簡介:李軼(1976一),女,重慶市人,本科,館員,發(fā)表論文3篇.換各自數(shù)據(jù)庫新建立的序列記錄,并共享收集到的數(shù)國專利局提供的專利數(shù)據(jù).GenBank數(shù)據(jù)庫中,除專利數(shù)據(jù)外,其他2種數(shù)據(jù)工作者一旦測得了序列數(shù)據(jù)就可以提交給GenBank期刊在作者發(fā)表論文時都要求提供GenBank數(shù)據(jù)庫的序列接受號(GenBank數(shù)據(jù)庫,EMBL數(shù)據(jù)庫以及DDBJ數(shù)據(jù)庫的序列接受號和序列特征表都是相同的),因此GenBank數(shù)據(jù)庫的數(shù)據(jù)更新要早于P
5、ubMl數(shù)據(jù)庫.對于序列數(shù)據(jù)信息的檢索,GenBaIll【數(shù)據(jù)庫的檢全率均高于PubMl數(shù)據(jù)庫.2檢索界面分析2.1限制檢索界面(Limits)在PubMed數(shù)據(jù)庫的限制檢索界面,用戶可以對作者,期刊名稱,是否有全文,是否有免費全文,是否有文摘,原文出版時間,數(shù)據(jù)庫更新時間,研究對象為人類或動物,研究對象性別,原文語種,專題子庫(包括期刊類型和專題),文獻中字段限定檢索的字段索引,中文注釋及其對應(yīng)的檢索限定詞見表1.在GenBank數(shù)據(jù)庫的限制檢索界面,用戶可通過對一系列復(fù)選框的選擇排除某些類型的序列,如排除序列標(biāo)簽位點(STSs),第3者注釋序列(1PA),草圖及專利數(shù)據(jù)等.表1PubMed
6、數(shù)據(jù)庫字段限制檢索的宇段索引,表2GenBank數(shù)據(jù)庫字段限制檢索的字段索引,中文注釋及其對應(yīng)的檢索限定詞TPA數(shù)據(jù)庫的序列來源于GenBank數(shù)據(jù)庫的原始序列數(shù)據(jù),其序列的注釋信息是由非序列提交者即"第3者"通過實驗和/或自動計算方法推論得到,但其數(shù)據(jù)都有直接或間接的實驗室證據(jù)支持【5.同時,用戶還可以對字段,分子類型,基因位點,序列片段的顯示,數(shù)據(jù)來源,數(shù)據(jù)修訂日期等進行限定檢索6.其中字段限制檢索的字段索引,中文注釋及其對應(yīng)的檢索限定詞見表2.通過限制檢索界面的分析,發(fā)現(xiàn)在PubMed數(shù)據(jù)庫的限制檢索界面用戶只能對發(fā)表的文獻進行限定,而無法對序列數(shù)據(jù)本身進行限定,而在
7、GenBank數(shù)據(jù)庫的限制檢索界面用戶可以對序列數(shù)據(jù)本身進行限定.因此對于序列數(shù)據(jù)信息的檢索,GenBank數(shù)據(jù)庫的檢準(zhǔn)率應(yīng)高于PubMed數(shù)據(jù)庫.中文注釋及其對應(yīng)的檢索限定詞2.2預(yù)檢索/索引檢索界面(Preview/Index)在Gen.Bank數(shù)據(jù)庫和PubMed數(shù)據(jù)庫的預(yù)檢索或索引檢索界面的下方為索引檢索輸入框,其框內(nèi)前部都有一個"AllFields"下拉菜單.單擊該菜單后,發(fā)現(xiàn)其包含字段分別與相應(yīng)的2個數(shù)據(jù)庫的限制檢索界面的字段限制檢索的下拉菜單所包含的字段完全相同,即分別與表1和表2提供的檢索字段相同.如果用戶任意選擇一個字段后單擊索引檢索輸入框前方的索引檢索按
8、鈕"Index",在索引檢索輸入框字段有關(guān)的所有索引,用戶可以通過該索引對檢索內(nèi)容進行更精確的限制,進一步提高檢索的檢準(zhǔn)率.從表1和表2發(fā)現(xiàn),GenBank數(shù)據(jù)庫和PubMed數(shù)據(jù)庫提供的限制檢索字段是有區(qū)別的,這2個數(shù)據(jù)庫在預(yù)檢索或索引檢索界面提供的字段索引也不完全獻內(nèi)容有關(guān),如著者索引,期刊索引,語種索引,MeSH與序列數(shù)據(jù)本身有關(guān),如序列特性關(guān)鍵詞索引,基因關(guān)鍵詞索引及其中文注釋.miscfeaturemiscdifferenceconflictUnoldsequcevariationnxlifiedbasegenemisc-signalpron'terca,
9、atsitatasisn35sisn10sigcsirbspolyasignalerlImncerattenuatortenmnatorreporiginprimtranscriptprecursorilia5'dip3'dip5'utr3'utrcds生物學(xué)特性無法用特性表關(guān)鍵詞描述的序列序列特性無法用特性表關(guān)鍵詞描述的序列同一序列在不同的研究中在位點或區(qū)域上有差異序列不能確定的區(qū)域該序列對以前的版本做過修訂包含穩(wěn)定突變的序列修飾過的核苷酸已識別為基因或已命名的序列區(qū)域無法用信號特性關(guān)鍵詞描述的信號序列轉(zhuǎn)錄起始區(qū)真核啟動子上游的CAAT盒,與RNA結(jié)合相關(guān)真核
10、啟動子的TATA盒原核啟動子中的一35框原核啟動子的Pribow盒真核啟動子的GC盒核糖體結(jié)合位點RNA轉(zhuǎn)錄本的剪切識別位點增強子與轉(zhuǎn)錄終止有關(guān)的序列轉(zhuǎn)錄終止序列雙鏈DNA復(fù)制起始區(qū)無法用RNA關(guān)鍵詞描述的轉(zhuǎn)錄物或RNA產(chǎn)物初始轉(zhuǎn)錄本前體RNA信使RNA前體轉(zhuǎn)錄本中被剪切掉的5'端序列前體轉(zhuǎn)錄本中被剪切掉的3'端序列5'非翻譯區(qū)3'非翻譯區(qū)外顯子蛋白質(zhì)編碼序列sigpeptidetransitdematpeptideintronpolyasitemmtmaSCma8nlTla8norllairmamogtobulin-relaederegiondsegmentJ
11、HllnregionSregenVrglonvsegmentrepeatFeglonrepeatunitDrsatelliteMiscbindingprimerbindproteinbindStsMi8crecombIdnaMiscstructureStemloopdloop編碼信號肽的序列轉(zhuǎn)運蛋白編碼序列編碼成熟肽的序列內(nèi)含子RNA轉(zhuǎn)錄本的多聚腺苷酸化位點核糖體RNA轉(zhuǎn)運RNA小細胞質(zhì)RNA小核RNA加工和修飾rRNA的小核RNA免疫相關(guān)蛋白上的不變區(qū)免疫球蛋白重鏈的可變區(qū),T細胞受體口鏈免疫球蛋白重鏈,輕鏈以及T細胞a,口,7的結(jié)合鏈插入重排免疫球蛋白片段問的核苷酸免疫球蛋白重鏈的開關(guān)區(qū)編
12、碼免疫球蛋白的可變區(qū)N末端的序列編碼免疫球蛋白的可變區(qū)的序列基因組中所包含的重復(fù)序列單個1重復(fù)元件長末端重復(fù)序列衛(wèi)星重復(fù)序列無法描述的核酸序列結(jié)合位點復(fù)制,轉(zhuǎn)錄的引物結(jié)合位點蛋白質(zhì)結(jié)合區(qū)測序標(biāo)簽位點無法用重組特性關(guān)鍵詞描述的重組事件通過重組所消除的DNA無法用結(jié)構(gòu)關(guān)鍵詞描述的核酸序列高級結(jié)構(gòu)或構(gòu)型發(fā)夾結(jié)構(gòu)線粒體中DNA中的取代環(huán)從表3可以看出,用戶可通過對序列特性關(guān)鍵詞數(shù)據(jù)信息的檢索,GenBank數(shù)據(jù)庫的檢準(zhǔn)率應(yīng)高于PubMed數(shù)據(jù)庫.3結(jié)論通過對GenBank數(shù)據(jù)庫和PubMed數(shù)據(jù)庫的數(shù)據(jù)來源,檢索界面和檢索結(jié)果等的分析,發(fā)現(xiàn)對于序列數(shù)據(jù)信息的檢索,通過這2種途徑檢索得到的檢索結(jié)果存在一定的差異,GenBank數(shù)據(jù)庫檢索的檢全率和信息時,建議先從GenBank數(shù)據(jù)庫人手,再鏈接PubMed數(shù)據(jù)庫查看信息,而不是從PubMed數(shù)據(jù)庫人手,鏈接GenBank數(shù)據(jù)庫查看信息.參考文獻:1萬躍華,何立民.網(wǎng)上生物信息學(xué)數(shù)據(jù)庫資源J.情報學(xué)報,20O2,21(4):497512.2姜鑫.生物信息學(xué)數(shù)據(jù)庫及其利用方法J.現(xiàn)代情報,2005,25(6):185187.3 :/ DB/OL.(2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高中地理教學(xué)中實驗教學(xué)的創(chuàng)新設(shè)計與學(xué)生實踐能力培養(yǎng)研究
- 中國用電標(biāo)示牌行業(yè)市場前景預(yù)測及投資價值評估分析報告
- 中國聲敏傳感器市場供需現(xiàn)狀及投資戰(zhàn)略研究報告
- 2025-2030年中國鋼錠項目投資可行性研究分析報告
- 電氣件行業(yè)深度研究分析報告(2024-2030版)
- 農(nóng)用塑料制品生項目投資可行性研究分析報告(2024-2030版)
- 周大福培訓(xùn)課件
- 2025年中國制造執(zhí)行系統(tǒng)(MES)行業(yè)市場深度調(diào)查評估及投資方向研究報告
- 中國供應(yīng)鏈金融科技解決方案行業(yè)發(fā)展前景預(yù)測及投資規(guī)劃建議報告
- 軸承培訓(xùn)課件
- 高中數(shù)學(xué)復(fù)習(xí) 導(dǎo)數(shù)壓軸大題歸類 (原卷版)
- 環(huán)境友好型飛機內(nèi)飾-深度研究
- 《crrt低血壓的處理》課件
- GB/T 23694-2024風(fēng)險管理術(shù)語
- 2025年中國郵政集團山西省分公司招聘筆試參考題庫含答案解析
- 馬詩聽評課記錄范文
- 遼寧省撫順市撫順縣2024-2025學(xué)年七年級上學(xué)期期末地理試卷(含答案)
- 國家開放大學(xué)法律事務(wù)專科《民法學(xué)(2)》期末紙質(zhì)考試總題庫2025春期考試版
- 定額〔2025〕3號文-關(guān)于發(fā)布2023版西藏地區(qū)電網(wǎng)工程概預(yù)算定額價格水平調(diào)整的通知
- 《現(xiàn)場改善案例集》課件
- 醫(yī)院結(jié)核感染培訓(xùn)
評論
0/150
提交評論