標(biāo)準(zhǔn)解讀

《GB/T 45782-2025 生物技術(shù) 生命科學(xué)中數(shù)據(jù)格式和描述的要求》是一項(xiàng)國家標(biāo)準(zhǔn),旨在規(guī)范生命科學(xué)研究領(lǐng)域內(nèi)數(shù)據(jù)的記錄、存儲及交換過程中的格式與描述方法。該標(biāo)準(zhǔn)適用于涉及生物信息學(xué)、遺傳學(xué)、分子生物學(xué)等多學(xué)科交叉的生命科學(xué)研究活動,對于促進(jìn)不同研究機(jī)構(gòu)之間或國際合作時(shí)的數(shù)據(jù)共享具有重要意義。

根據(jù)該文件內(nèi)容,主要涵蓋以下幾個(gè)方面:

  1. 術(shù)語定義:對生命科學(xué)領(lǐng)域內(nèi)常用的專業(yè)詞匯進(jìn)行了統(tǒng)一定義,確保了行業(yè)內(nèi)溝通的一致性。
  2. 數(shù)據(jù)類型:詳細(xì)列舉了生命科學(xué)研究過程中可能遇到的各種類型的數(shù)據(jù),包括但不限于基因序列、蛋白質(zhì)結(jié)構(gòu)、代謝路徑等,并為每種類型的數(shù)據(jù)提供了推薦的表示形式。
  3. 數(shù)據(jù)格式:針對不同類型的數(shù)據(jù),提出了相應(yīng)的標(biāo)準(zhǔn)化格式要求。例如,對于DNA序列數(shù)據(jù),建議采用FASTA格式;而對于復(fù)雜網(wǎng)絡(luò)分析,則推薦使用GraphML或其他適合圖形化展示的格式。
  4. 元數(shù)據(jù)描述:強(qiáng)調(diào)了在保存原始實(shí)驗(yàn)數(shù)據(jù)的同時(shí),也需要記錄相關(guān)的背景信息(即元數(shù)據(jù)),如實(shí)驗(yàn)條件、樣本來源等,以便于他人理解和復(fù)現(xiàn)研究結(jié)果。
  5. 隱私保護(hù):特別指出,在處理涉及個(gè)人健康信息的研究數(shù)據(jù)時(shí),必須遵守相關(guān)法律法規(guī),采取適當(dāng)措施保護(hù)受試者的隱私權(quán)益不受侵犯。
  6. 數(shù)據(jù)質(zhì)量控制:提出了保證數(shù)據(jù)準(zhǔn)確性和可靠性的具體措施,比如定期進(jìn)行數(shù)據(jù)校驗(yàn)、建立錯(cuò)誤報(bào)告機(jī)制等。
  7. 數(shù)據(jù)訪問與共享政策:鼓勵(lì)開放科學(xué)精神,提倡在遵守知識產(chǎn)權(quán)的前提下盡可能地公開研究成果及相關(guān)數(shù)據(jù),同時(shí)也要考慮到敏感信息的安全問題。


如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。

....

查看全部

  • 即將實(shí)施
  • 暫未開始實(shí)施
  • 2025-05-30 頒布
  • 2025-09-01 實(shí)施
?正版授權(quán)
GB/T 45782-2025生物技術(shù)生命科學(xué)中數(shù)據(jù)格式和描述的要求_第1頁
GB/T 45782-2025生物技術(shù)生命科學(xué)中數(shù)據(jù)格式和描述的要求_第2頁
GB/T 45782-2025生物技術(shù)生命科學(xué)中數(shù)據(jù)格式和描述的要求_第3頁
GB/T 45782-2025生物技術(shù)生命科學(xué)中數(shù)據(jù)格式和描述的要求_第4頁
GB/T 45782-2025生物技術(shù)生命科學(xué)中數(shù)據(jù)格式和描述的要求_第5頁
已閱讀5頁,還剩51頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

GB/T 45782-2025生物技術(shù)生命科學(xué)中數(shù)據(jù)格式和描述的要求-免費(fèi)下載試讀頁

文檔簡介

ICS07080

CCSA.40

中華人民共和國國家標(biāo)準(zhǔn)

GB/T45782—2025/ISO206912022

:

生物技術(shù)生命科學(xué)中數(shù)據(jù)格式和

描述的要求

Biotechnology—Requirementsfordataformattinganddescription

inthelifesciences

ISO206912022IDT

(:,)

2025-05-30發(fā)布2025-09-01實(shí)施

國家市場監(jiān)督管理總局發(fā)布

國家標(biāo)準(zhǔn)化管理委員會

GB/T45782—2025/ISO206912022

:

目次

前言

…………………………Ⅲ

引言

…………………………Ⅳ

范圍

1………………………1

規(guī)范性引用文件

2…………………………1

術(shù)語和定義

3………………1

生命科學(xué)中數(shù)據(jù)對實(shí)體和概念描述的建議和要求

4……………………7

通則

4.1…………………7

推薦的生物和概念實(shí)體通用標(biāo)識符方案

4.2…………7

生物實(shí)體和概念的數(shù)據(jù)格式化和語境描述性數(shù)據(jù)元數(shù)據(jù)

4.3()……8

數(shù)據(jù)格式的技術(shù)和組織的建議與要求

5…………………9

概述

5.1…………………9

組織責(zé)任

5.2……………10

文檔

5.3…………………10

版本控制和變更日志

5.4………………10

兼容性

5.5………………10

可擴(kuò)展性

5.6……………10

壓縮

5.7…………………10

結(jié)構(gòu)和控制元素

5.8……………………11

數(shù)據(jù)格式中數(shù)據(jù)類型的要求

5.9………………………11

一致性和兼容性

5.10…………………12

數(shù)據(jù)完整性

5.11………………………12

格式驗(yàn)證

5.12…………………………12

數(shù)據(jù)溯源

5.13…………………………12

語義推薦和數(shù)據(jù)格式要求

6………………12

通則

6.1…………………12

生物數(shù)據(jù)注釋的最小共識

6.2…………13

語法和實(shí)體化

6.3………………………16

適用于生物數(shù)據(jù)注釋的術(shù)語和本體論的要求

7…………16

通則

7.1…………………16

生物本體論的要求

7.2…………………16

領(lǐng)域特定數(shù)據(jù)標(biāo)準(zhǔn)的要求

8………………17

概述

8.1…………………17

領(lǐng)域特定數(shù)據(jù)標(biāo)準(zhǔn)的具體要求

8.2……………………17

GB/T45782—2025/ISO206912022

:

生物數(shù)據(jù)存儲庫的要求

9…………………18

通則

9.1…………………18

生物數(shù)據(jù)存儲庫的要求

9.2……………18

附錄資料性生命科學(xué)中數(shù)據(jù)常見格式示例

A()………20

概述

A.1………………20

組學(xué)生物化學(xué)和分子生物學(xué)方法的數(shù)據(jù)格式

A.2OMICS()、………20

生物成像數(shù)據(jù)的格式

A.3……………28

應(yīng)用于生物系統(tǒng)計(jì)算機(jī)模型的數(shù)據(jù)格式

A.4………29

應(yīng)用于生命科學(xué)模型模擬及其結(jié)果的數(shù)據(jù)格式

A.5………………30

用于數(shù)據(jù)和模型質(zhì)量測量的描述符

A.6……………30

附錄資料性數(shù)據(jù)模型和元數(shù)據(jù)的最低報(bào)告標(biāo)準(zhǔn)

B()、………………31

概述

B.1…………………31

最低報(bào)告標(biāo)準(zhǔn)

B.2………………………31

特定領(lǐng)域的本體論分類法和受控詞匯表

B.3、………33

參考文獻(xiàn)

……………………40

GB/T45782—2025/ISO206912022

:

前言

本文件按照標(biāo)準(zhǔn)化工作導(dǎo)則第部分標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則的規(guī)定

GB/T1.1—2020《1:》

起草

本文件等同采用生物技術(shù)生命科學(xué)中數(shù)據(jù)格式和描述的要求

ISO20691:2022《》。

請注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別專利的責(zé)任

。。

本文件由全國生化檢測標(biāo)準(zhǔn)化技術(shù)委員會提出并歸口

(SAC/TC387)。

本文件起草單位中國測試技術(shù)研究院深圳華大生命科學(xué)研究院中國科學(xué)院北京基因組研究所

:、、

國家生物信息中心深圳華大基因科技有限公司西安交通大學(xué)圣湘生物科技股份有限公司菁良科

()、、、、

技深圳有限公司中國科學(xué)院天津工業(yè)生物技術(shù)研究所瑞孚迪生物醫(yī)學(xué)上海有限公司華中農(nóng)業(yè)

()、、()、

大學(xué)

本文件主要起草人周李華麻凱龍趙文明易艷李生斌魏曉鋒吳康章張吳洽慶成誠

:、、、、、、、、、、

王偉文周斌林木飛楊麗王潔雨姜展樾吳昊閻加培李倩一

、、、、、、、、。

GB/T45782—2025/ISO206912022

:

引言

生命科學(xué)研究及其成果在生物技術(shù)診斷和制藥等領(lǐng)域的應(yīng)用依賴于從廣泛檢測生物學(xué)功能研

、,、、

究以及流程描述實(shí)驗(yàn)室和現(xiàn)場測量中獲得的復(fù)雜數(shù)據(jù)這包括將衍生數(shù)據(jù)用于生物生物技術(shù)和生理

、。、

過程的計(jì)算重建建模和模擬以及它們在生物技術(shù)工作流程中的應(yīng)用由數(shù)據(jù)驅(qū)動的生命科學(xué)和生

、、,。

物技術(shù)研究跨越了廣泛的生物科學(xué)和生物技術(shù)領(lǐng)域及應(yīng)用例如人類健康基因工程生物環(huán)境科學(xué)農(nóng)

(、、、

業(yè)生物修復(fù)測序色譜分析顯微鏡技術(shù)等只有通過使用計(jì)算方法對數(shù)據(jù)進(jìn)行一致的描述

、、DNA、、)。、

結(jié)構(gòu)化和集成生命科學(xué)中的數(shù)據(jù)驅(qū)動數(shù)據(jù)密集和大數(shù)據(jù)分析方法才有可能實(shí)現(xiàn)格式設(shè)計(jì)影響數(shù)據(jù)

,、。

的存儲表示意義解釋交換和再利用本文件通過為生命科學(xué)中數(shù)據(jù)的記錄處理再利用和交換設(shè)

、、、、。、、

定基本要求滿足建立一個(gè)可互操作和明確無誤的數(shù)據(jù)記錄描述和傳輸框架的關(guān)鍵需求從而提升利

,、,

用率和實(shí)現(xiàn)數(shù)據(jù)價(jià)值最大化

不同來源不同時(shí)間記錄的生命科學(xué)中數(shù)據(jù)必須是可查找可訪問可互操作和可重復(fù)使用

、、、(F-A-I-R)

的數(shù)據(jù)集只有在可訪問且以結(jié)構(gòu)良好格式一致的方式存儲時(shí)才具有價(jià)值和有用性不受時(shí)間和平

。、,。

臺限制的格式可確保數(shù)據(jù)版本控制數(shù)據(jù)歸檔以及數(shù)據(jù)溯源完整且可更新的元數(shù)據(jù)即描述數(shù)據(jù)的數(shù)

、。(

據(jù)有助于數(shù)據(jù)的定位使用和分析本文件提供了標(biāo)準(zhǔn)化可互操作生命科學(xué)中數(shù)據(jù)格式的要求和建

)、。

議為生物技術(shù)和生物領(lǐng)域社群定義的許多不同子領(lǐng)域特定的數(shù)據(jù)格式和描述標(biāo)準(zhǔn)提供了概念框架并

,,

給出了相關(guān)參考為了便于利用所引用的特定領(lǐng)域格式化和描述標(biāo)準(zhǔn)及其協(xié)同互作本文件描述了一

。,

個(gè)最低要求和規(guī)則的獨(dú)立技術(shù)框架因此本文件提供了相關(guān)子領(lǐng)域總體數(shù)據(jù)格式和通俗的描述規(guī)則

。,

與指南作為跨域數(shù)據(jù)集成的基礎(chǔ)此外還提供了創(chuàng)建特殊子領(lǐng)域的特定標(biāo)準(zhǔn)確保互操作性及實(shí)

,。,()、

現(xiàn)這些標(biāo)準(zhǔn)的規(guī)則和指南

GB/T45782—2025/ISO206912022

:

生物技術(shù)生命科學(xué)中數(shù)據(jù)格式和

描述的要求

1范圍

本文件規(guī)定了生命科學(xué)包括生物技術(shù)和生物醫(yī)學(xué)以及非人類生物研究和開發(fā)中數(shù)據(jù)和相應(yīng)元數(shù)

()

據(jù)即描述數(shù)據(jù)及其語境的數(shù)據(jù)的一致格式和文檔的要求它為生命科學(xué)中的數(shù)據(jù)呈現(xiàn)提供了可查

()。

找可訪問可互操作和可重復(fù)使用的指導(dǎo)

、、。

本文件適用于在生命科學(xué)領(lǐng)域?yàn)槠渌康亩到y(tǒng)地采集記錄或整合數(shù)據(jù)及相應(yīng)元數(shù)據(jù)的人工或

計(jì)算工作流程

本文件規(guī)定了人工獲得的原始實(shí)驗(yàn)或程序數(shù)據(jù)以及機(jī)器生成數(shù)據(jù)的格式要求本文件還規(guī)定了生

命科學(xué)領(lǐng)域中數(shù)據(jù)和相應(yīng)元數(shù)據(jù)的存儲共享訪問互操作性和重復(fù)使用等方面的要求

、、、。

本文件規(guī)定了從生命科學(xué)領(lǐng)域的自動化高通量工作流程中系統(tǒng)獲取大量數(shù)據(jù)的要求以及通過其

,

他生命科學(xué)技術(shù)和人工數(shù)據(jù)獲取的大小規(guī)模數(shù)據(jù)集的要求

本文件適用于生物技術(shù)和生命科學(xué)中的許多領(lǐng)域包括但不限于生命科學(xué)所有領(lǐng)域的基礎(chǔ)應(yīng)用

,:/

研究以及工業(yè)醫(yī)學(xué)農(nóng)業(yè)或環(huán)境生物技術(shù)不包括用于診斷或治療目的及其方法學(xué)驅(qū)動的領(lǐng)域如

,、、、(),

基因組學(xué)包括大規(guī)模并行測序宏基因組學(xué)表觀基因組學(xué)和功能基因組學(xué)轉(zhuǎn)錄組學(xué)翻譯組學(xué)蛋

(、、)、、、

白質(zhì)組學(xué)代謝組學(xué)脂質(zhì)組學(xué)糖組學(xué)酶學(xué)免疫化學(xué)合成生物學(xué)系統(tǒng)生物學(xué)系統(tǒng)醫(yī)學(xué)及相關(guān)

、、、、、、、、

領(lǐng)域

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款其中注日期的引用文

。,

件僅該日期對應(yīng)的版本適用于本文件不注日期的引用文件其最新版本包括所有的修改單適用于

,

溫馨提示

  • 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個(gè)人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
  • 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打印),因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
  • 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。

評論

0/150

提交評論