GB-T 42813-2023 數據論文出版元數據_第1頁
GB-T 42813-2023 數據論文出版元數據_第2頁
GB-T 42813-2023 數據論文出版元數據_第3頁
GB-T 42813-2023 數據論文出版元數據_第4頁
GB-T 42813-2023 數據論文出版元數據_第5頁
已閱讀5頁,還剩18頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據論文出版元數據2023-08-06發布2023-08-06實施國家市場監督管理總局國家標準化管理委員會I 12規范性引用文件 l3術語和定義 14元數據的描述方法 24.1概述 24.2定義 24.3英文名稱 24.4數據類型 24.5值域 24.6短名 24.7注解 35數據論文出版元數據組成 36數據集元數據 46.1數據集基本信息 46.1.1標識符 46.1.2標題 4 46.1.4關鍵詞 4 46.1.6語種 56.1.7文件內容 56.1.8基金項目 56.1.9數據量 66.1.10數據格式 66.1.11數據集作者 66.2數據集出版信息 76.2.1發布日期 76.2.2出版期刊 76.2.3版本信息 86.3數據集服務信息 86.3.1數據集引用格式 86.3.2數據集共享許可協議 86.3.3數據集使用聲明 86.3.4數據集下載地址 86.3.5數據論文訪問地址 7數據論文元數據 7.1數據論文內容信息 7.1.1標識符 7.1.2標題 7.1.3摘要 7.1.4關鍵詞 7.1.5數據集基本信息 7.1.6引言 7.1.7數據采集和處理方法 7.1.8數據樣本描述 7.1.9數據質量控制和評估 7.1.10數據使用方法和建議 7.1.11參考文獻 7.1.12致謝 7.1.13數據論文作者 7.2數據論文出版信息 7.2.1收稿日期 7.2.2同評日期 7.2.3錄用日期 7.2.4出版日期 7.2.5版本信息 7.2.6出版期刊 7.3數據論文服務信息 7.3.1數據論文引用格式 7.3.2數據論文下載地址 7.3.3數據論文共享許可協議 7.3.4數據集訪問地址 8元數據擴展的類型與規則 附錄A(資料性)數據論文出版元數據示例 參考文獻 本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結構和起草規則》的規定起草。請注意本文件的某些內容可能涉及專利。本文件的發布機構不承擔識別專利的責任。本文件由中華人民共和國科學技術部提出。本文件由全國科技平臺標準化技術委員會(SAC/TC486)歸口。本文件起草單位:中國科學院計算機網絡信息中心、國家科技基礎條件平臺中心、廣州物聯網研究院、中國標準化研究院、中國科學院地理科學與資源研究所、中國科學院微生物研究所、中國極地研究中心、國家海洋信息中心、北京師范大學、中國農業科學院農業信息研究所、中國林業科學研究院資源信息研究所、中國科學院空間應用工程與技術中心、中國科學院空天信息創新研究院、中國科學院昆明植物研究所、中國地質調查局發展研究中心、中國科學院昆明動物所、中國醫學科學院、中國科學院青藏高原研究所、中國科學院高能物理研究所、中國科學院植物研究所。本文件主要起草人:高瑜蔚、胡良霖、王瑞丹、石蕾、朱艷華、王志強、赫運濤、吳立宗、姜曉軼、Ⅲ數據論文出版元數據本文件規定了數據論文出版元數據的內容與結構,包括數據集元數據、數據論文元數據及其描述方本文件適用于數據論文及其關聯數據集的描述、保存、在線出版和共享服務等。2規范性引用文件下列文件中的內容通過文中的規范性引用而構成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于GB/T7408數據元和交換格式信息交換日期和時間表示法GB/T7714信息與文獻參考文獻著錄規則GB/T30522科技平臺元數據標準化基本原則與方法GB/T30523科技資源核心元數據GB/T32843科技資源標識GB/T35294信息技術科學數據引用3術語和定義下列術語和定義適用于本文件。具有一定主題,可以標識并能夠被計算機處理的數據集合。對數據集進行規范化描述并按照學術規范在線聯合出版的文章。注:文章和數據集分屬不同出版單元時,通過標識符呈現二者的唯一關聯關系。數據論文出版datapaperpublication在線公開出版數據論文及其關聯數據集的過程。定義和描述其他數據的數據。元數據元素metadataelement元數據的基本單元。注:元數據元素在元數據實體中是唯一的。元數據實體metadataentity一組說明數據相同特性的元數據元素。注:可以包含一個或一個以上元數據實體。數據期刊datajournal依法設立、公開出版數據論文及其關聯數據集的刊物。注:如出版傳統學術論文的期刊同時出版數據論文及關聯數據集,也認為是數據期刊。4元數據的描述方法本文件按照GB/T30522規定的摘要表示方式定義和描述數據論文出版元數據,包括:定義、英文名稱、數據類型、值域、短名、注解等。4.2定義給出元數據元素和元數據實體的解釋和說明。4.3英文名稱元數據元素或元數據實體的英文名稱,一般用英文全稱,其中每一個單詞首字母為大寫,其余字母為小寫。說明元數據元素或元數據實體的數據類型。4.5值域規定了元數據元素和元數據實體的有效取值范圍。元數據的英文縮寫名稱,縮寫規則如下:a)短名在本文件內應保證唯一性;b)對存在國際或行業領域慣用英文縮寫的元數據實體或元數據元素,其短名直接采用該英文縮寫;c)對于根據英文名稱形成的短名,在保持唯一性的前提下統一取每個單詞前3個字母作為其短名,當如此取詞不能保證唯一性時應延展取詞位數,通常僅增加一位,如此仍不能保證唯一性時如前繼續延長取詞,直至保證唯一性為止;d)元數據實體短名的寫法是,所有組成詞匯的縮寫為無縫連寫,并且每個詞匯縮寫的首字母e)元數據元素短名的寫法是,所有組成詞匯的縮寫為無縫連寫,首詞匯全部采用小寫字母,其余每個詞匯縮寫的首字母大寫。2對元數據含義的進一步解釋,包括該元數據的約束/條件和最大出現次數。當該元數據為條件必選時,應注明其約束/條件。——約束/條件:元數據實體或元數據元素描述的注解應規定選取的約束屬性,約束屬性分為必選(M)、可選(O)和條件必選(C)3類:●必選(M):當元數據實體或元數據元素為必不可少時選擇;●可選(O):當元數據實體或元數據元素根據實際應用存在可有可無的情況時選擇;可選元數據實體可包含必選的元數據元素,但這些元數據元素只當可選元數據實體被選用時才成為必選的;如果一個可選元數據實體未被選用,則該元數據實體所包含的元數據元素(包括必選元數據元素)也不選用;●條件必選(C):元數據實體或元數據元素在設定條件下為必不可少時選擇;當該條件滿足時,至少一個元數據實體或元數據元素必選;以下3種情況使用條件必選:表示在2或2個以上元數據實體或元數據元素中進行選擇,至少存在一個元數據實體或元數據元素必選;當已經選用另一個元數據實體或元數據元素時,此元數據實體或元數據元素為必選;當另一個元數據元素已經選擇了一個特定值時,此元數據元素為必選。——最大出現次數:說明元數據實體或元數據元素可以具有的最大實例數目;只出現一次的用“1”5數據論文出版元數據組成數據論文出版元數據由數據集元數據及數據論文元數據組成。●數據集基本信息(9個元數據元素和2個元數據實體):標識符、標題、摘要、關鍵詞、范圍●數據集出版信息(3個元數據元素):發布日期、出版期刊、版本信息;●數據集服務信息(5個元數據元素):數據集引用格式、數據集共享許可協議、數據集使用聲明、數據集下載地址、數據論文訪問地址。 —數據論文元數據,包括:●數據論文內容信息(12個元數據元素和1個元數據實體):標識符、標題、摘要、關鍵詞、數據集基本信息、引言、數據采集和處理方法、數據樣本描述、數據質量控制和評估、數據使用方法和建議、參考文獻、致謝、數據論文作者(元數據實體);●數據論文出版信息(6個元數據元素):收稿日期、同評日期、錄用日期、出版日期、版本信●數據論文服務信息(4個元數據元素):數據論文引用格式、數據論文下載地址、數據論文共享許可協議、數據集訪問地址。數據集元數據描述數據集,數據論文元數據描述數據論文。數據論文描述數據集內涵與特征,經過專家評審在數據期刊正式發布,其與數據集具有一致性和關聯性。元數據示例見附錄A。36數據集元數據6.1數據集基本信息值域:限制文本(按照GB/T32843執行)值域:自由文本(中文描述應寫明中文全稱;英文描述應寫明規范的英文全稱)4注解:可選項,最大出現次數為1。描述特定領域數據集必備的空間范圍、時間范圍等。時間范圍定義:數據集的時間范圍。數據類型:字符型值域:自由文本(列出時間起止范圍)注解:可選項,最大出現次數為1。定義:數據集的空間范圍。數據類型:字符型值域:自由文本(可采用經緯度等方式列出規范的空間坐標范圍)注解:可選項,最大出現次數為1。根據數據期刊學科領域實際需要規定。定義:數據集的描述語言。數據類型:字符型值域:自由文本(限定描述數據集語言的文種,如中文、英文等)注解:必選項,最大出現次數為1。6.1.7文件內容定義:數據集包括的文件數和具體文件內容。數據類型:字符型值域:自由文本(描述文件組織結構、數量和類型,如某個數據集包括101個文件,包括1個Excel表、100張JPG格式圖片)注解:必選項,最大出現次數為1。6.1.8基金項目定義:數據集的項目或基金支持。數據類型:字符型值域:自由文本(列出項目類型十項目名稱十項目編號)注解:可選項,最大出現次數為1。5定義:數據集所占的物理存儲空間大小或數量。值域:自由文本(如填寫存儲空間大小,著錄方式為表示存儲量的實數+存儲量單位,例如等作為單位。如填寫數量,著錄方式為正整數+單位,例如1000條)注解:必選項,最大出現次數為N。數據集作者和數據論文作者可能不完全相同,列出數據集全部作者。值域:自由文本(列出姓名全稱,遵循各語種姓名書寫規范)值域:自由文本(列出規范單位全稱,可采用統一社會信用代碼表示)67定義:數據集作者的電子郵箱。值域:自由文本(采用**@**.**的格式)注解:條件必選項,最大出現次數為1。當作者為通訊作者時,該元素為必選。定義:數據集作者的工作貢獻。注解:可選項,最大出現次數為1。定義:數據集作者的簡要介紹。注解:可選項,最大出現次數為1。6.2數據集出版信息定義:數據集公開發布的時間。值域:日期(按照GB/T7408執行)注解:必選項,最大出現次數為1。描述數據集在數據期刊認可的科學數據存儲庫平臺上公開的時間。定義:數據集關聯出版的數據期刊名稱。值域:自由文本(列出出版數據集及其數據論文的數據期刊全稱)8注解:可選項,最大出現次數為1。定義:數據集的版本信息。值域:自由文本(形如V1、V2等,表示版本情況)注解:必選項,最大出現次數為1。6.3數據集服務信息6.3.1數據集引用格式定義:數據集的引用格式。值域:按照GB/T35294執行6.3.2數據集共享許可協議定義:數據集共享遵循的許可協議。值域:自由文本(描述數據集遵循的共享許可協議,如CCO等)注解:必選項,最大出現次數為1。遵循國際通用的科學數據倫理要求。6.3.3數據集使用聲明定義:數據集使用遵循的規則。值域:自由文本(注明數據集的使用聲明,包括權利和收費情況等)注解:可選項,最大出現次數為1。6.3.4數據集下載地址定義:數據集在互聯網的下載地址。值域:自由文本(列出可以直接下載數據集實體文件的網絡地址)9注解:必選項,最大出現次數為1。提供科學數據共享服務的科學數據存儲庫應確保數據安全。6.3.5數據論文訪問地址定義:以數據集為核心出版的數據論文網絡地址。值域:自由文本(列出關聯數據論文的網絡地址)注解:必選項,最大出現次數為1。在發布數據集的科學數據存儲庫平臺上,可以獲取以該數據集為核心出版的數據論文鏈接,跳轉到數據期刊出版平臺查看數據論文元數據。7數據論文元數據7.1數據論文內容信息定義:數據論文的唯一標識編碼。值域:限制文本(按照GB/T32843執行)注解:必選項,最大出現次數為1。與6.1.1內容不同。如有多個,根據實際需要和相關規范兼容國際標識。在每類標識系統中需永久唯一。定義:數據論文正式公開的標題。值域:自由文本(原則上與6.1.2數據集標題一致)注解:必選項,最大出現次數為1。值域:自由文本(概述數據論文內容)注解:必選項,最大出現次數為1。注解:必選項,最大出現次數為N。可與6.1.4分別定義。7.1.5數據集基本信息按照6.1確定數據集基本信息,并可根據數據期刊實際需要按照第8章進行內容擴展。定義:作為數據論文內容的一部分,簡要描述相關工作在數據科學中的意義和背景。注解:必選項,最大出現次數為1。7.1.7數據采集和處理方法定義:作為數據論文內容的一部分,描述獲得目標數據所需進行的研究設計等全部處理步驟中注解:必選項,最大出現次數為1。7.1.8數據樣本描述定義:作為數據論文內容的一部分,描述數據集的典型樣本,描述來源、數據結構等。注解:必選項,最大出現次數為1。7.1.9數據質量控制和評估定義:作為數據論文內容的一部分,描述數據的可靠性,包括數據質量控制方法和驗證過程。注解:必選項,最大出現次數為1。7.1.10數據使用方法和建議定義:作為數據論文內容的一部分,描述支持數據利用的推薦軟件說明、數據深加工方法與步驟、數據集成或比較說明等。注解:可選項,最大出現次數為1。7.1.11參考文獻定義:數據論文寫作過程中參考過的文獻。值域:限制文本(按照GB/T7714執行)注解:可選項,最大出現次數為1。定義:作者向其他貢獻者的文字致謝。值域:自由文本(描述對支持撰寫文章的非論文作者、相關項目或基金的感謝)注解:可選項,最大出現次數為1。7.1.13數據論文作者定義:數據論文作者有關的信息。注解:必選項,最大出現次數為N。列出數據論文全部作者信息,數據論文作者和數據集作者可能不完全相同。定義:數據論文作者的姓名。值域:自由文本(列出作者姓名全稱,可描述唯一標識)定義:數據論文作者的單位名稱。值域:自由文本(列出機構全稱,可采用統一社會信用代碼表示)定義:數據論文作者的電子郵箱。值域:自由文本(采用**@**.**的格式)注解:條件必選項,最大出現次數為1。當作者為通訊作者時,該元素為必選。定義:數據論文作者的貢獻說明。定義:數據論文作者的基本情況。注解:可選項,最大出現次數為1。7.2數據論文出版信息定義:數據期刊第一次收到數據論文稿件的日期。值域:日期(按照GB/T7408執行。如果數據論文提交至期刊的日期晚于數據集在科學數據存儲庫發布的日期,該日期晚于6.2.1發布日期;否則,該日期和6.2.1發布日期相同)注解:必選項,最大出現次數為1。定義:數據論文經數據期刊同行評審,完成修改的日期。值域:日期(按照GB/T7408執行)注解:必選項,最大出現次數為1。定義:數據論文被數據期刊正式錄用的日期。值域:日期(按照GB/T7408執行)注解:必選項,最大出現次數為1。定義:數據期刊正式出版數據論文的日期。值域:日期(按照GB/T7408執行)注解:必選項,最大出現次數為1。定義:數據論文的版本信息。注解:必選項,最大出現次數為1。定義:數據論文的出版期刊名稱。7.3數據論文服務信息值域:限制文本(參照GB/T7714執行)定義:數據論文全文在互聯網的下載地址。值域:自由文本(注明可以直接下載數據論文全文的網絡地址)定義:數據論文共享遵循的許可協議。定義:與數據論文同時出版的數據集的公開訪問地址。值域:自由文本(列出與數據論文同時出版的數據集訪問地址)注解:必選項,最大出現次數為1。在發布數據論文的數據期刊出版系統上,可以獲取其數據集的網址鏈接,跳轉到科學數據存儲庫上查看數據集元數據。8元數據擴展的類型與規則按照GB/T30523中核心元數據擴展的類型和規則執行。(資料性)數據論文出版元數據示例本附錄給出數據論文及其關聯數據集示例,說明數據論文出版元數據的描述方法。表A.1是其數據集元數據示例,表A.2是數據論文元數據示例,其中部分文字和圖表受限于篇幅略去。表A.1數據集元數據示例數據集基本信息標識符標題1960年—2012年青藏高原極端氣候指數數據集摘要青藏高原作為高海拔生態環境脆弱區域,其氣候變化及發展趨勢一直是學界的研究熱點,極端氣候事件分析是其中一項重要的研究內容。本文基于1960年—2012年內99個氣象觀測站的日值氣溫(日最高氣溫、日最低氣溫)和降水觀測資料(日降水),經過數據質量控制和異常值剔除,計算得到每年典型的15項極端氣溫指數和8項極端降水指數,其中包括10項絕對值指數和13項閾值指數(百分比和觀測量閾值)。本數據集可作為青藏高原地區在全球氣候變化下極端天氣事件發生頻率和趨勢探測分析的材料,也可作為基礎數據來探索極端天氣事件對農牧業生產的影響。關鍵詞青藏高原;極端氣候指數;氣候變化;氣象站點;R語言范圍時間范圍:1960年—2012年;地理范圍:26°00'N~39°47'N,73°19'E~104°47'E語種中文文件內容本數據集由23個指數文件(CSV)組成,包括15個極端溫度指數和8個極端降水指數結果,數據名以英文的“指數名稱”命名。每個指數文件均由年份、對應年際指數結果、平滑結果和站點名標識4部分組成,每個文件的數據量因站點數目及觀測年份的不同略有差異,未壓縮數據量大約為80KB~160KB。基金項目中國科學院STS項目(***)數據量數據格式數據集作者數據集出版信息發布日期2017-06-1217:13:18GMT+8出版期刊版本信息GB/T42813—2023表A.1數據集元數據示例(續)數據集服務信息數據集引用格式周**,高*.1960年—2012年青藏高原極端氣候指數數據集[DS/OL].***,2017[2022-07-04].http://***.CSTR:*****.11.*****.444.數據集共享許可協議數據集使用聲明無數據集下載地址https://www.***.cn/detail?dataSetld=****=journal數據論文訪問地址http://www.******.org/p/99/表A.2數據論文元數據示例數據論文內容信息標識符標題1960年—2012年青藏高原極端氣候指數數據集摘要青藏高原作為高海拔生態環境脆弱區域,其氣候變化及發展趨勢一直是學界的研究熱點,極端氣候事件分析是其中一項重要的研究內容。本文基于99個氣象觀測站1960年—2012年的日值氣溫(日最高氣溫、日最低氣溫)和降水觀測資料(日降水),經過數據質量控制和異常值剔除,利用R語言中的RClimDex包計算得到每年典型的15項極端氣溫指數和8項極端降水指數,其中包括10項絕對值指數和13項閾值指數(百分比和觀測量閾值)。本數據集可作為在全球氣候變化下青藏高原地區極端天氣事件發生頻率和趨勢探測分析的材料,也可作為基礎數據來探索極端天氣事件對農牧業生產的影響。關鍵詞青藏高原;極端氣候指數;氣候變化;氣象站點數據集基本信息數據集中文名稱1960年—2012年青藏高原極端氣候指數數據集數據集英文名稱數據集作者通訊作者數據時間范圍1960年—2012年地理區域個氣象觀測站點時間分辨率年數據量2.39MB數據格式基金項目國家自然科學基金(***)中國科學院STS項目(***)簡介本數據集由23個指數文件(CSV)組成,包括15個極端溫度指數和8個極端降水指數結果,數據名以英文的“指數名稱”命名。每個指數文件均由年份、對應年際指數結果、平滑結果和站點名標識4部分組成,每個文件的數據量因站點數目及觀測年份的不同略有差異,未壓縮數據量大約為80KB~160KB。表A.2數據論文元數據示例(續)數據論文內容信息引言受人類社會經濟活動的加強和全球氣候變化等因素[口影響,全球性的熱浪天氣、極端降水、熱帶風暴和海平面變化等災害性氣象氣候事件頻發2]。由于青藏高原對北半球甚至全球氣候變化的敏感性和自身生態的脆弱性3,學界已經廣泛開展關于該高寒干旱區域的氣候發展、變化趨勢和植被響應等方面的研究。數據采集和處理方法站點分布:本文所采用的原始氣象站觀測資料來源于中國氣象科學數據共享服務網,氣象觀測站點主要分布于青藏高原的中東部分區域,大部分氣象觀測站高程范圍為2500m~4500m,覆蓋新疆維吾爾自治區、青海省、甘肅省、四川省、云南省和西藏自治區,跨越了高原溫帶、亞寒帶和中亞熱帶3個溫度帶,共包括10余種不同類型生態地理分區。106個地面氣象觀測站中有7個站點無觀測數據,即實際使用站點99個。數據樣本描述本數據集最終包含青藏高原99個站點的23項典型極端氣候指數結果文件,為了便于計算處理與應用,存儲為CSV格式文件,包括15種氣溫指數和8種降水指數,結果文件以指數英文名稱命名,例如CDD.CSV。(此處省略表格)數據質量控制和評估解譯,并將數據統一通用單位;二是在極端氣候指數生產過程中通過人工校檢和軟件自動監測相結合的手段,對預處理后的數據完成了嚴格的質量控制。計算極端氣候指件,然后根據人工檢查驗證文件數據的結果,進行更正或刪除……數據使用方法和建議化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論