




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
核苷酸和/或氨基酸序列表和序列表電子文件標準.txt喜歡我這是革命需要,知道不?!你不會疊衣服一邊呆著去!以后我來疊! 我一定要給你幸福,誰也別想攔著。 本文由rockyshmily09貢獻doc文檔可能在WAP端瀏覽體驗不佳。建議您優先選擇TXT,或下載源文件到本機查看。核苷酸和/核苷酸和/或氨基酸序列表和序列表電子文件標準(2001年11月1日國家知識產權局令第15號公布)1口總則□□根據專利法實施細則第18條第4款的規定,包含一個或多個核苷酸或者氨基酸序列的發明專利申請,說明書中應當包括符合國家知識產權局專利局規定的序列表,并按照國家知識產權局專利局的規定提交含有該序列表的計算機可讀形式的副本。口口為了使提交的紙件形式的核苷酸和/或氨基酸序列表及計算機可讀形式的含有該序列表的電子文件規范化,以利于申請人提交;也為了使序列表電子文件可以快捷地輸入國家知識產權局專利局的計算機數據庫,并與其它的序列檢索數據庫交換數據,以利于公眾檢索;同時也利于專利局審查員加快審查,更好地為申請人服務;特制定本標準。2口適用范圍口□本標準適用于所有向國家知識產權局專利局提交的包含核苷酸和/或氨基酸序列的發明專利申請,具體地說,適用于該申請提交的紙件形式的核苷酸和/或氨基酸序列表,以及含有核苷酸和/或氨基酸序列表的計算機可讀形式的序列表電子文件。3口術語和定義口口在本標準中,采用下面術語和定義:□□(1)序列表:是指以紙件形式提交的專利申請說明書的一部分,它公開了核苷酸和/或氨基酸序列的詳細內容和其它有用信息。序列表中的序列是不少于10個核苷酸的非支鏈核苷酸序列,或者是不少于4個氨基酸的非支鏈氨基酸序列。所述的序列不包括支鏈序列;不包括具有少于4個特別定義的核苷酸或氨基酸的序列;也不包括含有列于附錄1之表1—4以外的核苷酸或氨基酸的序列。口口(2)序列表電子文件:是指包含核苷酸和/或氨基酸序列表的計算機可讀形式的純文本文件。口□(3)核苷酸:只包括附錄1之表1中列出的符號所表示的核苷酸。附錄1之表2中列出的符號用于表述核苷酸的修飾形式,例如甲基化堿基。對于核苷酸的修飾形式,不得在核苷酸序列中直接使用表2中的符號表示,其具體的表述方式見本標準4.4.7節(1)4.4.5和節的內容。口口(4)氨基酸:只包括列于附錄1之表3中的存在于天然蛋白質中的L一氨基酸,不包括D一氨基酸。附錄1之表4中列出的符號用于表述氨基酸的修飾形式,例如羥基化或糖基化形式。對于氨基酸的修飾形式,不得在氨基酸序列中直接使用表4中的符號表示,其具體的表述方式見本標準4.4.7節(2)和4.4.5節的內容。口口(5)序列標識符:對應于序列表中每個序列的序列標識號的唯一的正整數。口口(6)數字標識符:由尖括號〈〉括起來的代表特定內容數據項的三位數字。4□序列表和序列表電子文件中的數字標識符、內容及其格式:口□在核苷酸和/或氨基酸序列表和序列表電子文件中,應當有本標準中指出的數字標識符,在數字標識符之后(即在其之右,必要時還包括在其下面的若干行)是相應的具體內容,它們應當符合本標準規定的格式。附錄2給出了一個說明數字標識符、其后內容及格式的序列表樣例。□□序列表和序列表電子文件中包括的數字標識符及相應內容和格式具體如下:口口4.1、序列表和序列表電子文件中的著錄項目:□□下面4.1.1-4.1.7節中的內容應當與專利申請請求書中的相應內容一致。口4.1.1、申請人的姓名或名稱:其數字標識符為110〉。口□在數字標識符〈110〉之后,是該專利申請的所有申請人的姓名或名稱。□□外國申請人還應當在中文譯名之后注明英文姓名或名稱,并將其用圓括號括起來。口口4.1.2、發明名稱:其數字標識符為120〉□口在數字標識符〈120〉之后,是該專利申請的發明名稱。口口4.1.3、案卷參考號:其數字標識符為〈130〉□□在數字標識符〈130〉之后,是該專利申請的案卷參考號;沒有案卷參考號的,無需包括此項內容。口口4.1.4、專利申請號:其數字標識符為〈140〉□□對于首次提交的專利申請,無需包括此項內容;當補交或提交修改時,在數字標識符〈140〉之后,是該專利申請的申請號。口口4.1.5、專利申請日:其數字標識符為〈141〉□□對于首次提交的專利申請,無需包括此項內容;當補交或提交修改時,在數字標識符〈141〉之后,是該專利申請的申請日,其格式為:YYYY—MM—DD,例如2002—01—18。□4.1.6、優先權號:其數字標識符為〈150〉□□沒有優先權的專利申請,無需包括此項內容;如果有優先權的話,那么在數字標識符〈150〉之后,是該專利申請的優先權號,其格式為:世界知識產權組織(WIPO)標準3(ST3)的國家、地區和政府間組織代碼+優先權號,例如,CN93112388.7。□□4.1.7、優先權日:其數字標識符為151〉□□沒有優先權的專利申請,無需包括此項內容;如果有優先權的話,那么在數字標識符〈151〉之后,是該專利申請的優先權日,其格式為:YYYY—MM—DD,例如2001—09—20。□□4.2、序列表電子文件的軟件版本信息:其數字標識符為〈170〉□□當使用國家知識產權局專利局或其它專利組織(例如歐洲專利局)提供的軟件形成核苷酸和/或氨基酸序列表電子文件時,在數字標識符〈170〉之后,是該軟件的名稱與版本號;未使用所述軟件時,可以不包含此項內容。口口4.3、序列表中序列的個數:其數字標識符為〈160〉。口□在數字標識符〈160〉之后,是序列的總數,即與數值最大的序列標識符相對應的正整數。口口4.4、序列中的各項內容:口口4.4.1、序列標識符:其數字標識符為210〉。□□在序列表中,每個序列應當有獨立的、唯一的序列標識符,它應當從1開始并逐一增加。序列標識符表示每個序列在序列表中的序號。口□在數字標識符〈210〉之后,是與一個序列相對應的序列標識符。□□在一個序列標識符之后到下一個序列標識符之前是該序列的各項具體內容,即下面4.4.2—4.4.7節的內容。□在序列表中有多個序列的情況下,應當按照序列標識符數值從小到大的次序逐一填寫每個序列的各項內容。口口4.4.2、序列的長度:其數字標識符為211〉。口□在數字標識符〈211〉之后,是以堿基或氨基酸的數目表示的該序列的長度。口口4.4.3、序列的類型:其數字標識符為〈212〉。口□在數字標識符〈212〉之后,應當指出該序列的分子類型,DNA、有RNA或PRT三種類型。如果核苷酸序列含有DNA和RNA片段的話,那么其類型應該是DNA;另外,對于DNA/RNA的結合分子,應該在該序列的特征部分(數字標識符〈220〉一〈223〉)進一步表述。口口4.4.4、生物體:其數字標識符為〈213〉。□口在數字標識符〈213〉之后,應當用中文和拉丁文(拉丁文應當放在中文之后并用圓括號括起來,例如,草履蟲種(Parameciumsp.))注明該序列來源的生物名稱,即科學命名的生物屬種;或者是“人工序列”或“未知”。□□4.4.5、序列中特征部分的內容:數字標識符〈220〉一〈223〉□□本節涉及到序列中與特征相關的內容的表述。□□在核苷酸序列(數字標識符〈400〉)中含有“n”或修飾的堿基的情況下(參見本標淮4.4.7節(1)的內容),或者在氨基酸序列(數字標識符400〉)中含有“Xaa”或修飾的氨基酸或不常用的L一氨基酸的情況下(參見本標準4.4.7節(2)的內容),必須包括下面(1)—(4)項的內容。□□在生物體(數字標識符〈213〉)是“人工序列”或“未知”的情況下,必須包括下面(1)和(4)項的內容。□□在一個序列中有多個特征的情況下,應當按照這些特征在序列中出現的先后次序逐一地表述每個特征。□□序列中特征部分的具體內容和數字標識符如下:口口(1)特征:其數字標識符為〈220〉。口□在數字標識符〈220〉之后,應當是空白。口口(2)名稱/關鍵詞:其數字標識符為〈221〉。□在數字標識符〈221〉之后,是特征名稱或關鍵詞。使用關鍵詞表述特征時,只能使用附錄1之表5或表6中列出的關鍵詞來表述。口口(3)位置:其數字標識符為〈222〉。□在數字標識符〈222〉之后,應當標明特征的位置,標注的方式為:從特征中的第一個堿基或氨基酸的編號到特征的最后一個堿基或氨基酸的編號,編號圓括號括起來,兩個編號中間是“…”,例如:(279)?(389);當序列中使用了多個“n”或“Xaa”時,應當標明它們的所有位置,例如:(80,100,112)。參見附錄2的序列表樣例。口口(4)其它信息:其數字標識符為〈223〉。口□在數字標識符〈223〉之后,應當表述序列中與特征有關的其它相關信息。在表述修飾的堿基或修飾的氨基酸時,應該用附錄1之表2或表4中給出的符號來表述。口口4.4.6、出版公開信息:數字標識符〈300〉一〈312〉□□出版公開信息是非強制性的內容,在序列表和序列表電子文件中,可以包含也可以不包含這些內容。□(1)公開出版信息:其數字標識符為〈300〉□□在數字標識符〈300〉之后,應當是空白。口口(2)作者:其數字標識符為〈301〉□□在數字標識符〈301〉之后,是該文獻作者的姓名。口口(3)題目:其數字標識符為〈302〉□□在數字標識符〈302〉之后,是出版物中該文獻的題目。口口(4)雜志名稱:其數字標識符為〈303〉□□在數字標識符〈303〉之后,是公開出版物的雜志名稱。□□(5)公開出版物的卷號:其數字標識符為〈304〉□在數字標識符〈304〉之后,是公開出版物的卷號。口口(6)公開出版物的出版號:其數字標識符為〈305〉□□在數字標識符〈305〉之后,是公開出版物的出版號。口口(7)頁碼:其數字標識符為〈306〉□□在數字標識符〈306〉之后,是該文獻的起始一終止頁碼。口口(8)出版日期:其數字標識符為〈307〉□□在數字標識符〈307〉之后,是該公開出版物的出版日期,其格式為:YYYY—MM—DD,例如1999—09—20。□□(9)公開出版物的數據庫登記號:其數字標識符為〈308〉□□如果該文獻被收入某個數據庫的話,那么在數字標識符〈308〉之后,是該文獻在該數據庫中的登記號。口口(10)錄入數據庫的日期:其數字標識符為〈309〉□□如果該文獻被收入某個數據庫的話,那么在數字標識符309〉之后,是該文獻錄入該數據庫的日期,其格式為:YYYY—MM—DD,例如1999—09—20。□□(11)專利公開號:其數字標識符為〈310〉□□如果該公開出版物是專利文獻的話,那么在數字標識符〈310〉之后,是該專利的公開號,其格式為:世界知識產權組織(WIPO)標準3(ST3)的國家、地區和政府間組織代碼+標準6(ST6)的公開號+標準16(ST16)的文獻類型,例如CN1183117A。口口(12)專利申請日:其數字標識符為311〉□□如果該公開出版物是專利文獻的話,那么在數字標識符〈311〉之后,是該專利的申請日,其格式為:YYYY—MM—DD,例如1999—09—20。□□(13)專利公開日:其數字標識符為〈312〉□□如果該公開出版物是專利文獻的話,那么在數字標識符312〉之后,是該專利的公開日,其格式為:YYYY—MM—DD,例如1999—09—20。□□4.4.7、核苷酸序列和/或氨基酸序列:其數字標識符為〈400〉。口□在數字標識符〈400〉之后,是該序列的序列標識符:從下一行開始是該核苷酸和/或氨基酸序列。□□該序列可以是純核苷酸序列,或者是純氨基酸序列,或者是核苷酸序列和與它對應的氨基酸序列。口口(1)純核苷酸序列:□□核苷酸序列應當只用單鏈表示,從左到右是5'一末端至3'一末端的方向,序列中不應當出現術語5'和3'。口□應當用單字母代碼表示核苷酸序列的堿基來表述核苷酸序列的特征;只能使用與附錄1之表1中給出的符號相一致的小寫字母來表示。□□在一個核苷酸序列中,如果經修飾的堿基是附錄1之表2中列出的之一,那么在該序列本身中,應當用未修飾的堿基或“n”來表示該經修飾的堿基,符號“n”等同于唯一的一個未知的或經修飾的核苷酸;但在該序列的特征部分(數字標識符〈220〉一〈223〉)應當使用附錄1之表2中給出的符號進一步表述該修飾(參見本標準4.4.5節)。附錄1之表2中的符號可以用于說明書或序列的特征部分,但不得用于序列本身。□□核苷酸序列中堿基的編號開始于序列中的第1個堿基,并從5'到3'方向連續地計數。該計數方法也用于構型為環狀的核苷酸序列,在這種情況下,申請人可任意指定序列的第一個核苷酸。□□來自大序列的一個或更多非鄰接區段或來自不同序列的區段組成的核苷酸序列,應當作為帶有單獨序列標識符的單獨序列來計數。帶有一個缺口或多個缺口的序列應當作為帶有單獨序列標識符的多個單獨序列來計數,而單獨序列的數目與序列數據的連續序列的數目相同。口□核苷酸序列每行最多60個核苷酸堿基,10個核苷酸堿基后空一格。每該行的最后是該行最后一個堿基的編號。口口(2)純氨基酸序列:□□對于氨基酸序列,蛋白質或肽序列中的氨基酸應當從左到右以氨基到羧基的方向列出;序列中不應當出現氨基或羧基基團。口口氨基酸應當使用與附錄1之表3中的符號相一致的、第一個字母大寫的三字母符號表示。有空白或內部中止符號(例如“Ter”或“大”或“?”)的氨基酸序列不應當表示為單個氨基酸序列,而應當作為獨立的氨基酸序列分別列出。口□在一個氨基酸序列中,如果經修飾的氨基酸是附錄1之表4中列出的氨基酸之那么在該序列本身中,應當用相應的未經修飾的氨基酸或“Xaa”來表示該經修飾的和不常用的氨基酸,符號“Xaa”等同于唯一的一個未知的或經修飾的氨基酸;但在該序列的特征部分(數字標識符〈220〉一〈223〉),應當使用附錄1之表4中給出的符號進一步表述該修飾(參見本標準4.4.5節)。附錄1之表4中的符號可以用于說明書或序列的特征部分,但不得用于序列本身。 氨基酸的編號開始于序列中的第1個氨基酸,以數字1表示并標注在該氨基酸的下面;以后每隔5個氨基酸在其下面標注上該氨基酸的編號。當成熟蛋白質之前存在氨基酸時,例如對于前一序列,原一序列,前一原一序列和信號序列而言,可以任選地從與成熟蛋白第一個氨基酸相鄰的氨基酸開始以負數往回編號。當氨基酸編號使用負數以區分成熟蛋白質時,不得使用數字0。上述氨基酸序列的計數方法也適用于環狀構型的氨基酸序列,申請人可以任意指定第一個氨基酸。 來自大序列的一個或更多非鄰接區段或不同序列的區段組成的氨基酸序列,應當作為具有單獨序列標識符的單獨序列來計數。具有一個缺口或多個缺口的序列應當作為具有單獨序列標識符的多個單獨序列來計數,單獨序列的數目與序列數據的連續序列的數目相同。 氨基酸序列每行最多16個氨基酸,每個氨基酸之間空一格。 (3)核苷酸序列和與它對應的氨基酸序列: 對于核苷酸序列和與它對應的氨基酸序列,對應于其編碼的氨基酸的核苷酸序列的堿基應當以“三聯體”密碼子列出,每個密碼子之間應當空一格;對應于核苷酸序列的編碼部分的氨基酸可以直接列于相應密碼子的下方;對于該氨基酸序列,應當在第一個氨基酸的下面標注上編號1,然后每隔5個氨基酸在其下面標注上該氨基酸的編號。 對于這種核苷酸和其編碼的氨基酸序列的混合形式,與核苷酸序列相對應的氨基酸序列還應當以純氨基酸序列的形式另外給出。 4.5、數字標識符連同其后內容的排列格式 在本節中,“數字標識符及內容”指的是數字標識符連同其后的相應內容。 數字標識符及內容應當按照數字標識符的數值從小到大的次序排列在序列表中。 每個數字標識符及內容之間應當空一行,不過在前兩位數字相同的數字標識符及內容之間,例如〈210〉到〈213〉之間和〈220〉到〈223〉之間,無需空一行,但對于一個序列中有多個特征的情況,在表述每個特征時,每個數字標識符〈220〉之前應當空一行。 對于序列表中有多個序列的情況,數字標識符及內容應當按照序列標識符的數值從小到大的次序排列。在每個序列中,應當按照數字標識符數值從小到大的次序列出僅僅與該序列有關的數字標識符及內容,即排列上從〈210〉到〈400〉的數字標識符及內容。 對于一個序列中有多個特征的情況,應當按照這些特征在序列中出現的先后次序逐一排列從〈220〉到〈223〉的數字標識符及內容。5序列表電子文件的格式 5.1、序列表電子文件是一個包含上述第4部分的數字標識符和內容,并符合上述第4部分格式要求的純文本文件;該文件應當使用中華人民共和國頒布的信息交換用漢字編碼字符集標準。 5.2、序列表電子文件應當記錄在CD-ROM光盤或3.5英寸軟盤上提交,或者按照國家知識產權局專利局規定的其它形式提交。當記錄在CD—ROM光盤上時,CD—ROM光盤應當該采用ISO9660標準刻錄;當記錄在3.5英寸軟盤上時,該軟盤應當符合FAT12格式。該光盤或軟盤的目錄結構如下:在根目錄下,有且僅有一個后綴名為“SEQ”的純文本文件。6其它事項 6.1、申請人應當保證提交的計算機可讀形式的序列表電子文件中的內容與紙件形式的序列表完全相同。 6.2、申請人在形成符合本標準的序列表電子文件時,可以使用國家知識產權局專利局提供的序列表編輯軟件來形成;也可以使用其它專利組織提供的軟件(例如歐洲專利局提供的Patentin)來形成;還可以使用任何純文本文件編輯軟件來形成。無論使用何種軟件,所形成的電子文件都必須符合本標準的規定。6.3、當申請人以光盤或軟盤的形式提交序列表電子文件時,應當在提交的光盤或軟盤上貼有永久性標記,注明申請人姓名或名稱、發明名稱、光盤或軟盤中的文件名和提交日期;申請人委托了代理人的,也可以任選地標注上代理機構給該申請的案卷號。對于申請人補交或提交修改的情況,應當注明申請號并注明“補交”或“修改”注明申請人姓名或名稱等項內容時,應當使用本標準中的數字標識符,即應當標注上數字標識符,并在其后注明具體內容,例如:〈110〉XX基因開發有限公司。注明提交日期的格式為:YYYY—MM—DD。 當序列表電子文件的字節數太大不能記錄在一張軟盤上時,應當將序列表電子文件記錄在一張光盤上提交。7頒布和實施本標準由中華人民共和國國家知識產權局頒布,自2001年11月1日起實施。中華人民共和國國家知識產權局二。。一年十一月一日附錄1核苷酸和氨基酸符號和特征關鍵詞表表1核苷酸表a: gc符號 含義名稱的來源gct或aa胞嘧啶胸腺嘧啶鳥嘌吟r腺嘌吟tg嘌吟st/u非tmk g或g或c2H鍵非a非c非g,非uy t/u或ca或ct/u3H鍵強作用dhv an a或g酮基弱作用b g或a或g或a或c或t/u或g或c或c或t/u,未知,嘧啶氨基w a或c或t/ut/u或其它 任何表2經修飾的核苷酸表符號含義 ac4c4-乙酰胞苷chm5u5-(羧羥甲基)尿苷cm 2'-0-甲基胞苷cmnm5s2u5-羧甲基氨甲基-2-硫代尿苷cmnm5u 5-羧甲基氨甲基尿苷d二氫尿苷fm 2'-0-甲基假尿苷galq們D-半乳糖Q核苷gm2'-0-甲基鳥苷i 肌苷mlfi6a N6-異戊烯基腺mla 1-甲基腺苷1-甲基假尿苷mlg 1-甲基腺苷mli 1-甲基肌苷m22g 2'2-二甲基腺苷
m2a 2-甲基腺苷2-甲基鳥苷m2a 2-甲基腺苷2-甲基鳥苷m5cm3c 3-甲基胞苷m6a N6-甲基腺苷m7g 7-甲基鳥苷5-甲基氨基甲基尿苷mam5s2um6a N6-甲基腺苷m7g 7-甲基鳥苷5-甲基氨基甲基尿苷mam5s2u5-甲氧基氨基甲基-2-硫代尿苷manqp,D-甘露糖Q核苷甲氧基羰基甲基-2-硫代尿苷甲基尿苷mam5umcm5s2u5-5-甲氧基羰基5-甲氧基尿苷ms2i6a 2-硫代甲基-N6-異戊烯基腺苷ms2t6aN-((9-p-D-呋喃核糖基-2-硫代甲基嘌吟mcm5umo5u-6-Y1)氨基甲酰)蘇氨 酸mt6a N-((9-p-D-呋喃核糖嘌吟-6-y1)N-甲基氨基甲酰)蘇氨酸 mv尿苷-5-氧化乙酸-甲基酯尿苷-5-氧化乙酸-甲基酯-5-氧化乙酸s2cs2t5-甲基-2s2u 2-硫代尿苷s4u 4-硫代尿苷5-甲基尿苷p-D-呋喃核糖嘌吟-6-基)-氨基甲酰)蘇苷o5u尿苷osywwybutoxosinep假尿苷qQ核苷2-硫代胞苷硫代尿苷tt6aN-((9-氨酸 tm 2'-O-甲基-5-甲基尿um 2'-O-甲基尿苷yw Wybutosinex 3-(3-氨基-3-羧基-丙其)尿苷,(acp3)u表3三字母表示的氨基酸表符號含義酸AspGluPhe 表3三字母表示的氨基酸表符號含義酸AspGluPhe 甘氨酸Gly 組氨酸His 異亮氨酸賴氨酸亮氨酸Asn丙氨Ala 半胱氨酸Cys 天冬氨酸谷氨酸苯丙氨酸ProIleLysLeu 蛋氨酸Met 天冬酰酸脯氨酸谷氨酰胺GlnArg精氨酸Arg氨酸GlxSerThr 繳氨酸Vai 色氨酸Trp 酪氨酸Tyr 天冬氨酸或天冬酰胺Asx 谷氨酸或谷氨酰胺未知或其它蘇氨酸Xaa表4經修飾的和不常用的氨基酸表符號 含義 Aad2-氨基已二酸 bAad 3-氨基已二酸 bAla [3-丙氨酸,8-氨基丙酸 Abu 2-氨基丁酸4Abu 4-氨基丁酸,哌嗟酸Acp 6-氨基已酸Ahe 2-氨基庚酸Aib 2-氨基異丁酸 bAib3-氨基異丁酸 Apm2-氨基庚二酸 Dbu 2,4二氨基丁酸 Des 賴氨素Dpm 2,2'-二氨基庚二酸Dpr 2,3-二氨基丙酸EtGly N-乙基甘氨酸EtAsn N-乙基天冬氨酸Hyl 羥基賴氨酸 aHyl另卜羥基賴氨酸 3Hyp 3-羥基脯氨酸 4Hyp 4-羥基脯氨酸 Ide 異賴氨素alle 另ij-異亮氨酸MeGly N-甲基甘氨酸,肌氨酸Melle N-甲基異亮氨酸MeLys 6-N-甲基賴氨酸MeVal N-甲基繳氨酸 Nva正繳氨酸 Nle 止是氨酸 Orn 鳥氨酸表5與核昔酸序列相關的特征關鍵詞表關鍵詞 說明 allele相關的個體或菌株含有相同基因的穩定的其它形式,該形式區別 于這一位直的現有的序列(和或許其它序列) attenuator(1)存在調節轉錄的終止的DNA區域,它控制了一些細菌操縱子的 表達;(2)位于啟動子和第一個結構基因之間,引起轉錄的部分終止的 序列區段C_region 免疫球蛋白輕和重鏈的恒定區,和T—細胞受體a,[3,和丫鏈;根據特定的鏈可包括一個或多個外顯子 CAAT_signalCAAT盒;位于可能參與RNA聚合酶結合的真核生物轉錄單位的起 始點的75bp上游的保守序列的一部分;共有序列二仔6(C或T)CAA TCTCDS 編碼序列;對應于蛋白質中的氨基酸序列的核苷酸的序列(位置 包括終止密碼子);特征包括氨基酸概念上的翻譯 Conflict在這一位點或區域,單獨確定的“相同”序列有所不同 D_loop 置換環;線粒體DNA內的一個區域,其中RNA的短的序列與DNA的 一條鏈配對,代替了這一區域的原始配對DNA鏈;也用于說明在RecA蛋白質催化的反應中,侵入的單鏈替代雙鏈DNA的一條鏈的區域 D_segment免疫球蛋白重鏈的多變區,和T-細胞受體的p鏈 Enhancer 順式-作用序列,它增強了(一些)真核生物啟動子的作用,并 能在任一方向和與啟動子相關的任何位置處(上游或下游)起作 用Exon 編碼剪接mRNA部分的基因組區域;可以含有5'UTR,所有CDS,和3'UTR GC_signalGC盒;位于真核生物轉錄單位起始點上游的保守的富含GC區域, 可以以多重拷貝或任一方向存在;共有序列=GGGCGG gene 鑒定為基因的生物學意義的區域,并已經指定名稱 iDNA 間插DNA;通過幾種重組中的任何一種能被消除的DNA intron 被轉錄的DNA區段,但通過同時剪接位于其兩側的序列(外顯子 )即可從轉錄本內部將其除去J_segment 免疫球蛋白輕鏈和重鏈的連接區段,和T-細胞受體a,p和Y鏈LTR 長的末端重復,在確定序列的兩端直接重復的序列,類型典型地見于逆轉錄病毒中 mat_peptide成熟的肽或蛋白質的編碼序列;翻譯后修飾之后成熟的或最終的 肽或蛋白質產CDS不同)CDS不同)misc_binding不能用任何其它Binding關鍵詞(primer_bind或protein_bind) 表述的與另一個組成成分共價或非-共價結合的核酸中的位點 misc_differe特征序列與記載中存在的有所不同,并且不能用任何其它不同關nce 鍵詞(conflict,unsure,old_sequence,mutation,variation,allele或modified_base)表述 misc_feature不能用任何其它的特征關鍵詞表述的具有生物學意義的區域;新 的或少見的特征 misc_recomb任何一般性的,位點特異性的或復制的重組事件的位點,該位點 中有不能用其它重組關鍵詞(iDNA和virion)或來源關鍵詞的修 飾詞(/transposon,/proviral)表述的雙螺旋DNA的斷裂和愈合misc_RNA 不能用其他RNA關鍵詞(prim_transcript,precursor_RNA,mRNA ,5,clip,3,clip,5'UTR,3,UTR,exon,CDS,sig_peptide,transit peptide,mat_peptide,intron,polyA_site,rR NA,tRNA,scRNA和snRNA)限定的任何轉錄本或RNA產物 misc_signal含有控制或改變基因功能或表達之信號的任何區域,所述信號不 能用其他Signal關鍵詞(promoter,CAAT_signal,TATA_signal ,-35_signal,10_signal,GC_signal,RBS,polyA_signal,e nhancer,attenuator,terminator,和rep_origin)表述misc_structu不能用其他Structure關鍵詞(stem_loop和D-loop)表述的任何re 二級或三級結構或構象modified_bas被指示的核苷酸是經修飾的核苷酸,并應由被指示的分子(在moed_base修飾詞意義中給出)所取代 mRNA 信使RNA;包括5'非翻譯區(5'UTR),編碼序列(CDS,外顯子) 和3'非翻譯區(3'UTR)mutation在此位置處,相關品系的序列中具有突然的,可遺傳的變化 N_region 在重排的免疫球蛋白區段之間插入的額外的核苷酸 Old_sequence在此位置處,所表述的序列修改了此序列以前的版本PolyA_signal聚腺苷酸化之后內切核酸酶裂解RNA轉錄本所必需的識別區域;共有序列=AATAAA PolyA_siteRNA轉錄本上的位點,通過轉錄后聚腺苷酸化該位點將被加上腺嘌吟殘基Precursor_RN仍不是成熟的RNA產物的任何RNA種類;可包括5'剪切區(5'clip)A5'非翻譯區(5'UTR),編碼序列(CDS,外顯子),間插序列(內 含子),3'非翻譯區(3'UTR),和3'剪切區(3'clip) prim_transcr初級(最初的,未加工的)轉錄本;包括5'剪切區(5'clip),5ipt '非翻譯區(5'UTR),編碼序列(CDS,外顯子),間插序列(內 含子),3'非翻譯區(3'UTR)和3'剪切區(3'clip)prim_bind起始復制,轉錄或逆轉錄的非一共價的引物結合位點;包括合成的例如PCR引物元件的位點 Promoter參與RNA聚合酶的結合以啟動轉錄的DNA分子區域 protein_bind核酸上非一共價的蛋白質結合位點 RBS 核糖體結合位點 repeat_regio含有重復單位的基因組區域 nrepeat_unit單個重復元件rep_origin 復制起點;復制核酸以得到兩個相同拷貝的起始位點RRNA 成熟的核糖體RNA;將氨基酸裝配成蛋白質的核糖核蛋白顆粒(核糖體)中的RNA成份 S_region免疫球蛋白重鏈的開關區;它參與重鏈DNA的重排,導致來自相 同B一細胞的不同免疫球蛋白類的表達 Satellite短的基本重復單位的很多串聯重復(相同或相關的);大多數具 有的堿基組成或其它性質與基因組的一般水平不同,這使得它們 與大部分(主帶)的基因組DNA分離開來ScRNA 小的細胞質RNA;幾個小的細胞質RNA分子中的任何一個存在 于真核生物的細胞質和(有時)核中sig_peptide信號肽編碼序列;被分泌的蛋白質的N一末端結構域的編碼序列;此結構域涉及新生多肽與膜的結合;前導序列 SnRNA小的核RNA;很多小的RNA種類中的任何一個都被局限于核中;幾 個snRNA參與剪接或其它RNA加工反應 鑒定序列中特定范圍的生物來源;此關鍵詞是強制性的;每一項source 至少要有一個跨越整個序列的單一來源關鍵詞;每個序列可允許 有一個以上的來源關鍵詞stem_loop 發卡結構;由RNA或DNA單鏈的相鄰(反向)互補序列之間的堿基 一配對形成的雙螺旋區域STS 序列標記位點:表述基因組上作圖界標并能通過PCR檢測的短的,單拷貝DNA序列;通過測定STS系列的次序即可作出圖譜的基因 組區域 TATA_signalTATA盒;Goldberg—Hogness盒;在每個真核生物RNA聚合酶II轉 錄單位起點前約25bp處發現的保守的富含AT的七聚體,它可能涉 及使酶定位以正確地起始;共有序列=TATA(A或T)A(A或T)terminator或者位于轉錄本的末端或者與啟動子區域相鄰的DNA序列,該序 列可導致RNA聚合酶終止轉錄;也可以是阻抑蛋白的結合位點transit_pept轉運肽編碼序列;核編碼的細胞器蛋白質N一末端結構域的編碼ide 序列;此結構域參與將蛋白質翻譯后運送到細胞器中tRNA 成熟的轉移RNA,小的RNA分子(75—85個堿基長),介導核酸序列翻譯成氨基酸序列 unsure作者不能確定此區域的準確序列 V_region免疫球蛋白輕鏈和重鏈的可變區,和T一細胞受體a,8和Y鏈 ;編碼可變的氨基末端部分;可由V_segment,D_segment,N_re gion和J_segment組成V_segment 免疫球蛋白輕鏈和重鏈的可變區段,和T一細胞受體a,8和Y 鏈;編碼大多數可變區(v_region)和前導肽的最后幾個氨基酸 variation 含有來自相同基因的穩定突變的相關系列(例如RFLP,多態性等 ),在此(和可能其它)位置處所述相同基因與被表述的不同 3'c1ip在加工過程中被切下的前體轉錄本3'端大部分區域 3'UTP不被翻譯成蛋白質的成熟轉錄本的3'末端區域(終止密碼子之后 )5'clip在加工過程中被切下的前體轉錄本5'端大部分區域 5'UTP 不被翻譯成蛋白質的成熟轉錄本的5'末端區域(起始密碼子之前 )_10_signalPribnow盒;細菌轉錄單位起點上游約10bp處的保守區域,它可 能參與結合RNA聚合酶;共有序列=TatAaT_35_signal 細菌轉錄單位起點上游約35bp處的保守六聚體;共有序列=TTGACa口或TGTTGACA口表6與蛋白質序列相關的特征關鍵詞表關鍵詞 說明CONFLICT 不同的論文報道了不同的序列 VARIANT作者報道存在序列變體 VARSLIC 由可選擇的剪接產生的序列變體的表述 MUTAGEN 經實驗操作已改變的位點 MOD_RES 殘基的翻譯后修飾ACETYLATION N一末端或其它AMIDATION 通常位于成熟的活性肽的C一末端BLOCKED 不能被測定的N-或C-末端封閉基團FORMYLATION N-末端甲硫氨酸的GAMMA-CARBOXY-GL天冬酰胺,天冬氨酸,脯氨酸或賴氨酸的 UTAMICACIDHYDR OXYLATIONMETHYLATION通常為賴氨酸或精氨酸的 PHOSPHORYLATION絲氨酸,蘇氨酸,酪氨酸,天冬氨酸或組氨酸的 PYRROLIDONE 已形成內部環內酰胺的N-末端谷氨酸CARBOXYLICACIDSULFATATION 通常為酪氨酸的 LIPID脂質組成成分的共價結合 MYRISTATE通過酰胺鍵與蛋白質成熟形式的N-末端甘氨酸殘基或內部的 賴氨酸殘基結合的豆蔻酸基團 PALMITATE 通過硫酯鍵與半胱氨酸
殘基或通過酯鍵與絲氨酸或蘇氨酸殘基結合的棕櫚酸基團殘基或通過酯鍵與絲氨酸或蘇氨酸殘基結合的棕櫚酸基團FARNESYL 通過硫酯鍵與半胱氨酸殘基結合的法尼基GERANYL-GERANYL通過硫酯鍵與半胱氨酸殘基結合的香葉基一香葉基基團GPI_ANCHOR與蛋白質成熟形式C-末端殘基的a-羧基相連的糖基一磷脂酰肌醇(GPI)基團 N_ACYLDIGLYCERID原核生物脂蛋白成熟形式的N-末端半胱氨酸,所述脂蛋白具E 有酰胺-鍵聯的脂肪酸和通過酯鍵連接了兩個脂肪酸的甘油 基DISULFID 二硫鍵;“FROM”和“TO”終點表示通過一個鏈-內二硫鍵連接的兩個殘基;如果“FROM”和“TO”終點是完通過一個鏈-內二硫鍵全相同的 ,則二硫鍵是鏈一間鍵,而說明書領域示出交聯的性質THIOLEST 硫醇酯鍵;“FROM”和“TO”終點表示通過硫醇酯鍵連接的兩個殘基 THIOETH 硫醚鍵;“FROM”和“TO”終點表示通過硫醚鍵連接的兩個 殘基CARBOHYD 糖基化位點;碳水化物(如果已知)的性質在說明書領域給 出METAL 金屬離子的結合位點;說明書領域示出金屬的性質BINDING 任何化學基團(輔酶,輔基,等等)的結合位點;基團的化學性質在說明書領域給出 SIGNAL信號序列的范圍(前肽) TRANSIT 運轉肽的范圍(線粒體,葉綠體或微體) PROPEP 前肽的范圍CHAIN 成熟蛋白質中多肽鏈的范圍PEPTIDE 被釋放的活性肽的范圍DOMAIN 序列中感興趣的區域的范圍;所述區域的特征在說明書領域 給出CA_BIND 鈣-結合區域的范圍 DNA_BINDDNA--結合區域的范圍 NP_BIND 核苷酸磷酸酯結合區域;核苷酸磷酸酯的特征示于說明書領 域TRANS
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論