Susan R. McCouch & CGSNL (Committee on Gene Symbolization,
Nomenclature and Linkage, Rice Genetics Cooperative), 2008, Gene Nomenclature System for Rice, Rice, 1(1):72-84 (doi:10.1007/s12284-008-9004-9)
1019
表
1 CGSNL
建议的已测序基因分类规则
Table 1 Rules for Classifying Sequenced Genes as Suggested by the CGSNL
类型
Categories
分类法
Classification
标准手册
Standard protocol
描述
Description
类型Ⅰ
Category
Ⅰ
和已知功能水稻蛋白相同
Identical to rice protein with known
function
和已知水稻蛋白的相同性
>=98%,
长度覆盖度
=100% [blastx]
Identity > = 98%, length coverage=100%
to known rice protein [blastx]
赋予相同原始的基因名称
Receive the same, original gene
name
类型Ⅱ
Category
Ⅱ
与已知蛋白相似
Similar to a known protein
与已知蛋白相似性
>=50% [blastx]
Identity > = 50% to a known protein. [blastx]
赋予
“
原始推测基因名称
”
Receive
“
original gene name,
putative
”
类型Ⅲ
Category
Ⅲ
InterPro
蛋白结构域
InterPro domain-containing protein
不在分类
Ⅰ
或
II,
但包含
InterPro
结构域
Not in category
Ⅰ
or
Ⅱ
, but contains InterPro
domain
赋予
“InterPro
名蛋白结构域
名称
”
Receive
“
InterPro name
domaincontaining protein
”
类型Ⅳ
Category
Ⅳ
保守假设蛋白
Conserved hypothetical protein
与假设蛋白的相同性
>=50%,
长度覆盖度
>=50%
[blastx]
Identity > = 50%, length coverage > = 50%
to hypothetical protein [blast x]
赋予
“
保守假设蛋白
”
Receive
“
conserved
hypothetical protein
”
分类Ⅴ
Category
Ⅴ
假设蛋白
Hypothetical protein
不属于分类
Ⅰ
到Ⅳ
If no t in category
Ⅰ
to
Ⅳ
赋予假设蛋白
Receive
“
hypothetical protein
”
注
:
像
CGSNL
建议的
,
上述了一个根据与已报告研究基因的序列相似性来对测序基因进行分类的系统
;
在粳稻
Nipponbare
基因组中存在的预测或已知的基因根据序列分析可以分为五类
(
栏
1);
只有在有充实的实验证据证明一个基因在序列上和一
个已知功能水稻基因相同
,
基因才被分配给一个基因名和基因符号
(
分类Ⅰ
);
如果证据支持不充分以分配给其一基因功能
(
分
配为分类Ⅱ
-
Ⅴ
),
这个基因名称字段将留空
,
描述或定义字段
(
栏
2
和
4)
将被用来记录有关这个基因的特征和阐释
Note: This describes a system for classifying sequenced genes into categories based on their sequence similarity to previously
reported genes, as recommended by the CGSNL; The genes predicted and
/or known to be present on the
O. sativa
ssp.
japonica
cv.
Nipponbare, based on sequence analysis are classified into five categories (column 1). Genes are assigned a gene name and a gene symbol
only if there is substantial experimental evidence confirming that a gene is identical in sequence to a previously characterized rice gene of
known function (category I). If the evidence is considered insufficient to substantiate assigning a gene function (assigned categories II
–
V),
the gene name field is left empty and the description/definition field (columns 2 and 4) is utilized to document what is known about the
characteristics of the gene
参考。审订过基因名和符号的基因将和一个基因功
能或表型相关联,在一切可能的情况下,在登记的
时间研究人员被要求为来自
RAP
注释数据库的新
基因标示一个系统座位标识符。在任何可能的情况
下,为系统座位
IDs
在其他注释数据库
(
即
TIGR, BGI
等
)
建立联系。因此,在注册登记的时间,当一个系
统座位标识符被提供给
CGSNL
的时间,组装和注释
的版本也必须被储存以提供全面的细致的相关档
案。如果可能,
GenBank
或
DDBJ
登录号也应该被提
供。这将有助于确保在
述的交叉参考信息的正
确和适用性。
水稻假分子之间的交叉索引需要人工认真的
选择和整理。就旁系同源基因,特别是当串联排列
时,基因模型结构中在多套相同基因组序列组装版
本之间存在的细微差别都会带来巨大的挑战。如果
研究人员对一个新基因的这些特定性状谙熟,自己
将处于最有利的位置为提供这个基因准确信息方
面,这将确保不同水稻基因组注释差别之间的渐进
改进和更新。
2
水稻中染色体名和基因符号命名规则
应这个命名法系统的需要,一个基因被定义为一段
有已知或预测功能或表型的
DNA
序列。那些测序的
基因如果没有实验证明的明确功能或表型,
CGSNL
将不会分配其一个基因名或基因符号
(
。那些功
能或表型已经被经典遗传学确认的基因,但如果没
有和其关联的序列,将分配给一个基因名和基因符
号,但也许不会分配给一个系统座位
ID
。
2.1
染色体名称
以
Khush
和
Kinoshita (
Khush and Kinoshita, 1991
)