Susan R. McCouch & CGSNL (Committee on Gene Symbolization,
Nomenclature and Linkage, Rice Genetics Cooperative), 2008, Gene Nomenclature System for Rice, Rice, 1(1):72-84 (doi:10.1007/s12284-008-9004-9)
1022
筑波市举办的水稻注释计划
(RAP
-
1)
会议的参会人
员同意,数据库的管理人员可以使用一个标准的
“
证据分类
”
系统来表明证据的类型或出版提供的有
关核基因注释的实验证据。有关这些分类的描述可
以在
到。如
CGSNL
规定
:
如果证据被认为不足
以证明分配的基因功能,这个基因名字段将保留空
白,描述
/
定义字段将被用来对这个基因特征的已知
内容的进行描述
(
。
2.3
基因符号
基因符号是基因全称的缩写,用斜体表示。一
个基因符号包括两个部分,即基因的分类符号包括
2
到
5
个字母,和对应的座位标识符包括
1
到
3
位
字符。基因符号衍生于先前讨论的基因名全称,因
此和基因名全称一样使用相同的座位标识符。基因
符号的两部分应该写到一起,中间不留空格、连字
符或其他符号
(
例
:
SH1
,
GLH2
)
。基因分类号和座位
标识符一起组成了基因符号,必须对这个座位和基因
组来说是唯一的。基因符号的分配原则就是容易和一
个基因名全称对应并辨识。在任何地方,如何存在的
标识符如果不能完全符合这个规则,就应该被保留,
例如:
C
(
CHROMOGEN FOR ANTHOCYANIN
)
,
A
(
ANTHOCYANIN ACTIVATOR
)
和
WX
(
GLUTINOUS
ENDOSPERM
)
。对任何没有座位标识符的基因符号
来说,会被默认为座位标识符为
“1”
,例如,
GLUTINOUS ENDOSPERM
(
WX
)
应 该 指 定 为
GLUTINOUS ENDOSPERM 1
(
WX1
)
。所有具有相似
特性的新基因将被
CGSNL
根据发现的顺序分配给
一个新的座位标识符。
CSGNL
将保证先前鉴证的
基因符号和新鉴定登记的基因分配到一个唯一的
基因符号,避免名称和符号的混淆。
使用后缀
“(t)”
和
“*”
来表明一个假设性的座位
标识
(
当一个新的描述基因和一个先前已知基因
的等位基因关系不是很清楚
(
Kinoshita,
1986))
被暂
时使用,在假定其为新的座位的情况下,新基因
将被分配给一个新的座位标识符。如果这个新基
因在以后被证明和原来已知座位是等位的,两个
相关记录将被合并,最初的基因符号将被按照程
序规则采纳。其他符号将会作为同义词引用。以
前分配的基因符号将不会删除,这可以避免相同
符号重新使用导致的混乱。分配一个符号给一个
基因的时候应像上边描述的那样,保持和基因名
全称的一致性。
作者在其文章种涉及到已知功能的水稻基因
的时间,一定要引用核准的基因名全称和符号,如
果有可能要引用基因组注释中心之一的系统座位
ID
和
GenBank
登录号。当完整的信息不存在的情况
下,除非有额外的实验证据的提供,否则系统座位
ID
或基因符号将不会被使用。只有通过
CGSNL
的审
查,基因名才可以被分配使用。
3
物种名在基因名和符号中的使用
出版物中在基因名和基因符号前使用物种特
异性前缀如
“Os” (
O.sativa
)
也许是有用的,但这并不
在官方已经命名规则中,因为对已经和物种信息关
系的递交
/
注册基因来讲显得有些冗余。而且,也会
导致基因名
Oryza sativa-X
的扩散。基因和物种之间
的关系会在所有的基因组数据库和学历数据库中
清楚的保留。然而,作者可以在出版物中附加上物
种特殊性的前缀,以此来避免在任何时候参考一个
基因时所带来的物种名重复。在任何情况下,物种
符号都不应该变成被采用的基因符号或基因名全称
的一部分。特别需要指出的是,符号
“Os”
在系统座
位
ID
中是允许使用的,例如,
Os05g0000530
、
LOC_
Os03g01590
和
OsIBCD000082
这些分别为
RAP (http://
rapdb.lab.nig.ac.jp/index.html)
、
TIGR (http://www.
tigr.org/tdb/e2k1/osa1/tigr_gene_nomenclature.shtml)
和
BGI-RIS (http://rise.genomics.org.cn/rice/index2.jsp)
数据库所采用。
3.1
等位基因变异体
同一个基因的不同的等位基因是通过添加数
字后缀来区分的,数字和基因全称或基因符号之间
有破折号或连字符分开,例如,
SHATTERING
1
-
1(SH1
-
1)
,
PGI1
-
1
和
PGI1
-
2
。在历史上,有几种
情况下曾用过字母
(t)
或星号
(*)
而不是数字来指明
一个等位基因,因为这些字母符号在描述等位基因
变异体时广泛使用并被水稻遗传研究学界接受,这
些字符将在出版物中作为例外保留,并将在数据库
中作为同义名标明。
3.2
显性/隐性关系
历史上,基因全称是全部小写斜体,如果文献
中第一个等位基因是显性的就以一个大写字母开
头,如是隐性就以小写字母开头。由近来在大规模