Susan R. McCouch & CGSNL (Committee on Gene Symbolization,
Nomenclature and Linkage, Rice Genetics Cooperative), 2008, Gene Nomenclature System for Rice, Rice, 1(1):72-84 (doi:10.1007/s12284-008-9004-9)
1026
Os05g0000300
的转录本,代表染色体
5
上的基因
3
。
有时初期的转录本要经历选择性剪切。为了清楚的
分辨转录本的不同剪切体,两位数的后缀将被加入
到基因的系统转录
ID
中,通过一个破折号,按照发
现的顺序分开,例如,-
01
,-
02
,-
03
,
....
-
99
。默
认的第一个转录本
(
或唯一鉴定的转录本
)
的转录
ID
常常有编码“-
01
”座位转录
ID
的后缀。例如,座
位
Os05g0000300
的转录
ID
,已知没有其他的剪接变
异体,将是
Os05t0000300
-
01
。如果以后有报告说明
这个座位有选择性剪切,如有三个选择性剪切体,
如果三个中有任何一个和原始的转录本匹配,其就
将作为原始的转录本
ID
保留,而另外其他两个
ID
就
是
Os05t0000300
-
02
和
Os05t0000300
-
03
。剪切变异
体分配的编号序列将基于鉴定过程、
GenBank
提交
或可能
cDNA
的大小。任何附加的不同剪切体将依
次编码。
4.4
蛋白
ID
一个基因序列或转录本通过实验或计算所推
演出的所有多肽将被分配给一个和转录本标识符
一样的系统标识符,除了标示转录本的字母‘
t
’被
标示蛋白质的‘
p
’代替,这也保证了和基因座位
ID
和其转录本
ID
的一致性。例如,蛋白
Os05p000-
0300
-
01
翻译于转录本
Os05t0000300
-
01
,其又转录
于代表了染色体
5
的基因
3
的座位
Os05g0000300
。为
了避免单一座位不同转录选择性剪切体带来的蛋
白质的混淆,蛋白质
ID
必须反应和其推衍出的对应
的转录本,除了字母‘
t
’。
4.5
未锚定在测序克隆上的基因
未在
BAC/PAC
克隆上锚定而鉴别出的基因依
然使用命名法系统,据此基因随后标识测序中心分
配的数字作为
BAC/PAC
克隆名称的后缀
(
例如
,
F23H14.13)
。上边简述的系统座位
ID
命名法系统中,
在这个区间的序列可以完全组装和完整时,将取代
克隆的名称。在一些情况下,早期克隆为基础的座
位标识符必须成为基因同义名或不同的
ID
。
5
座位的增加、删除、编辑、合并和拆解
5.1
编辑一个座位
一个特定座位的标识符、基因全称和基因符号
在通常情况下其使用要具有一定的一致性。在基因
的功能没有任何大的变动,尤其是在没有任何的变
化导致座位的起始位点没有变化的情况下,一致性
是可以被保持的。例如,命名法的一致性在基因编
码的是一个
ORF
和注释修订变化仅在内含子-外显
子的边界处的情况下是可能的,序列相同,要求外
显子或内含子的增删,或功能或相关表型的改变或
修饰的情况下,保持座位分配的一致性。与此相似,
在
ORF
定义的注释、基因的全称、符号和
GenBank/DDBJ/EMBL
定义的记录更新变化,应该
放映分子结构或功能的变化,但在以上的所有情况
下,座位
ID
保持不变。
5.2
删除一个座位
计算方面鉴定的基因当被实验证据证明是假
阳性的时间,就必须删除这个座位。这种情况下,
所 有 的 记 录 和 对 应 的 标 识 符 应 该 被 标 示
OBSOLETE
并保留,永远不能从数据库存储中删
除。标示
OBSOLETE
确保相同的标识符不再一次被
一个新的座位使用,因此避免了混乱情况的出现,
如有需要,一个废除的基因还可以提供参考。
5.3
拆分一个座位
这种情况一般是一个座位标识符实际上代表
多于一个基因时
(
例如
,
两个基因被自动预测方法
错误的鉴别为两个基因
)
,最接近座位开始位置的座
位将保留原始的座位标识符、基因名和基因符号,
远离座位开始位点的基因将被作为一个新的鉴定
座位,并按照上述的方法赋予一个新的座位标识
符、基因名和基因符号。在适用的情况下,基因名
和基因符号的修订应该符合其新的功能。
5.4
座位的合并
在有实验证据
(
如全称
cDNA
序列
)
证明两个先
前鉴定的基因实际上是一个基因或是同一个座位
的一部分的情况下,这两个座位必须合并为一个。
新的座位必须保留最靠近新的合并座位起始位置
的座位标识符、基因名和基因符号。对第二个基因
来说,座位标识符变成了次级座位
ID (
和第一个关
联
)
,第二个基因的名称和符号也借此成为第一个的
同义名。
5.5
转座因子座位
ID
分配给包含一个转座因子
(TE)
座位的
IDs
和基
因座位的相似,不同是基因座位
ID
中的‘
g
’为‘
te
’