许莹修
:
番茄基因组逆转座子的鉴定与演化分析
1185
图
4
共享元件在不同时间段的比例
Figure 4 Ratios of shared elements at time slices
体结构。插入基因序列附近甚至内部的逆转座子元
件对于基因组的演化具有较直接的影响,可能在物
种进化过程中起到了重要作用。我们比较了栽培番
茄中所有逆转座元件与基因的相对位置,结果发现
有
930
个元件位于基因序列附近
(
与基因序列
5 '
端
距离小于
1 000 bp
或位于基因内部
)(
表
4)
。
2
讨论
2.1
番茄基因组中逆转座子的数量和分布
我们用结构分析和同源比对方法在番茄基因
组中鉴定到
15 036
个逆转座元件,总共
86.1 Mb
,
占测序序列总长度
(759.9 Mb)
的
11.3%
。这些元件
不包括零散的难于精确识别的逆转座子序列片
断。其中完整元件有
2 068
个,只有总数的
13.7%
,
说明大多数元件的结构已经随着时间的流逝通过
突变和各种消除机制被破坏。从转座时间分布来
看也符合这种推测。番茄完整转座子的转座插入
时间峰值在
2.5 MYA
左右,在这之后就迅速下
降。而在大豆基因组中逆转座子随时间的接近数
量不断增加,转座插入时间峰值在
0~0.5 MYA (Du
et al., 2010)
,玉米中
LTR
逆转座子也表现出相似
的分布模式
(Baucom et al., 2009)
,说明番茄中大
多数逆转座元件相对古老,发生突变和结构变化
的比例会更高。
表
4
位于基因附近或内部的元件
Table 4 Elements close to or inside genes
距离
Distance
内部
Inside
≤35bp
36bp-100bp
101bp-500bp
501bp-1000bp
总数
Sum
数量
Number
270
22
56
281
301
930
逆转座元件变异迅速,种类繁多,并没有统一
的分类系统。依据
pol
基因编码产物的排列顺序和
序列同源性
LTR
转座子可分为
copia
和
gypsy
两个
主要类型。我们依据前人的一些标准
(Wicker et al.,
2007)
用同源分类方法将番茄中逆转座子分为
330
个家族,其中鉴定到
copia
类
(182
个
)
远多于
gypsy
(80
个
)
,但是从元件数量上来看
copia
类
(5 314
个
)
却少于
gypsy
(8 978
个
)
,并且含有
1 000
个以上元
件的三个家族都是
gypsy
类型。因此,
copia
逆转
座元件的多态性较高,而
gypsy
在进化中相对保守。
研究表明逆转座元件的转座插入位置序列并
没有特异性,是随机的过程。但是逆转座子在染色
体上的分布有一定的差异,通常在基因较多的区
域,逆转座元件相对较少,而基因密度小的区域逆
转座元件相对较多
(Baucom et al., 2009)
。这种不均
匀可能是由于逆转座子在转座时对特定区域有一
定选择性或者是由于逆转座子的消除机制更多地
作用于常染色质区,也可能是不同区域所面对的选
择压力差异的反映。番茄中逆转座元件在
12
条染
色体上分布大体均匀,数量基本与染色体序列长度
成正比,表明对于不同染色体来讲,逆转座子的转
座并没有选择性。
2.2
番茄中逆转座子的转座时间及种间差异比较
逆转座子的转座机制决定了它们在转座后两
端的
LTR
序列是完全一致的,因此比较完整转座子
两侧
LTR
序列就可以依据其碱基突变率计算其年
龄。同时由于逆转座子的转座插入是随机的过程并
且转座事件在物种进化的各个时期都在不断进行,
因而可以为研究物种及其基因组的分化和演化提
供丰富的信息。由地理隔离发展到生殖隔离,即种
群间不存在基因交流是物种形成的条件和标志,许
多作物栽培种群的形成是人为阻断基因交流并产
生生殖隔离的过程。多位点突变率计算表明栽培番
茄与醋栗番茄在
1.4 MYA
发生分化
(Nesbitt and
Tanksley, 2002)
,同时研究表也明栽培番茄的起源和
驯化伴随着野生番茄基因的不断渗入
,
而樱桃番茄
S. lycopersicum
var.
cerasiforme
(
S. l. cerasiforme
)
被