分子植物育种
(
网络版
)
Fenzi Zhiwu Yuzhong (Online)
1182
框
(ORF)
,编码转座所需的各个蛋白组分。依据编
码各组分的序列排列顺序的不同和序列同源性
LTR
逆转座子大体分为
Ty1-
copia
和
Ty3-
gypsy
两类
(Havecker et al., 2004)
。
LTR
逆转座子在真核生物中
含有大量拷贝,是构成基因组尤其是高等植物基因
组序列的主要组分
(Baucom et al., 2009; Du et al.,
2010; International Rice Genome Sequencing Project,
2005; Ma et al., 2004; Schnable et al., 2009)
。碱基突
变和序列重组是基因组变异的主要来源,而逆转座
子通过转座、删除机制可以产生大量的序列变化,
带来丰富的遗传信息,因此分析研究逆转座子的分
布和变化是了解基因组进化发展和生物演化的重
要手段。
番茄是重要的经济作物和研究果实发育的模
式植物,许多研究工作都尝试在番茄基因组中进行
逆转座子的分析鉴定
(Rogers and Pauls, 2000; Su
and Brown, 1997; Yañez et al., 1998)
,而且番茄中已
开发出基于逆转座子序列的多态性较高的分子标
记系统
(Tam et al., 2005)
。逆转座子在栽培番茄基因
组演化和物种形成中起到了重要的作用,包括其复
制和转座对功能基因的影响。例如逆转座子
Rider
介导的一个
SUN
基因的重复使得其表达水平升高,
从而改变了番茄果实的形态
(Xiao et al., 2008)
。
Rider
是一个近期活跃的家族,部分成员已经被分
离鉴定,研究表明
Rider
可能是在
1~6
百万年
(MYA)
之间,通过水平转移方式进入番茄基因组的
(Cheng
et al., 2009; Jiang et al., 2009)
。再比如一个
copia
逆
转座子插入到一个高活性的酯酶基因附近,增加了
它的表达量,降低了其底物酯类的水平,从而影响
了番茄果实的味道
(Goulet et al., 2012)
。番茄全基因
组序列测定的完成,为全面分析其
LTR
逆转座子提
供了条件,测序结果也表明番茄基因组中含有大量
逆转座子序列
(The Tomato Genome Consortium, 2012)
。
本研究基于番茄全基因组测序结果,利用生物
信息学方法从整个基因组水平鉴定逆转座子,对其
组成、分布特点和种类等进行分析,对其在栽培和
野生醋栗番茄之间的差异进行了比较,并探讨了逆
转座子在番茄物种演化和基因功能进化中的作用。
1
结果和分析
1.1
逆转座子及相关组分的分离鉴定和分类
用
LTR_STRUC
程序对整个基因组进行分析,
分离得到
1 825
个结构完整的候选转座子。人工检
测确定
1 410
个结构完整清晰的元件作为进一步研
究的基础。用
perl
编写程序,在番茄基因组中分析
上一步得到的转座子同源序列,得到
676
个完整元
件,
9 408
个非完整元件及
3 542
个
solo
元件,共计
15 036
个
(86.08 Mb)
,占基因组测序序列的
11.02%
(
表
1)
。另外检测到
284.04 Mb
的同源
DNA
片段,
占基因组序列的
36.19%
。完整元件共
2 086
个,序
列总长度
15.80 Mb
,单个长度介于
943 bp
和
23 668 bp
之间,平均
7 605 bp
。
表
1
番茄基因组中的
LTR
转座子序列
Table 1 LTR retrotransposon sequences in tomato genome
完整元件
Intact element
不完整元件
Truncated element
Solo
元件
Solo element
片断
Fragment
总和
Total
结构方法
LTR_STRUC
1 410
/
/
/
1 410
同源方法
Homologous
676
9 408
3 542
/
13 626
总数
Total
2 086
9 408
3 542
/
15 036
平均大小
(bp)
Average size (bp)
7 605
7 026
1 171
/
/
总碱基数
(Mb)
Total size(Mb)
15.83
66.10
4.15
284.04
370.12
占基因组比例
(%)
Genome ratio (%)
2.03
8.46
0.53
36.19
47.21