分子植物育种
(
网络版
)
Fenzi Zhiwu Yuzhong (Online)
1186
认为是野生番茄向栽培番茄发展的一个过渡种
(Nesbitt and Tanksley, 2002; Ranc et al., 2008)
。逆转
座子的
copy-paste
转座模式决定了它的每一个转座
事件都会在基因组进化中留下特异的标记,又由于
可以借助两端
LTR
的差异解析其自身存在的时间,
因此含有大量的进化信息。我们分析栽培番茄和醋
栗番茄之间
LTR
逆转座子的等位性分布发现在大部
分时间段内都存在很大比例在两个基因组中分布
相同
(shared)
的
LTR
逆转座元件,表明的确野生番茄
和栽培番茄的基因组序列存在遗传物质交流。在物
种分化后期基因组必然是独立演化的,因此这个时
间以后发生的逆转座子的复制和删除应该是物种
特异的,而在这个时间点之前发生的转座子复制在
两个物种中应该大部分保持相同的分布。栽培和野
生醋栗番茄中
0.25 MYA
以上的时间段内相同分布
的逆转座元件比例均在
50%
以上,但是在
0.25
MYA
以内双方共有的
LTR
元件大大低于其他时
间段
(
约
20%)
,表明在近期栽培种与野生种产生了
较明显的分化,是栽培番茄物种形成的阶段,明显
晚于已知的分化时间。
2.3
逆转座子对功能基因进化的影响
逆转座子的插入位点序列是随机的,而且在真
核生物特别是高等植物中存在大量转座事件,因此
从理论上来说逆转座子可以插入基因附近影响其
功能,甚至进入基因内部破坏其结构。很多研究已
经表明逆转座子可以影响基因的表达,甚至通过自
身含有的转座元件直接调控基因表达
(Roman et al.,
2008)
。基因的启动子包括核心启动子区域和调控区
域,总长度可以在
2 000 bp
以上。我们发现有
930
个
元件位于基因上游
1 000 bp
以内或者位于基因内
部,这些元件在转座过程中很可能会影响基因的表
达调控及生物学功能。除直接插入到基因内部的元
件以外,还有
22
个元件位于基因上游
35 bp
以内,可
以肯定这些元件在转座过程中至少改变了原始基
因的结构或表达水平。
3
材料和方法
3.1
材料
栽培番茄
(
Solanum lycopersicum
)
和野生醋栗
番 茄
(
Solanum pimpinellifolium
)
全 基 因 组 序 列
S_lycopersicum_chromosomes.2.40
和
S_lycopersic-
um_chromosomes.2.40.fa
来源于
ftp://ftp.sgn.cornel-
l.edu/
。
3.2
方法
3.2.1 LTR-
逆转座子的鉴定
用结构分析和同源比对的方法鉴定反转座子
元件。首先用
LTR_STRUC
程序
(Mccarthy and
Mcdonald, 2003)
寻找完整结构的逆转座子,然后利
用其
LTR
序列进行同源比对,并应用
perl
语言编
程从中寻找非完整元件
(truncated elements)
和
solo
元件
(Ma et al., 2004)
。
3.2.2
逆转座子的分类
逆转座子家族的分类方法依据前人的标准修
改后进行
(Wicker et al., 2007)
。对完整逆转座子的
LTR
序列用
clustalW
程序进行聚类分析,计算各个
元件的遗传距离,差异小于
0.2
的转座元件划分为
同一家族。其它同源分析方法得到的转座元件依据
其匹配的相应完整元件确定所属家族。转座子家族
种类的确定
(
copia
或者
gypsy
)
利用最近时间段内发
生转座插入的元件,用
NCBI
的
RPS-BLAST
程
序分析是否存在与
copia
或
gypsy
转座子同源
的反转录酶蛋白序列
(Marchler-Bauer et al., 2009;
Marchler-Bauer and Bryant, 2004; Marchler-Bauer et
al., 2011; Xiong and Eickbush, 1990)
。
3.2.3
转座插入时间鉴定
通过比较完整转座子两端的
LTR
序列来确定
转座子的插入时间。首先用
MUSCLE
程序比对转
座子两端的
LTR
序列
(Edgar, 2004)
,计算比对碱基
的总数和碱基突变的数目,计算得到碱基替换率
(r)
。遗传距离
(K)
用
Jukes–Cantor
方法
(Kimura and
Ohta, 1972)
进行修正。以平均每年每个位点
1.3×10
-8
碱基替换数作为计算转座插入年龄的依据
(Ma and
Jackson, 2006)
。最后转座子的插入时间
(T)
用公式
T
= K/2r
计算得到。
3.2.4
栽培番茄逆转座子在野生醋栗番茄的等位鉴定
依据已有的方法完成
(Tian et al., 2009)
。完整转
座元件的
5'
和
3'
端侧翼序列
(25 bp)
结合转座子本身
边界序列
(25 bp)
用
cross_match
在野生醋栗番茄中
做序列比对,
5'
或者
3'
结合序列在野生番茄基因组
中有良好匹配结果的认为该元件在两个物种中是
都存在的
(shared)
,如果
5'
和
3'
序列均不存在匹配结
果,则该元件在栽培番茄中是特异的
(unshared)
。
作者贡献
许莹修是本研究的构思者及负责人,实验设计,数据