Page 25 - 2011no59

Basic HTML Version

梁翠等
, 2011,
大白菜单一基因微卫星标记的电子遗传图谱
,
分子植物育种
Vol.9 No.59 (doi: 10.5376/mpb.cn.2011.09.0059)
1444
度遗传图谱提供了可能。
芸薹属植物不同种间表现出基因的高度同源性
(Lagercrantz and Lydiate 1996; Parida et al., 2010)
。如
大白菜与甘蓝型油菜之间
88.6%
的基因具有同源性
(Parida et al., 2010)
Kim
(2009)
发现大白菜的部分
染色体片断在基因组中存在
2
3
次重复。本研究
通过分布于连锁群的
UGMS
标记序列的同源性分析
和比较,进一步证实了大白菜基因的多拷贝现象。
在构建的大白菜
UGMS
电子遗传图谱中,
62.8%
UGMS
标记为多位点
UGMS
。其中
2
位点的
UGMS
标记最多
(33.6%)
,其次为
3
位点
(11.1%)
4
位点以
上的
UGMS
占总
UGMS
数量的
12.2%
。这些多位点
UGMS
标记覆盖了大白菜基因组。
大白菜
UGMS
标记在基因组中的重复出现表
明这些标记并非是染色体位置唯一的。即使
UGMS
引物扩增出单一位点,也不能确定该标记在染色体
的位置。因此,多位点
UGMS
标记不能准确应用于
分子标记辅助选择,或作为锚定标记应用于遗传图
谱的构建。这就需要开发出基于单拷贝基因的微卫
星标记或单位点
SSR
标记。根据大白菜
JWF3p
传图谱中
BAC
克隆的序列,本研究共检测到
837
个单位点
UGMS
标记。在大白菜全基因组序列破译
后,这些标记还需要进一步的分析和验证。
3
实验材料与方法
3.1
序列来源
2008
11
12
日前登录在
NCBI
上的大白菜
182 703
EST
序列
(http://www.ncbi.nlm.nih.gov)
这些序列用于分析微卫星在大白菜基因组中的分
布。
BrGSP (multinational
Brassica rapa
Genome
Sequencing Project)
公布的
499
个大白菜
BAC
(Bacterial Aritificial Chromosome)
克 隆 序 列
(http://www.brassica-rapa.org)
。这些
BAC
克隆分别
位于大白菜
JWF3p
遗传图谱的
10
个连锁群。
3.2 EST
前处理
利用
EST-trimmer (http://pgrc.ipk-gatersleben.de/
misa/download/est_trimmer.pl)
去除
5’
端和
3’
50 bp
内重复次数大于
5
次的
poly A/T
,对于大于
700 bp
的序列保留其
5’
端,小于
100 bp
的序列则剔除。其
次,利用
Seqclean
去除污染序列,包括载体序列
(ftp://ftp.ncbi.nih.gov/pub/UniVec)
、叶绿体和线粒体
序列
(http://www.arabidopsisi.org/)
3.3 EST
拼接和单一基因的获得
预处理后的
EST
序列利用
CAP3
软件进行序列
的拼接。参数为在至少
40
个核苷酸的重叠区域内,
最小匹配百分比大于或等于
95%
EST
序列可得
到拼接与延伸。为获得非冗余单一基因,将拼接后
产生的拼接体序列进一步进行
BLAST
分析。去除
冗余序列按照以下标准进行:
( )
如果
2
个或者更
多的拼接体序列一致,但长短不同,则保留最长的
拼接体为单一基因;
( )
如果拼接体是通过重叠的
SSR
或多聚
A/T/G/C
拼接而成,则将所有
EST
作为
单一基因;
( )
如果拼接体是通过序列中的未知碱
(N)
拼接而成,且未知碱基大于
30 bp
,则剔除此
类拼接体。通过以上步骤得到的单一基因用于后续
分析。
3.4
微卫星的筛选
软件
MISA(MIcroSAtellite identification tool;
http://pgrc.ipk-gatersleben.de/misa)
用来搜寻
UGMS
搜索长度为:单核苷酸为
18
个以上
(
包括
18
)
二核苷酸的重复次数为
6
次以上
(
包括
6
)
,三、
四、五和六核苷酸的重复次数为
5
次以上
(
包括
5
)
。搜索的
UGMS
包括完全型
[
例如
: (AT)8]
、复
合 型
[
例如
: (AT)3(CT)7]
和间断型
[
例如
: (AT)
6CA(AT)5]UGMS
3.5
电子遗传图谱的绘制
利用
BLAST
软件将含
SSR
的单一基因与
499
个大白菜
BAC
克隆
(http://www.brassica-rapa.org)
行序列同源性分析,搜索出包含
SSR
序列同源区的
BAC
克隆。参数为
E-value≤10
-
10
,比对长度
(
包括
SSR
序列
)≥100 bp
。根据搜索结果,将包含在
1
BAC
克隆的
SSR
称为单位点
UGMS
,而位于
1
以上
BAC
克隆的
SSR
称为多位点
UGMS
根据
JWF3p
遗传图谱中的
BAC
克隆位置,利
Mapchart 2.1
软件构建大白菜
UGMS
电子遗传图
谱,并分析
UGMS
标记在大白菜
10
个连锁群中的
分布特点。
UGMS
标记命名为
U_XX_YYY (XX
表连锁群,
YYY
代表序号
)
,如
U_03_102
代表
A03
中的第
102
UGMS
。在
10
个连锁群中,每个连
锁群选择
2
SSR
标记作为构建电子遗传图谱的
锚定标记
(Kim et al., 2009)
选择在大白菜基因组中重复次数最多的果胶
酸裂解酶基因,利用华中农业大学开发的
Complinkage V 0.1.2
构建该基因的比较遗传图谱
(
孟金陵
, 2010,
私人通讯
)
。该软件的主要功能之一
是将位于不同位点的标记通过连线方式连接起来。
作者贡献
梁翠是本研究的实验设计和实验研究的执行人;王哲、
倪梦及黎瑞源参与实验设计,试验结果分析;朴钟云及孟金
陵是项目的构思者及负责人,指导实验设计,数据分析,论
文写作与修改。全体作者都阅读并同意最终的文本。