分子植物育种
(
网络版
), 2016
年
,
第
14
卷
,
第
1008
-
1015
页
Fenzi Zhiwu Yuzhong (Online), 2016, Vol.14, 1008
-
1015
Copyright © 2016 BioPublisher 1011
1.4
叶绿体和线粒体基因组预组装
由于叶绿体的测序深度较高,我们利用全部
Clean data
组装叶绿体基因组。此时截止覆盖度高
均高于来自线粒体与核数据的覆盖度,因此对其影
响不大。组装后每个样品均得到
6
个
Contigs
,平
均
N50
为
55~58 k
。对这些
Contigs
与
NCBI
公布
的叶绿体基因组进行比对,结果表明所组装的
Contigs
与参照序列有很高的一致性,基本可断定为
叶绿体基因组。
线粒体基因组组装,是叶绿体组装完成后,
以叶绿体基因组为参照序列,从
Clean data
数据
中严格滤除叶绿体的测序
Reads
,组装后,各样
品包含
32~40
个
Contigs
,平均
N50
为
40 k
。对
这些
Contigs
以
NCBI
公布的线粒体基因组为参
考,进行比对,从中筛选出属于线粒体的
Contigs
,
组装
Contigs
的统计结果见
(
表
3)
。
1.5
叶绿体和线粒体基因组的精细化
根据组装得到的
Contigs
,结合参照基因组设计
引物进行
PCR
,对扩增产物进行
Sanger
测序,每个
样品得到序列
30~45
条。利用
Velvet
软件结合第一次
组装的
Contigs
,进行手动拼接。最后得到各自完整
的全长基因组序列
(
表
4)
。
表
3
第一步组装的参数及
Contigs
统计
Table 3 The parameters for primary assembling and statistics on contigs
样品
Sample
期望覆盖度
Expected coverage
截止覆盖度
Cutoff coverage
组装的
N50 (kb)
N50
Contigs
数目
Count of contigs
叶绿体
Cp
线粒体
Mt
叶绿体
Cp
线粒体
Mt
叶绿体
Cp
线粒体
Mt
叶绿体
Cp
线粒体
Mt
RS41
823.44
119.41
130
5
55
40
6
32
RS42
875.26
112.82
130
5
56
43
6
33
RS43
861.57
114.23
130
5
55
43
6
40
RS44
840.16
131.45
150
5
58
43
6
35
RS45
893.99
107.85
130
5
56
45
6
35
表
4
叶绿体和线粒体基因组的总结
Table 4 Sum the genomes of chloroplast and mitochondria
样品
Sample
基因组长度
Genome size
单大拷贝长度
Length of LSC
小大拷贝长度
Length of SSC
反向重复长度
Length of IR
叶绿体
Cp
线粒体
Mt
叶绿体
Cp
线粒体
Mt
叶绿体
Cp
线粒体
Mt
叶绿体
Cp
线粒体
Mt
RS41
153 445
258 463
83 197
121 046
17 816
117 955
26 216
9 731
RS42
153 445
258 462
83 197
121 046
17 816
117 954
26 216
9 731
RS43
153 445
258 853
83 197
121 331
17 816
118 054
26 216
9 734
RS44
153 420
239 697
83 190
118 802
17 764
109 077
26 233
5 909
RS45
153 352
239 696
83 122
118 799
17 764
109 077
26 233
5 910
1.6
基因组结构及基因注释
我们发现,叶绿体和线粒体基因组都呈现双环
或三叶草型结构。都包含
1
个大单拷贝
LSC
,
1
个
小单拷贝
SSC
及
1
对反向重复序列。基因注释结果
表明它们包含了很多重要的自主功能蛋白、
tRNA
及
rRNA
的编码基因。
样品
41
为例,
RS41
萝卜叶绿体基因组全为
153 445 bp
,平均
GC
含量
39.5%
。它包括
1
个大单
拷贝
LSC
,长度
17 816 bp
,
1
个小单拷贝
SSC
,长
度
83 197 bp
和
1
对
IR
反向重复,长度
26 216 bp
。
基因注释结果表明该叶绿体基因组包含
87
个编码
蛋白的基因。均编码已知蛋白。在该基因组中共有