分子植物育种 - page 5

分子植物育种
(
网络版
), 2016
,
14
,
1008
-
1015
Fenzi Zhiwu Yuzhong (Online), 2016, Vol.14, 1008
-
1015
1009
类型
(Ogura, 1968)
,我国育种者也从不同的地方品
种中发现了萝卜雄性不育株,均属于
Ogura
不育类
(
陈黎明等
, 2009;
程计华等
, 2008)
。然而,
Ogura
胞质雄性不育机理目前尚不明确。此外,我们
发现,同属于
Ogura
不育类型的品种,其保持
和恢复关系仍有一定差别。研究表明胞质雄性
不育与叶绿体或线粒体基因组的突变或结构变
异密切相关。
另一方面,进行叶绿体、线粒体基因组组装,
在研究植物进化、分类、遗传多样性等方面有重
要的意义。而对基因组进行基因注释,是探讨植
物光合作用机理、植物能量代谢、植物抗氧化及
次生代谢的基础。
为揭示萝卜雄性不育的不育机理,并为植物
细胞器基因组研究提供基础数据。我们选择了
3
个来源不同、并且保持关系有一定差别的
Ogura
不育材料、
1
个未知类型不育材料及
1
个具有正
常细胞质的材料,进行了线粒体和叶绿体基因组
的测序、数据过滤、
Kmer
分析、组装及基因注
释。以期通过比较不同类型材料基因组间的序列
差异,寻找与育性有关的基因及
SNP
变异。
1
结果与分析
1.1
测序数据
Raw data
Clean data
分析
本研究的
5
个萝卜样品测序的下机数据均为
Fastqc
格式,数据读长为
90 bp
,共获得
Raw data
18 108 266
Reads
。根据对
Raw data
的质控检验,
GC
含量均为
42.5%
。经去除测序重复、
Adaptor
测序污染后,最终得到
Clean data
1.25 G (
1)
1.2
数据过滤及各组分的比率
NCBI
公布的萝卜基因组组装序列
(NCBI
Accession Number: GCA_000715565.1)
及萝卜的叶
绿体、线粒体基因组为参考基因组
(NCBI Accession
Number: KJ716483, AB694744.1)
,进行
BWA
比对,
通过对
Sam
文件进行数据过滤,分别得到了叶绿
体、线粒体的测序数据
(
2)
5
个供试样品的叶绿体测序深度均较高,平均
值为
858.3
,而线粒体测序深度平均为
117.2
。分析
结果表明,在叶绿体和线粒体的
DNA
提取过程中,
已经去除了绝大多数细胞核基因组组分,核基因组
的平均覆盖度仅为
0.2
1.3
基于
Kmer
频度分析过滤样品测序数据
利用
Jellyfish
软件对
5
个样品的原始数据进行
21 mer
分析,未见高频度的
Kmer
分布。估测的分
子量大小为
8 234 k
,是预期线粒体,叶绿体基因组
40
倍和
55
倍。推测此时有部分核基因组片段可
以形成弥散分布的
Kmer
,而导致无法正确判断分
子量。这样的数据若直接用于基因组的组装拼
接,会形成冗余的
Contigs
。由于这些
Contigs
来自
三个组分,并不是
1
个整体,不能组装到
1
个完整
的基因组
(
1)
1
测序原始数据及
Clean
数据统计
Table 1 Count of Raw data and clean data obtained in this research
样品
Sample
原始数据
Raw data
净数据
Clean data
Reads
总数
Reads count
总碱基数
Base count
Q20
比率
(%)
Ratio of Q20 (%)
Reads
总数
Reads count
总碱基数
Base count
Q20
比率
(%)
Ratio of Q20 (%)
RS41
3 395 010
308 945 910
79.09
2 685 113
244 345 283
97.11
RS42
3 474 478
316 177 498
77.11
2 679 170
243 804 470
98.54
RS43
3 635 602
330 839 782
78.22
2 843 768
258 782 888
95.43
RS44
3 855 842
350 881 622
73.09
2 818 235
256 459 385
99.02
RS45
3 747 334
341 007 394
74.69
2 798 884
254 698 444
95.89
Total
18 108 266
1 647 852 206
76.44
13 825 170
1 258 090 470
97.20
1,2,3,4 6,7,8,9,10,11,12
Powered by FlippingBook