Page 22 - 2011no111

Basic HTML Version

洪彦彬等
, 2011,
植物
SNP
的开发研究进展
,
分子植物育种
(online) Vol.9 No.111 pp.1807-1817 (doi: 10.5376/mpb. cn.2011.09.0111)
1810
然而,由于多倍化通常与遗传瓶颈关联,祖先二倍
体基因组往往比四倍体含有更多的遗传变异,这无
疑增加
SNP
开发的难度。而对于其他物种如六倍体
小麦,直接对三套基因组的扩增子测序是不够的,
因为基因组间存在的插入
/
缺失使测序结果分析困
难,甚至无法分析。对此,变通的方法是采用基因
组特异引物进行扩增子测序
(
序列只来自其中的一
套基因组
) (Ganal et al., 2007)
。此法已在几个小麦
SNP
鉴定的项目中实施,现已设计出几千对基因组
特异性引物
(URL: http://wheat.pw.usda.gov/SNP)
用于扩
增子测序和小麦品种间的
SNP
分析
(Ravel et al., 2006;
Chao et al., 2009)
3
问题与展望
SNP
开发过程中,为了避免由于资源库遗
传背景狭窄所造成的测量偏倚,必须仔细挑选一套
具有代表性的材料。只从少数几个感兴趣的品系或
带有不同等位基因频率的材料中鉴定出的
SNP
能在其他与之差异明显的资源中没有多态性或者
用处不大。通过大量扩增子测序并结合品系混合基
因池测序可在最大程度上避免测量偏倚,后者的目
的在于估计等位基因频率。将来,利用第二代测序
技术能够在一个特定的资源库中同时分析大量品
系,届时等位基因频率能被可靠地估算。
目前,不管从整个基因组或者只针对基因的编
码区进行大规模
SNP
开发仍面临很大挑战,因为完
成主要作物的全基因组测序还需要一定时间。例
如,虽然现在玉米基因组的序列草图已经可用
(URL:
http://www.maizesequence.org)
,但为完成剩余序列
的测序,至少仍需要
1~2
年甚至更长时间才能够得
到高质量的玉米全基因组序列,而对于像大麦和小
麦等基因组大于
5 pg
的作物,将需要花费更多时
间。
由于全基因组测序只是大规模
SNP
鉴定的开
始,在主要二倍体作物中通过测序几个个体去获得
详细的
SNP
数据将需要更长时间。而对尚未完成全
基因组测序的植物,大规模鉴定
SNP
的最可靠方法
仍是扩增并测序尽可能多的基因。对于已获得完整
全基因组序列的植物,利用第二代测序技术对全基
因组进行重测序是大规模开发
SNP
并进行全基因
组关联分析的不二选择。最近在拟南芥
(Atwell et al.,
2010)
和水稻
(Huang et al., 2010)
上的两个研究成果
已充分展示全基因组重测序结合第二代测序技术
的强大能量。
Huang
(2010)
采用第二代测序技术
Solexa
517
个水稻地方品种进行全基因组重测
序,从中鉴定出大约
360
万个
SNP
位点,构建了超
高密度的水稻单倍型图谱,并在此基础上对
14
农艺性状进行全基因组关联分析。该研究标示着水
稻全基因组关联作图时代的到来。
除了前面提到的
SNP
开发方法之外,目前人
们正对一种涉及序列捕获的
SNP
鉴定新方法颇感
兴趣。这种方法已成功用于探测人类基因组外显子
区域的
SNP (Hodges et al., 2007)
。其原理是利用基
因序列
(
如外显子
)
合成芯片,并通过与基因组总
DNA
杂交富集目的
DNA
,接着用第二代测序技术
测序。最后以芯片上的序列为参考序列,快速而有
效地鉴定大量
SNP
。然而,此法迄今尚未在植物上
应用。由于该法同样能捕获旁系同源序列,它在直
系同源序列中鉴定
SNP
的成效如何尚不清楚,将其
应用于异源多倍体或古多倍体
(
如玉米
)
则更具挑战
性。
随着基因分型芯片平行分析
SNP
的数量
(10 000~60 000)
不断增加,精确测序显得格外重要。
为开发成千上万个伴随着
25%~50%
误差率或者没
有单倍型信息的
SNP
而设计芯片是不明智的,因为
用于鉴定假阳性
SNP
或者来自同一单倍型的几个
SNP
的费用比利用可靠但不高效的
SNP
鉴定方法
多花的费用还高。就此而言,先进的生物信息学筛
选算法和高精度测序将和第二代测序技术一样变
得非常重要。
4
结语
尽管当前几种大规模
SNP
开发方法被证明
行之有效,在第二代测序技术的推动下,多数植
物的
SNP
开发速度也将加快,但在
SNP
大规模
用于关联分析和育种研究之前,仍存在许多需要
解决的难题。由于短期内无法获得主要农作物的
完整全基因组序列,
SNP
开发应主要通过分析尽
可能多的品系和基因。即使缺乏全基因组序列,
利用扩增子重测序或者序列捕获技术并结合第二
代测序技术,我们仍将能够在几年时间内从一种
作物
30 000~60 000
个基因中鉴定出
SNP
或单倍
型。此外,我们的重点应该放在能反映育种材料真
正遗传变异的
SNP
开发上,经过验证的
SNP
可通
过作图群体进行精确定位。
目前,许多作物上大范围的
SNP
分析仍基于
个体型
SNP
。将来,为了像分析人类基因组一样更
有效地进行关联分析,需要转向单倍型特异性
SNP