计算分子生物学
(
网络版
)
Jisuan Fenzi Shengwuxue (Online)
Copyright © 2015 BioPublisher Jisuan Fenzi Shengwuxue | Vol.4 | No.1 | 1–12
(Proteogenomics)
分析策略的使用极大的改善了这
种情况
(Jaffe, 2004)
。
蛋白质基因组学的分析不仅可以发现基因组
上的新的编码区和修正基因正确的起始和终止位
置,还可以用来鉴定真核生物普遍存在的剪切变异
体。在构建人类全蛋白质组草图的研究中蛋白质基
因组学发挥了重要的作用,
Kim
等
(2014)
人使用该
策略发掘出了
808
个新的人类基因组注释,其中包
括
140
个假基因的翻译,
44
个新的
ORFs
,
106
个
在原有注释基因结构内部的新的编码区或外显子,
110
个基因
/
蛋白质
/
外显子扩展事件,
198
个新的蛋
白质
N
末端和
201
个新的信号肽切割位点。
Zhang
等人对结肠和直肠癌蛋白质基因组学研
究更是表明,虽然
mRNA
和蛋白质的水平有一定
的相关性,但在这些组织体中蛋白质的丰度不能简
单的依据
DNA
或
RNA
水平推导出来,因为有超过
三分之二的相关性是不显著的
(Zhang et al., 2014)
。
拟南芥,玉米和原核生物中,蛋白质基因组的分析
也 展 现 了 良 好 的 发 展 潜 力
(Kucharova, 2014;
Castellana et al., 2014; Castellana et al., 2008)
。
蛋白质基因组学的核心任务是获得足够深度
和广度的蛋白质组,转录组和基因组等数据
,
并将
所获得的组学数据进行整合分析,以便从整体的层
面进行系统生物学研究。蛋白质基因组学的研究过
程中涉及到蛋白质组和基因组数据的获取的工具
适合程度和复杂的分析流程及后续的交叉大数据
分析
(Gong et al., 2014)
。本文综述了在蛋白质基因
组学的研究中的质谱仪的选择和蛋白质基因组学
流程分析软件的研究进展。
1
蛋白质基因组学中的质谱仪的使用
目前,质谱仪种类繁多,适合蛋白质和肽段分
析的质谱仪的原理可以参考已有的相关综述文献
(Ahmed,. 2008; Thelen and Miernyk, 2012)
,表
1
列
出了各种质谱仪的指标。从质谱的分辨率方面大致
可以分为两类,低分辨率如离子阱质谱仪
(ion
traps)
、三级四极质谱仪
(triple quadrupoles)
,高分辨
率如飞行时间质谱仪
(Q-TOF)
,傅立叶变换离子回
旋共振质谱仪
(FTICR)
,轨道阱质谱仪
(Orbitrap)
。
1.1
离子阱质谱仪
离子阱质谱仪,由于其具有高灵敏性和快速的扫描
速度可以确保蛋白质组的高覆盖率,在蛋白质基因
组学研究中使用最为广泛。然而,应用离子阱质谱
仪得到的数据解析度和准确性范围在
0.2~0.5 Da
(200~500 ppm
在
1000 m/z)
,存在一定的局限性。
较低的灵敏度使离子阱质谱仪需要高的质量允差
度
(mass tolerance)
,因此增加了搜索空间并降低了
搜索的准确度。
另外,大多数离子阱质谱仪不具备同时存储所
有的碎片离子的能力,对低质量的碎片离子覆盖率
比较差,并导致最终的模糊不清的肽段分配。这一
局限性已经在新的离子阱质谱仪中得到改进,例
如,通过
pulsed-Q
解离方法。然而在与前体离子的
低质量准确性结合时依然可能出现偏差,从而可能
增大搜索空间并增加蛋白质数据库搜索时的错误
发现率
(false discovery rate) (Krug et al., 2011)
。
1.2
傅立叶变换离子回旋共振质谱仪与轨道阱质谱仪
高灵敏度的质谱仪器,例如
FT ICR
和
Q-TOF
都具有很好的解析度,可以达到亚
-ppm
级的质量灵
敏度,这将可以减低搜索空间并增加蛋白质数据库
搜索时的准确性。然而,高灵敏度的质谱仪存在一
个缺点就是相对较低的数据获取速度,导致在分析
复杂肽段混合物时的采样不足,并进而影响蛋白质
组的覆盖率。
新一代的混合质谱仪则通过低解析和高解析质
谱仪并用的肽段检测方法,解决这一问题。典型的
实例就是线性离子阱静电场轨道阱组合质谱仪
(LTQ-Orbitrip)
,前体肽离子质量在轨道阱质谱仪中
以高的解析度和灵敏度得到测定,而裂解后的肽在
线性离子阱质谱仪中以较高的速度和灵敏性得到测
定
(Wenger et al., 2010)
。最后得到的质谱数据不仅在
肽段测序速度和质量灵敏度方面,而且在蛋白质组
覆盖度和数据库搜索空间方面,取得了很好的平衡。
1.3 LTQ-Oibitrap Velos
最新型的
LTQ-Oibitrap Velos
质谱仪通过混合
一个更快速、更灵敏的双压线性离子阱质谱系统
(dual-pressure linear ion trap)
和一个高灵敏度的
Orbitrap
质谱分析仪,在蛋白质组分析的深度和准
确性方面显示出巨大的潜力。改良后的更高能的碰
撞诱导解离碰撞室
(higher energy collision dissociation,
HCD)
能确保获得高速和高质谱灵敏度的
MS
和
MS/MS
质谱,并且在质量范围内有良好的碎片离子
覆盖度
(Olsen et al., 2009)
。该设备也适合于利用化
学离子源来确保电子转移裂解
(electron transfer
dissociation, ETD)
,这种方法可以获得更全面的多
电荷离子的裂解
(Wenger et al., 2010; Syka et al.,
2004)
,提供适合蛋白质基因组学研究使用的数据。
2
蛋白质基因组学中的计算工具
由于蛋白质基因组学具有相对固定的分析流
程,发展一套完整的类似基因组测序和注释的蛋白
质基因组学的软件是很有必要的,这样不仅可以将
基因组学和蛋白质组学完整的结合,而且方便基因
组的注释
(Renuse et al., 2011)
。适用于串联质谱为基
础的蛋白质组工具众多
(Nesvizhskii, 2010)
,但并不
是所有都适合于蛋白质基因组学。因此,开展蛋白
质基因组学的研究最早开发起来的实用工具的相