计算分子生物学
(
网络版
), 2012
年
,
第
1
卷
,
第
2
篇
,
第
7
-1
5
页
Jisuan Fenzi Shengwuxue (Online), 2012, Vol.1, No.2, 7
-
15
http://cmb.5th.sophiapublisher.com
9
MG1363
、
Lactococcus lactis
subsp.
cremoris
SK11
以
及
Lactococcus lactis
subsp.
lactis
Il1403 (
分别简写
为
L. la
c_MG,
L. lac_
SK
与
L. lac_
I1)
为乳酸乳球菌
的
3
个不同菌株,其中
Lla
MG
与
Lla
SK
属于同一
个亚种
Lactococcus lactis
subsp.
Cremoris
。一方面
用欧几里徳距离公式计算三者之间的距离,结果显
示,同亚种的
L. la
c_MG
与
L. lac_
SK
的欧几里徳距
离为
0.043 8
;而不同亚种的
L. la
c_MG
与
L. lac_
I1
的欧几里徳距离为
0.062 4 (
表
1)
,即同亚种与不同
亚种这两个分类单元之间的差异仅为
0.018 6
。另一
方面利用联合直方图散度比较上述三个菌株间的
差异,结果发现,同亚种与不同亚种这两个分类单
元之间的差异高达
51.691 4 (
表
2)
。该结果说明了联
合直方图散度比欧几里徳距离更能清晰分辨种内
亲缘关系十分接近的物种。
另外,将
L. lac
_MG
与
Pediococcus pentosaceus
ATCC 25745
、
Staphylococcus aureus
subsp.
aureus
USA300_FPR3757
及
Alkaliphilus metalliredigens
QYMF (
分别简写为
P. pen
_AT,
S. aur
_U
及
A. met
_QY)
进行比较,结果显示,
L. lac
_MG
与同目不同科的
P. pen
_AT
,同纲不同目的
S. aur
_US
及同门不同纲
的
A.met
_Qy
间的欧几里徳距离分别为
0.320 9
、
0.391 8
及
0.382 3
,它们之间差异的平均值仅为
0.047 3
;
而
L. lac_
MG
与
P. pen
_AT
,
S. aur
_US
及
A. met
_Qy
间
的联合直方图散度分别为
1 090.625 1
,
1 291.841 0
及
2 305.814 0
,它们之间差异的平均值为
810.125 9
,即
联合直方图散度能够清晰分辨目以上亲缘关系比较远
的物种。对金黄色葡萄球菌金黄亚种
(
Staphylo coccus
aureus
subsp.
aureus
)
的
6
个菌株以及酿脓链球菌种
(
Streptococcus pyogenes
)
的
6
个菌株进行分析均能得
到上述结论
(
表
3;
表
4 )
。综上所述,联合直方图散度
比欧几里徳距离在鉴定物种进化关系方面具有更
高的分辨力。
1.3
联合直方图散度可作为单基因系统发育树构建
过程的补充
以葡萄球菌属中的
5
个不同菌株为例,其中有
4
个菌株均属于金黄色葡萄球菌,另一个属于腐生
性葡萄球菌。基于
16S rRNA
的核苷酸序列构建它
们的系统发育树,结果显示,同为金黄色葡萄球菌的
4
个菌株,虽然都能够聚类在一起,但是它们之间
的系统发育关系却不明确
(
图
2A)
,也就是说单基因
树无法鉴定出种内菌株的进化关系。而基于物种全
基因组三核苷酸转移概率矩阵的联合直方图散度,
不仅能够将同种的
4
个菌株聚类在一起,还能够很
好地分辨它们之间的系统发育关系
(
图
2B)
。因此,
当单基因建树法无法分辨亲缘关系十分接近的物
种时,可引入联合直方图散度这一参数,对其进行鉴
定分析。换言之,联合直方图散度可作为单基因系统
发育树构建过程的补充。在鉴定酿脓链球菌同种内
的
6
个菌株时,同样能够得到上述结果
(
图
3)
。
图
2
葡萄球菌属内
5
个菌株的系统发育树
注
: A:
基于
16S rRNA
核苷酸序列构建的系统发育树
; B:
基
于基因组三核苷酸转移概率矩阵的联合直方图散度构建的
系统发育树
Figure 2 The phylogeny tree of 5 strains of
Staphylococcus genus
Note: A: The phylogeny tree based on 16S rRNA nucleotide
sequence constructed by neighbor-joint method; B: The phylogeny
tree based on joint histogram divergence of genomic trinucleotide
transition probability matrix
图
3
Streptococcus pneumoniae
TIGR4
的色彩矩阵图
注
:
横纵坐标分别表示转移前后的三核苷酸模式
Figure 3 The color matrix of
Streptococcus pneumonia
TIGR4
Note: The horizontal axis and the longitudinal axis represent
the kinds of combination of trinucleotide respectively