计算分子生物学
(
网络版
), 2012
年
,
第
1
卷
,
第
2
篇
,
第
7
-1
5
页
Jisuan Fenzi Shengwuxue (Online), 2012, Vol.1, No.2, 7
-
15
http://cmb.5th.sophiapublisher.com
7
数据分析
An Analysis
基于图像配准分析物种进化关系的新方法
严翠婷
1
,
黄庆生
2
,
章芬
1
,
方颖
1
1
华南理工大学生物科学与工程学院
,
广州
, 510006;
2
中山大学生命科学学院
,
广州
, 510275
通讯作者
: yfang@scut.edu.cn;
作者
计算分子生物学
, 2012
年
,
第
1
卷
,
第
2
篇
doi: 10.5376/cmb.cn.2012.01.0002
收稿日期:
2012
年
03
月
12
日
接受日期:
2012
年
06
月
28
日
发表日期:
2012
年
07
月
09
日
本文首次发表在《基因组学与医学生物学》
(2012
年第
31
卷第
3
期
212-221
页
)
上。现依据版权所有人授权的许可协议,采用
Creative Commons
Attribution License
协议对其进行授权,再次发表与传播。只要对原作有恰当的引用
,
版权所有人允许并同意第三方无条件的使用与传播。
建议最佳引用格式:
引用格式
(
中文
)
:
严翠婷等
, 2012,
基于图像配准分析物种进化关系的新方法
,
计算分子生物学
(online) Vol.1 No.2 pp.7-15 (doi: 10.5376/cmb.cn.2012.01.0002)
引用格式
(
英文
)
:
Yan et al., 2012, A Novel Method for Evolution Analysis based on Image Registration, Jisuan Fenzi Shengwuxue (online) (Computational Molecular
Biology) Vol.1 No.2 pp.7-15 (doi: 10.5376/cmb.cn.2012.01.0002)
摘 要
图像配准是图像处理的一个重要技术,可用于分析两幅图像之间的相似度。本文提出了一种基于图像配准分析物
种进化关系的新方法:首先利用一阶马尔可夫链方法计算不同基因组序列的寡聚核苷酸转移概率矩阵;然后将转移概率矩阵
转换为彩色图像矩阵,并绘制物种两两之间彩色图像矩阵的联合直方图;最后分析联合直方图点集的分布情况,引入直方图
点集的散度公式,将其作为相似性测度的标准,从而鉴定物种亲缘关系的远近。
100
种细菌全基因组的计算结果表明,相较
于单基因法或基于基因组寡聚核苷酸频率组分差异信息的方法,本文提出的新方法具有更高的准确度和分辨力,它不仅能够
很好地分辨科以下的分类单元,对科以上的分类单元同样具有较好的区分效果。该方法有望发展成为物种鉴定及系统发育推
断的有效手段。
关键词
图像配准
;
寡聚核苷酸转移概率矩阵
;
联合直方图散度
;
亲缘关系
A Novel Method for Evolution Analysis based on Image Registration
Yan Cuiting
1
, Huang Qingsheng
2
, Zhang Fen
1
, Fang Ying
1
1 School of Bioscience and Bioengineering, South China University of Technology, Guangzhou, 510006;
2 School of Life Sciences, Sun Yat-sen University, Guangzhou, 510275
Corresponding author: yfang@scut.edu.cn;
Authors
Abstract
Image registration is an important technique in image processing, which could be used to analyze the similarity between
two images. Here, a novel method based on image is proposed to infer the evolutionary relatedness of various microbial organisms.
Firstly, the oligonucleotide transition probability matrices of microbial genomes were calculated by applying 1st order Markov Chain
Method. Secondly, each transition probability matrix was converted into a color image, and then combined with each other to depict
as a joint histogram. Finally, the point set distribution of joint histogram was analyzed, and divergence formula was brought in and
used as the similarity reference standard to determine the evolutionary relatedness of organisms. According to the study results of
100 bacterial genomes, our results suggest that this new method is more accurate and discriminable than the methods based on single
gene or genomic oligonucleotide-based frequency component difference information methods. It not only can distinguish microbial
organism under the family of taxonomy, but also has a better capability to distinguish microbial organism beyond the family of
taxonomy. This method is expected to develop into effective device and apply to species identification and phylogeny inferring.
Keywords
Image registration; Oligonucleotide transition probability matrix; Joint histogram divergence; Phylogenetic relationship
分析物种之间进化关系的传统方法是对同源
基因进行多重序列比对
(Wu and Eisen, 2008)
,但是,
这种基于单个或多个基因的分析方法存在着局限
性,其可靠性依赖于所选择的基因是否能够真实反
映物种的进化历史。并且,该方法的分辨力有限,
它只对种以上的分类单元具有较高的分辨力。据
Mahoko
等人的研究发现,在只利用
16S rRNA
基因
构建物种的系统发育树时,种内菌株虽然能够正确
聚类,但是彼此之间的系统发育关系却无法确定
(Takahashi et al., 2009)
。另一种方法则是基于物种的