计算分子生物学
(
网络版
), 2012
年
,
第
1
卷
,
第
3
篇
,
第
16
-
22
页
Jisuan Fenzi Shengwuxue (Online), 2012, Vol.1, No.3, 16
-
22
http://cmb.5th.sophiapublisher.com
16
研究论文
Research Article
原核生物基因组三核苷酸转移概率偏倚的物种特异性及致病关联性
章芬
1
,
黄庆生
2
,
严翠婷
1
,
吴建华
1
1
华南理工大学生物科学与工程学院
,
广州
, 510006;
2
中山大学生命科学学院
,
广州
, 510275
通讯作者
:
wujianhua@scut.edu.cn;
作者
计算分子生物学
, 2012
年
,
第
1
卷
,
第
3
篇
doi: 10.5376/cmb.cn.2012.01.0003
收稿日期:
2012
年
03
月
12
日
接受日期:
2012
年
06
月
28
日
发表日期:
2012
年
07
月
12
日
本文首次发表在《基因组学与应用生物学》
(2012
年第
31
卷第
3
期
205-211
页
)
上。现依据版权所有人授权的许可协议,采用
Creative Commons
Attribution License
协议对其进行授权,再次发表与传播。只要对原作有恰当的引用
,
版权所有人允许并同意第三方无条件的使用与传播。
建议最佳引用格式:
引用格式
(
中文
)
:
章芬等
, 2012,
原核生物基因组三核苷酸转移概率偏倚的物种特异性及致病关联性
,
计算分子生物学
(online) Vol.1 No.3 pp.16-22 (doi:
10.5376/cmb.cn.2012.01.0003)
引用格式
(
英文
)
:
Zhang et al., 2012, The Correlation between Species-specificity and Pathogenicity of Trinucleotide Transition Probability Bias in Prokaryotic Genomes,
Jisuan Fenzi Shengwuxue (online) (Computational Molecular Biology) Vol.1 No.3 pp.16-22 (doi: 10.5376/cmb.cn.2012.01.0003)
摘 要
作为
DNA
序列的重要组成特征,基因组寡核苷酸使用模式及其偏倚的研究已被广泛应用于原核生物基因组的分
析。然而,关于寡核苷酸使用模式的偏倚是否具有种群特异性并反映种群的功能这一问题,尚未阐明。我们基于一阶马尔可
夫链模型,提出了一个度量寡核苷酸使用模式偏倚的新指标——基因组三核苷酸
(trinucleotide, tri-)
转移概率偏倚
(transition
probability bias, TPB)
特征向量,或称之为三核苷酸转移概率最大偏倚分布,并分析比较了
727
条有代表性的原核生物基因组
序列
tri-TPB
特征向量。结果表明,基因组
tri-TPB
特征向量具有物种特异性,亲缘关系越近的物种,它们的
tri-TPB
特征向
量越相似;同种内之不同菌株具有几乎完全相同的
tri-TPB
特征向量,并且不依赖于基因组的
GC
含量;此外,基因组
tri-TPB
特征向量的相似性与菌株的致病性特征相关。本研究结果为基于全基因组寡核苷酸组成和分布信息的物种及其致病性进
化分析提供了新的思路和方法。
关键词
原核生物
;
三核苷酸转移概率偏倚
;
分子进化
;
物种特异性
;
致病性
The Correlation between Species-specificity and Pathogenicity of Trinucleotide
Transition Probability Bias in Prokaryotic Genomes
Zhang Fen
1
, Huang Qingsheng
2
, Yan Cuiting
1
, Wu Jianhua
1
1 School of Bioscience and Bioengineering, South China University of Technology, Guangzhou, 510006;
2 School of Life Sciences, Sun Yat-sen University, Guangzhou, 510275
Corresponding author: wujianhua@scut.edu.cn;
Authors
Abstract
As important characteristics of DNA sequence compositions, genomic oligonucleotide usage pattern and its bias study
have been widely used in the analysis of prokaryotic genomes. Nevertheless, it remains unclear whether the bias of the genomic
oligonucleotide usage pattern possesses species-specific properties of the genomes and reflects species functions or not. Based on a
Markov chain model, a novel index — the characteristic vector of trinucleotide transition probability bias (tri-TPB), namely the
distribution pattern of maximum trinucleotide transition probability bias, was proposed to measure the oligonucleotide usage pattern
bias. 727 representative prokaryotic genomes were analyzed and compared their characteristic of tri-TPB vector. Our results showed
that the closer the phylogenic relationship is, the more similar the characteristic of tri-TPB vectors is; especially, an almost identical
characteristic vector tri-TPB pattern remains seen nearly in all genomes within the same species, is independent of genome GC
contents. In addition, it was indicated that the similaritis of characteristic vectors of genomic tri-TPB patterns correlate closely with
the pathogenicity of bacterial strains. The present results provide us a new perspective for the analysis of genome evolution and their
pathogenicity evolution in genomic oligonucleotide composition and distribution.
Keywords
Prokaryote; Trinucleotide transition probability bias; Molecular evolution; Species-specificity; Pathogenecity