Page 20 - 2011no14

Basic HTML Version

张强等
, 2011,
玳玳花咖啡酸甲基转移酶基因的电子克隆及序列分析
,
分子植物育种
Vol.9 No.14 (doi: 10.5376/mpb.cn.2011.09.0014)
1102
质素的合成而受到广泛的研究。虽然名为
COMT
因,咖啡酸并不是
COMT
酶喜欢的作用底物,它首
选的作用底物是咖啡醛
(caffeoyl aldehyde)
5-
羟基
松柏醛
(5-hydroxyconiferaldehyde) (Osakabe et al.,
1999; Li et al., 2000; Dixon et al., 2001; Parvathi et al.,
2001)
;另外一些
II
OMTs
则催化黄酮、类黄酮、
苯丙烷类和多酚类化合物的甲基化。目前,已经从
很多物种中克隆了植物
OMTs
基因,它们的分子分
析、共同特性和分类已经被综述
(Ibrahim et al., 1998)
玳玳花
(Citrus aurantium)
,又名玳玳橘、回青橙、
回春橙,是芸香科柑桔属常绿灌木,分布于我国南
部各地,多见于扬州、苏州。玳玳花春末夏初盛开,
其花香浓郁,沁人心脾,为我国南方常见的香花植
物。花蕾含挥发油,油中主要含柠檬烯
(Limonene)
芳樟醇
(Linalool)
、牻牛儿醇
(Geraniol)
、香茅醇
(Citronellol)
、缬草酸
(Valericacid)
等。迄今为止,还
未见到有玳玳花中
OMTs
基因被克隆的报道。随着分
子生物学技术和基因组科学的发展,
Genbank
数据
库中的表达序列标签
(expressed sequence tags, ESTs)
信息日渐丰富,电子克隆
(
in silico
cloning)
正是基于
数据库中大量已克隆测序的
ESTs
信息于近年来发
展起来的一门快速克隆基因的新技术,其技术核心
是利用生物信息学技术组装延伸
ESTs
序列,获得基
因的部分乃至全长
cDNA
序列进一步利用
RT-PCR
的方法进行克隆分析、验证。在本研究中,我们在
利用同源克隆的方法从玳玳花的花瓣中获得了一
个植物
OMTs
片段的基础上,利用电子克隆的方法
推断出了序列全长,并经过
RT-PCR
和测序验证,同
源比对发现与
COMT
基因具有较高的相似性而被命
名为
CaCOMT (GenBank
登录号
: HM641694)
,最后,
对它进行了序列分析和功能预测。
1
结果与分析
1.1
玳玳花
COMT
序列全长的扩增
以玳玳花花瓣的
cDNA
为模板,用
OMT5
OMT3
的引物组合进行
PCR
扩增,对
250 bp
左右的亮带切
胶回收
(
1A)
,连接到
pGEM-T
载体,测序,获得
玳玳花
OMT
序列片段。对
NCBI
blastn
结果表明,获
得的
OMT
序列片段,与
COMT
基因序列有较高的同
源性;对
NCBI
EST
数据库进行电子克隆最终获得
玳玳花
COMT
基因序列全长,用全长引物
COMTW5
COMTW3
进行
RT-PCR
验证,发现扩增得到的序
列大小在
1 000 bp
左右,与预期大小基本相符
(
1B)
。测序结果表明,玳玳花
COMT
基因的
ORF
框为
1 101 bp
,与电子克隆推断的序列仅存在
3
个碱基的
差别,但推断的氨基酸编码序列完全相同,命名为
CaCOMT
1
玳玳花
OMT
基因的克隆
: A:
玳玳花
OMT
基因片段的扩增
; M: DL2000 Marker; 1:
OMT
基因片段
; B:
玳玳花
OMT
基因全长的扩增
; M: DL2000
Marker; 1, 2:
OMT
基因全长
Figure 1 The cloning of
OMT
gene from Citrus aurantium
Note: A: Amplification of
OMT
fragment from Citrus aurantium;
M: DL2000 Marker; 1:
OMT
fragment; B: Amplification of the
cDNA full length of
OMT
from Citrus aurantium; M: DL2000
Marker; 1, 2: the cDNA full lenth of
OMT
1.2 CaCOMT
序列分析
利用
DNAStar
软件的
EditSeq
程序对玳玳花
CaCOMT
氨基酸组成、分子质量、等电点分析发现,
CaCOMT
蛋白分子量为
39 985.27 Daltons
,等电点为
5.76
,由
366
个氨基酸组成,其中,正电荷氨基酸
(K,
R) 33
个,负电荷氨基酸
(D, E) 41
个,疏水氨基酸
(A,
I, L, F, W, V) 138
个,极性氨基酸
(N, C, Q, S, T, Y) 87
个。在
NCBI
CDD (Conserved Domain Database)
据库
(
网址为
http://www.ncbi.nlm.nih.gov/Structure/
cdd/wrpsb.cgi)
CaCOMT
蛋白序列进行结构特征
分析发现
(
2)
,从
35
86
个氨基酸为蛋白二聚化
(Dimerisation)
结构域,在许多植物甲基转移酶基因
N
端存在,从
104
341
个氨基酸为甲基转移酶结
构域,能够利用
S
腺苷甲硫氨酸作为甲基的供体。利
DNAMAN6.0
MEGA4.0
软件对植物
OMTS
进行
多重序列比对并利用
NJ
法构建系统进化树
(
3)
,结
果表明,
CaCOMT
CbCOMT
CbIEMT
NtOMT1
BpCOMT
EgCOMT
RcOMT2
MsCOMT
AtCOMT
聚为一类,与
RcOMT2
MsCOMT