分子植物育种
(
网络版
), 2016
年
,
第
14
卷
,
第
1062
-
1071
页
Fenzi Zhiwu Yuzhong (Online), 2016, Vol.14, 1062
-
1071
Copyright © 2016 BioPublisher 1064
TALEs
蛋白分子结构包含有
N-
端转运信号
(Translocation signal)
;
C-
端含核定位信号
NLSs
(Nuclear localization signals)
和酸性转录激活域
AD
(Acidic activation domain)
;以及中间串联重复区,
中间的串联重复区则由多个串联排列的重复序列单
元组成,每个重复序列单元一般含
33~35
个高度保
守的氨基酸,其中第
12
和
13
位氨基酸可变,被称
为重复可变双残基
RVD (Repeat-variable di-residue)
(Boch and Bonas, 2010;
赵开军和杨兵
, 2012)
,研究
发现
TALEs
的
RVD
可特异性识别
DNA
碱基,其规
律为:
NI
识别
A
,
NG
识别
T
,
HD
识别
C
,
NK
识
别
G
,
NN
识别
G
或
A
,
NS
可识别
A
,
C
,
G
,
T(Boch
et al., 2009; Moscou and Bogdanove, 2009)
。
基于
TALEs
蛋白中的
RVD
的两个氨基酸特异
识别和结合一个碱基的原则,因此,如果
TALE
要
特异识别和结合某一核酸序列
(
靶位点
)
,理论上可
以按照靶位点的序列,将多个对应
TALE
重复单元
经过串联就可以定制出特异识别
DNA
序列的
TALE
蛋白,在
TALE
蛋白的
C
端融合一个非特异
的核酸内切酶
Fok
Ⅰ就构成了可以用于靶向基因组
编辑的
TALEN
单体。
TALENs
技术对生物基因组
特定位点产生剪切作用与
ZFNs
类似,由两个
TALE
蛋白识别和结合
DNA
靶位点,
Fok
Ⅰ核酸酶负责对
靶
DNA
进行切割,从而造成
DNA
的
DSBs
,诱发
细胞的
DNA
损伤修复机制,从而实现对基因组靶
位点的编辑。
TALENs
的合成与组装相对于
ZFNs
要简单和
灵活,其关键是要合成
TALE
蛋白串联重复区的编
码
DNA
序列,理论上将多个
TALE
重复单元编码
的
DNA
序列通过多次连接即可实现,但是要合成
这种高度重复序列也具有一定的困难和挑战。目前,
已经开发出多种快速、简便合成和组装
TALENs
方
法,如
Golden gate (GG)
组装法
(Weber et al., 2011;
Zhang et al., 2011)
,快速高通量固相合成法
(Fas
t Ligation-based Automatable Solid-phase High-
throughput, FLASH) (Reyon et al., 2012)
和基于
长粘末端的
LIC (Ligation-independent cloning)
组
装方法
(Schmid-Burgk et al., 2013)
等。
1.3 CRISPR-Cas
技术
CRISPR-Cas
是
2013
年出现的由小分子
RNA
介导的一种靶向基因组编辑新技术,该技术是基于
原核生物
(
细菌和古菌
)
一种免疫系统而开发的,称
之为
Clustered regularly interspaced short palindro-
mic repeats-CRISPR-associated proteins (
规律成簇间
隔短回文重复及其相关蛋白
)
,简称
CRISPR-Cas
系
统
(Sorek et al., 2008; Charpentier and Doudna,
2013)
。由于该技术合成简单、周期短、操作灵活、
效率高等优点,目前备受人们关注。
CRISPR-Cas
系统是一类广泛分布于原核生物基
因组的重复结构,由不连续的高度保守的正向重复序
列
(Repeat, R)
与长度相近的间隔序列
(Spacer, S)
排列
组成的
R-S
结构,称之为
CRISPR
基因座
(CRISPR
locus)
,在
R-S
结构第一个重复序列上游是前导序列
(L
eader)
,作为启动子可以启动
CRISPR
基因座的转录,
在
CRISPR
基因座附近还存在一些保守的
CRISPR
相
关蛋白基因
(cas gene)
。因此,由
Cas
蛋白基因、前
导序列和
CRISPR
基因座共同构成
CRISPR-Cas
系
统
(Horvath and Barrangou, 2010) (
图
1)
。
图
1 CRISPR
基因结构
注
: S1, S2, Sn
分别表示不同的间隔序列
(Spacers); R
表示同
向重复序列
(Repeats)
Figure 1 The structure of CRISPR gene
Note: S1, S2 and Sn represent different Spacers respectively; R
represents Repeats
CRISPR-Cas
系统能够降解入侵的噬菌体、质
粒等外源核酸物质,使原核生物
(
细菌和古菌
)
具有
适应性免疫能力,根据参与作用的
Cas
蛋白基因的
序列和结构特点,
CRISPR-Cas
系统可分为Ⅰ、Ⅱ
和Ⅲ型三种类型
(Makarova et al., 2011; Wiedenheft
et al., 2012)
,其中Ⅰ和Ⅲ型
CRISPR-Cas
系统需要
多种蛋白质参与才能形成具有功能的
Cas
蛋白复合
体
(Brouns et al., 2008; Liu and Fan, 2014)
,而来自于
化脓链球菌
(Streptococcus pyogenes)
的Ⅱ型的
CRISPR-Cas
是三种类型中最简单的系统,仅需要
一种
Cas9
蛋白
(Garneau et al., 2010; Zhang et al.,
2014)
。在该系统中,入侵的外源核酸片段作为间隔
序列
(Spacer)
在前导序列与第一段重复序列之间的
位置,整合到
CRISPR locus
中,然后转录成长链的
CRISPR RNAs
前 体物
(pre-crRNAs)
, 与
tracr
RNA(trans-activating crRNA)
部分互补配对,然后在
Cas9/RNAseIII
加工下形成成熟的
tracr RNA
:
crRNA
复合物,通过
crRNA
与入侵
DNA
上原间隔
序列
(Proto-spacer)
碱基互补配对,从而引导
Cas9
蛋
白到原间隔序列的区域,该过程需要在靶标
DNA
上有一段保守的
PAM
(
Protospacer adjacent motif)
序列,对于Ⅱ型
CRISPR
系统一般为
5′-NGG-3′
序
列。然后
Cas9
酶的
HNH
剪切域切割与
crRNA
互
补的
DNA
链,
RuvC-like
域则剪切非互补的
DNA
链,从而造成该位点的
DSB
,降解入侵噬菌体核酸
或质粒
(Liu and Fan, 2014)
。
2012
年,
Jinek
等
(2012)
报道了将
crRNA
和
tracrRNA
的序列通过
4
个碱基环形结构相连构成一