I 介绍
II 转录的启动
III 转录因子家族
III.1 螺旋-转角-螺旋蛋白
III.2 锌指蛋白
III.3 亮氨酸拉链蛋白
III.4 螺旋-环-螺旋蛋白
在真核细胞中,存在三种不同的RNA聚合酶(RNA Pol)。每种转录是由不同的RNA聚合酶进行的:聚合酶I转录rRNA(核糖体RNA),聚合酶II mRNA(信使RNA)和聚合酶II tRNA(转运RNA)和其它的小片段RNA。任何对起始转录有帮助的蛋白质均为转录因子。许多转录因子识别形成启动子或增强子的顺式作用元件。但是,与DNA结合并不是转录因子起作用的唯一方式。一个转录因子可以识别另一个转录因子,或者识别RNA聚合酶。在真核生物中,转录因子本身并不是酶,主要负责识别启动子。
转录因子能够结合每个启动子中包含的特定的保守的短序列。这些短序列元件和识别它们的因子中有一些是很普遍的,可在多种启动子中找到并构成性使用。其余的具有特异性,它们的作用受到调节。
RNA 聚合酶II的辅助因子可分为3个大类:
RNA 聚合酶II本身不能启动转录,而是完全依赖于辅助转录因子(称为TFIIX,其中“ X”是标识单个因子的字母)。这些因子与酶一起组成了转录任何启动子所需要的基本(或最小)的装置。
识别启动子的效率和特异性取决于TATA区上游更远处的短序列,这些序列可以被上游因子和诱导因子识别。其中的例子如CAAT盒,它在决定启动子的效率中起着重要作用,并在不同的启动子中被不同的因子识别,例如可以与CTF家族的因子相互作用,因子CP1和CP2、因子C/EBP和ACF以及GC盒(GC盒被因子Sp1识别)。这些因子能够通过蛋白质之间的相互作用而作用。其主要目的是将它们结合的因子带到起始复合物附近,在那里蛋白质与蛋白质的相互作用决定了起始反应的效率。
图1:基础转录装置组装的示意图模型
在不同的转录因子中可以找到与DNA结合的常见基序。其中有几组蛋白质可以通过特定的基序结合DNA来调节转录:
螺旋-转角-螺旋基序作为DNA结合域最早发现于噬菌体的阻遏蛋白中。一个螺旋位于DNA的主沟中,另一个螺旋与DNA呈一定角度。在同源域中存在另一种相关形式的基序。同源域是首先在与果蝇发育相关的基因编码的几种蛋白质中定性的一个序列。这种结构也存在于哺乳动物转录因子中。同源域基因是编码60个氨基酸序列的DNA片段。同源结构域负责与DNA结合;DNA识别特异性取决于同源域。其C-ter区域与原核抑制因子的螺旋-转角-螺旋基序具有同源性。
锌指基序包含一个DNA结合域。它最早是在TFIIIA因子中发现的,RNA 聚合酶III转录5S rRNA基因需要这种TFIIIA因子。锌指蛋白因其结构而得名,锌指结构保守氨基酸残基与锌离子结合形成手指样结构。有两类与DNA结合的蛋白具有这种结构:经典的锌指蛋白和类固醇受体。
锌指蛋白通常含有多个锌指;单个锌指的共有序列为:
Cys-X2-4-Cys-X3-Phe-X3-Leu-X2-His-X3-His
该基序根据锌结合位点凸起的氨基酸环命名,被称为Cys2 / His2指。
锌指蛋白含有一连串锌指;锌指区的范围有大有小,有的包含9个重复序列覆盖几乎整个蛋白质(如TFIIIA),有的只包含2个锌指,组成一个较小的结构域;转录因子Sp1具有一段由3个锌指组成的DNA结合域。锌指的C端形成一个α螺旋,结合DNA; N端形成一个β折叠。每个锌指C端的非保守氨基酸负责识别特定的靶位点。
通过结合特定的类固醇(例如糖皮质激素,甲状腺激素,视黄酸)和一些其他蛋白质而被激活的类固醇受体具有另一种类型的锌指。该结构具有与锌结合的共有同源序列:Cys-X2-Cys-X13-Cys-X2-Cys
这些被称为Cys2 / Cys2锌指。与Cys2 / His2锌指的串联重复序列不同,具有Cys2 / Cys2锌指的蛋白质通常都含非重复锌指。DNA的结合位点是短而回文的。糖皮质激素受体和雌激素受体各含2个锌指,它们形成α螺旋,进一步折叠形成球状结构域。
亮氨酸拉链由一段富含亮氨酸残基的氨基酸组成,这些残基形成一种二聚化基序。二聚体化可以将每个亚基的DNA结合区并行排列。一个亮氨酸拉链形成一个双向螺旋,其中一个蛋白质拉链的氨基酸可以从螺旋中伸出,并与另一个平行蛋白质拉链的亮氨酸交错排列形成一个盘绕的卷曲。每个拉链蛋白中邻近亮氨酸重复的区域都是高度碱性的,能成为结合DNA的一个位点。两个亮氨酸拉链形成一个Y形结构,其中拉链组成了茎部,两个碱性区域简单地分叉,对称地形成DNA结合臂。即bZIP结构基序。它解释了为什么这些蛋白质的靶序列是无间隔的反向重复序列。拉链可用于同源或异二聚体的形成。在蛋白质C / EBP中有4个重复单位(C / EBP作为二聚体结合CAAT盒和SV40核心增强子的一个因子),在Jun和Fos因子中有5个重复单位(二者形成异源二聚体转录因子AP1)。
两亲性螺旋-环-螺旋(HLH)基序已经在一些发育调节因子和编码真核DNA结合蛋白的基因中发现。具有这种基序的蛋白质既具有结合DNA的能力,又有形成蛋白质二聚体的能力。它们具有共同类型的序列:一段40-50个氨基酸的序列中含有2个两亲性的α螺旋,两螺旋被一个不同长度的连接区分开。这组蛋白通过两个螺旋相应表面的疏水残基的相互作用形成同源二聚体和异源二聚体。这些两亲性螺旋形成二聚体的能力是所有HLH蛋白都具有的。
大多数HLH蛋白在HLH基序附近有一个高度碱性的,对DNA结合非常重要的区域。含有这类区域的蛋白质称为bHLH蛋白。两个亚基都含有碱性区的二聚体,可以与DNA结合。 bHLH蛋白分为2大类。 A组包含普遍表达的蛋白质,包括哺乳动物的E12 / E47。 B组包含以组织特异性方式表达的蛋白质,包括哺乳动物MyoD,Myf5,肌生成素和MRF4(一组参与肌生成的转录因子,称为肌发生调节因子,MRF)。组织特异性bHLH蛋白可以与广泛存在的配偶体形成异源二聚体。在黑腹果蝇中还有一组基因产物控制神经系统的发育(其中Ac-S是组织特异性成分,而da是广泛存在的组分)。这类蛋白质形成bHLH蛋白质的一个特殊类型。
王凯~Sheng Xiao
Atlas of Genetics and Cytogenetics in Oncology and Haematology 2024-04-19
转录因子
Online version: http://atlasgeneticsoncology.org/teaching/209223/