Facteurs de Transcription


Contributor(s)

Written 2003-01-01 Valentina Guasconi~Hakima Yahi~Slimane Ait-Si-Ali
CNRS


Content

Facteurs de Transcription


I Introduction

II Initiation de la transcription

III Les différentes familles de facteurs de transcription

III.1 La famille Hélice-Tour-Hélice

III.2 La famille de protéines à doigts de zinc

III.3 La famille des facteurs à glissière à leucine

III.4 La famille Hélice-Boucle-Hélice


     I Introduction

Chez les eucaryotes, il existe trois différentes ARN polymérases (ARN pol). Chacune de ces ARN pol est responsable de la transcription d'un type d'ARN : l'ARN pol I transcrit les ARN ribosomiques (ARNr) ; l'ARN pol II transcrit les ARN messagers (ARNm) ; enfin, l'ARN pol III transcrit les ARN de transfert et les petits ARN (ARNt). Toute protéine nécessaire à l'initiation de la transcription est définie comme un facteur de transcription. Plusieurs facteurs de transcription agissent en reconnaissant directement des séquences cis-régulatrices au niveau des régions promotrices des gènes. Cependant, la liaison à l'ADN n'est pas toujours requise pour l'action d'un facteur de transcription. Un facteur de transcription peut ainsi reconnatre un autre facteur de transcription qui lui lie l'ADN directement, ou bien reconnatre directement l'ARN polymérase.

Les facteurs de transcription reconnaissent généralement des petites séquences d'ADN conservées contenues au niveau des promoteurs de leurs gènes cibles. Certains de ces facteurs et de ces séquences sont communs à plusieurs gènes et utilisés de manière constitutive, et d'autres sont spécifiques de gènes et leur activité est régulée.

Les facteurs de transcription qui coopèrent avec l'ARN polymérase peuvent êtres divisés en trois groupes :

-Les facteurs généraux de transcription, qui sont nécessaires à l'initiation de la synthèse de l'ARN au niveau des gènes de classe II (gènes codants pour des protéines). Ils forment avec l'ARN pol II un complexe au niveau du site d'initiation de la transcription et déterminent ainsi le site de démarrage de la transcription ; ce complexe est appelé complexe basal de transcription.

-Les facteurs de transcription généraux et spécifiques de séquence, qui reconnaissent des petites séquences d'ADN localisées en amont du site de démarrage de la transcription (comme le facteur SP-1 qui reconnat les botes GC). Ces facteurs sont ubiquitaires, ils augmentent l'efficacité de la transcription des gènes contenant les botes GC dans leurs promoteurs.

-Les facteurs de transcription spécifiques de séquence et inductibles, qui possèdent un rle régulateur. Ils sont synthétisés ou activés d'une manière spécifique de tissu. Les séquences qu'ils reconnaissent sont appelées les éléments de réponse.

     II Initiation de la transcription

L'ARN polymérase II ne peut pas initier la transcription par elle-même, pour cela, elle est dépendante de facteurs auxiliaires (appelés TFIIX, o X est une lettre identifiant des facteurs individuels). L'ARN pol II et ces facteurs auxiliaires constituent ensemble la machinerie transcriptionnelle de base qui est nécessaire à la transcription de tous les gènes de classe II (Figure 1).

L'efficacité et la spécificité avec lesquelles un promoteur de classe II est reconnu dépendent de petites séquences d'ADN, en amont de la bote TATA, ces séquences sont reconnues par les facteurs de transactivateurs ou inductibles. C'est le cas par exemple des botes CAAT, qui jouent un rle important dans la détermination de l'efficacité d'un promoteur, et elle est reconnue sur différents promoteurs par différents facteurs, comme les facteurs de la famille CTF, les facteurs CP1 et CP2, ou les facteurs C/EBP et ACF. Ces différents facteurs ont également la capacité d'interagir entre eux. La présence de ces facteurs sur un promoteur détermine le taux de transcription du gène cible.

Figure 1: Modèle schématique d'assemblage de la machinerie basale de transcription

Une succession dtapes met en jeu des éléments du promoteur, l'ARN polymérase II et des facteurs généraux de la transcription. La première étape est constituée par la fixation du facteur de transcription TFIID sur la bote TATA. Le facteur TFIIA stabilise l'association TFIID/bote TATA. Puis le facteur TFIIB se fixe sur le facteur TFIID fixé sur la bote TATA. TFIIB recrute l'ARN polymérase II et le facteur TFIIF. Les facteurs TFIIE et TFII H se fixent, suivis par des facteurs supplémentaires complétant le complexe de transcription: Le facteur TFIIH présente une activité protéine kinase. Une phosphorylation de l'ARN polymérase est réalisée sur la plus grosse sous-unité de l'enzyme riche en sérine et en thréonine (partie C-terminale). La phosphorylation sur sites spécifiques déclenche le début de la transcription: De plus, arrivée au bout du promoteur, l'ARN polymérase II doit être libérée du complexe des facteurs de transcription généraux pour démarrer la transcription. La phosphorylation d'une des sous-unités de l'ARN polymérase est indispensable pour déplacer l'enzyme du complexe d'initiation de la transcription.


     III Les différentes familles de facteurs de transcription

Les facteurs de transcription dits trans-régulateurs sont des protéines particulières produites par d'autres gènes. Ces protéines présentent des caractéristiques structurales communes, avec au moins au minimum deux domaines:

-Un domaine de fixation à l'ADN : Des motifs structuraux particuliers ont été décrits avec : les homéodomaines, les domaines dits à ' doigts de zinc ', les glissières à leucine. (Voir plus bas) ;

-Un autre domaine, dit d'action sur la transcription. On rencontre différents types de domaines d'activation de la transcription. Des domaines riches en glutamine, des domaines riches en proline et des domaines organisés en hélice alpha riches en résidus à charge négative (hélice alpha acide) ;

-Certains facteurs trans-régulateurs possèdent un troisième domaine qui permet de fixer un élément annexe permettant de réaliser l'action d'un message extérieur à la cellule, comme un message hormonal. On a pu ainsi définir la superfamille des récepteurs nucléaires (stéroïdes, vitamines D, hormones thyroïdiennes, acides rétinoïques, acides gras polyinsaturés...). Enfin, l'action des facteurs trans-activateur peut être elle-même régulée par d'autres facteurs avec modification des facteurs trans en réponse à une stimulation extérieure: phosphorylation, protéolyse etc...

Plusieurs familles de facteurs de transcription ont été ainsi définies selon les domaines de liaison à l'ADN utilisés.

 III.1 La famille Hélice-Tour-Hélice

Le motif hélice-tour-hélice a été identifié dans un premier temps comme le domaine de liaison à l'ADN de répresseurs de phages. Mais une forme similaire à ce domaine a été ensuite retrouvée dans les homéodomaines, une séquence caractérisée sur plusieurs protéines impliquées dans la régulation du développement de la Drosophile ; elle existe aussi dans plusieurs facteurs de transcription de mammifères. Le domaine homeobox est une séquence de 60 acides aminés, responsable de la liaison à l'ADN de manière spécifique de séquence. La partie C-terminale de ce domaine comporte une forte homologie avec des protéines procaryotes à domaine hélice-tour-hélice.


III.2 La famille de protéines à doigts de zinc

Ce type de protéines comporte des éléments répétitifs avec une forme de doigts de gant. On peut retrouver de nombreux doigts. Ainsi, la protéine Sp1 qui se fixe sur les botes GC possède trois doigts de zinc. L'ion Zn2+ sert à stabiliser le motif sous forme de doigt.

Le motif à doigts de zinc comprend le domaine de liaison à l'ADN. Il a été caractérisé dans un premier temps sur le facteur TFIIIA, qui est nécessaire à la transcription des gènes ARNr 5S par l'ARN pol III. Ces protéines tirent leur nom de leur structure, dans laquelle un groupe d'acides aminés conservés lient un ion de zinc. Deux sous-familles de ces protéines sont connues : la famille classique à doigts de zinc et la famille des récepteurs nucléaires.

Une protéine à doigt de zinc comporte typiquement une série de doigts de zinc, dont la séquence consensus pour un doigt est la suivante :

Cys-X2-4-Cys-X3-Phe-X3-Leu-X2-His-X3-His

Le motif tire son nom de la boucle d'acides aminés qui dépasse du site de liaison de l'ion zinc et est décrit comme le doigt Cys2/His2 (Figure 2). 

Figure 2: Une série de trois doigts de zinc (exemple le facteur SP1)A.

Les doigts sont généralement organisés comme une série de répétitions en tandem allant jusqu 9 répétitions qui occupent toute la protéine (comme TFIIIA). Le facteur de transcription général SP1 contient 3 doigts de zinc. La partie C-terminale de chaque doigt de zinc forme des hélices a qui lient l'ADN, et la partie N-terminale forme des feuillets b. La partie non conservée en C-terminal de chaque doigt est responsable de la reconnaissance spécifique de séquences d'ADN au niveau des gènes cibles.

Les récepteurs stéroidiens, qui sont activés par la liaison d'un ligand stéroide (glucocorticoides, hormone thyroide, acide rétinoique), comportent un autre type de structure en ' doigt ', basée sur une séquence similaire à celle reconnue par l'ion zinc : Cys-X2-Cys-X13-Cys-X2-Cys (Figure 3). Ces doigts, appelés les doigts Cys2/Cys2 sont souvent non-répétés, contrairement aux motifs Cys2/His2. Ils reconnaissent des séquences d'ADN petites et palindromiques.

Figure 3: Le domaine de liaison à l'ADN d'un récepteur nucléaire.


 III.3 La famille des facteurs à glissière à leucine

La glissière à leucine est constituée d'un domaine riche en acide aminé leucine. Les protéines avec glissière à leucine se fixent à l'ADN sous forme de dimères. Elles possèdent deux régions importantes. Une région à base du dimère, constituée par deux hélices alpha face à face riches en leucine et interagissant par des liaisons de type hydrophobe. Une autre région riche en charges positives se fixe sur les groupes phosphates de l'ADN. La région adjacente à la répétition riche en leucine est fortement basique dans chacune des protéines à glissière à leucine, et comprend un domaine de liaison à l'ADN (Figure 4).

Figure 4: Un motif de glisisière à leucine.

Les deux glissières à leucine forment une structure en Y, dans laquelle les glissières constituent la tige du Y et les deux régions basiques les deux branches du Y qui lient l'ADN. Ceci est au moins connu pour le domaine structural appelé bZIP. Ceci explique pourquoi les séquences reconnues par ces protéines sont des séquences répétées inversées sans région de séparation. Les glissières peuvent êtres utilisés pour former aussi bien des homo- ou des hétéro- dimères. Ainsi, le facteur C/EBP (qui lie sous forme de dimère la bote CAAT) comporte 4 répétitions, et les facteurs et , qui hétérodimèrisent pour former le facteur AP-1, comportent 5 répétitions.

III.4 La famille Hélice-Boucle-Hélice

Le motif Hélice-Boucle-Hélice ou Helix-Loop-Helix en anglais (HLH) a été identifié sur quelques protéines régulatrices du développement et des gènes eucaryotes qui codent pour des protéines qui lient l'ADN. Les protéines contenant ce domaine ont la capacité de lier l'ADN et de dimériser. Elles ont en commun un motif de 40-50 acides aminés comportant deux hélices alpha séparées par une région de longueur différente en forme de boucle. Ces protéines forment des dimères via l'interaction entre les résidus hydrophobes sur les 2 hélices alpha. La plupart des protéines à domaine HLH contiennent un domaine basique adjacent au domaine HLH, ce domaine basique (b) est nécessaire pour la liaison à l'ADN. Les protéines contenant ce domaine sont appelées les bHLH, comme les facteurs ubiquitaires E12/E47 ou bien les facteurs spécifiques de tissu comme les bHLH myogéniques.


Keywords

Transcription,Hélice-Tour-Hélice

Citation

Valentina Guasconi~Hakima Yahi~Slimane Ait-Si-Ali

Atlas of Genetics and Cytogenetics in Oncology and Haematology 2022-04-29

Facteurs de Transcription

Online version: http://atlasgeneticsoncology.org/teaching/209062/facteurs-de-transcription