|
|
version pdf*
Chez les eucaryotes, il existe trois différentes ARN polymérases (ARN pol). Chacune de ces ARN pol est responsable de la transcription d'un type d'ARN : l'ARN pol I transcrit les ARN ribosomiques (ARNr) ; l'ARN pol II transcrit les ARN messagers (ARNm) ; enfin, l'ARN pol III transcrit les ARN de transfert et les petits ARN (ARNt). Toute protéine nécessaire à l'initiation de la transcription est définie comme un facteur de transcription. Plusieurs facteurs de transcription agissent en reconnaissant directement des séquences cis-régulatrices au niveau des régions promotrices des gènes. Cependant, la liaison à l'ADN n'est pas toujours requise pour l'action d'un facteur de transcription. Un facteur de transcription peut ainsi reconnatre un autre facteur de transcription qui lui lie l'ADN directement, ou bien reconnatre directement l'ARN polymérase.
Les facteurs de transcription reconnaissent généralement des petites séquences d'ADN conservées contenues au niveau des promoteurs de leurs gènes cibles. Certains de ces facteurs et de ces séquences sont communs à plusieurs gènes et utilisés de manière constitutive, et d'autres sont spécifiques de gènes et leur activité est régulée.
Les facteurs de transcription qui coopèrent avec l'ARN polymérase peuvent êtres divisés en trois groupes :
L'ARN polymérase II ne peut pas initier la transcription par elle-même, pour cela, elle est dépendante de facteurs auxiliaires (appelés TFIIX, o X est une lettre identifiant des facteurs individuels). L'ARN pol II et ces facteurs auxiliaires constituent ensemble la machinerie transcriptionnelle de base qui est nécessaire à la transcription de tous les gènes de classe II (Figure 1).
L'efficacité et la spécificité avec lesquelles un promoteur de classe II est reconnu dépendent de petites séquences d'ADN, en amont de la bote TATA, ces séquences sont reconnues par les facteurs de transactivateurs ou inductibles. C'est le cas par exemple des botes CAAT, qui jouent un rle important dans la détermination de l'efficacité d'un promoteur, et elle est reconnue sur différents promoteurs par différents facteurs, comme les facteurs de la famille CTF, les facteurs CP1 et CP2, ou les facteurs C/EBP et ACF. Ces différents facteurs ont également la capacité d'interagir entre eux. La présence de ces facteurs sur un promoteur détermine le taux de transcription du gène cible.
Figure 1: Modèle schématique d'assemblage de la machinerie basale
de transcription
Une succession dtapes met en jeu des éléments du promoteur, l'ARN polymérase II et des facteurs généraux de la transcription. La première étape est constituée par la fixation du facteur de transcription TFIID sur la bote TATA. Le facteur TFIIA stabilise l'association TFIID/bote TATA. Puis le facteur TFIIB se fixe sur le facteur TFIID fixé sur la bote TATA. TFIIB recrute l'ARN polymérase II et le facteur TFIIF. Les facteurs TFIIE et TFII H se fixent, suivis par des facteurs supplémentaires complétant le complexe de transcription: Le facteur TFIIH présente une activité protéine kinase. Une phosphorylation de l'ARN polymérase est réalisée sur la plus grosse sous-unité de l'enzyme riche en sérine et en thréonine (partie C-terminale). La phosphorylation sur sites spécifiques déclenche le début de la transcription: De plus, arrivée au bout du promoteur, l'ARN polymérase II doit être libérée du complexe des facteurs de transcription généraux pour démarrer la transcription. La phosphorylation d'une des sous-unités de l'ARN polymérase est indispensable pour déplacer l'enzyme du complexe d'initiation de la transcription.
Les facteurs de transcription dits trans-régulateurs sont des protéines particulières produites par d'autres gènes. Ces protéines présentent des caractéristiques structurales communes, avec au moins au minimum deux domaines:
Plusieurs familles de facteurs de transcription ont été ainsi définies selon les domaines de liaison à l'ADN utilisés.
Le motif hélice-tour-hélice a été identifié dans un premier temps comme le domaine de liaison à l'ADN de répresseurs de phages. Mais une forme similaire à ce domaine a été ensuite retrouvée dans les homéodomaines, une séquence caractérisée sur plusieurs protéines impliquées dans la régulation du développement de la Drosophile ; elle existe aussi dans plusieurs facteurs de transcription de mammifères. Le domaine homeobox est une séquence de 60 acides aminés, responsable de la liaison à l'ADN de manière spécifique de séquence. La partie C-terminale de ce domaine comporte une forte homologie avec des protéines procaryotes à domaine hélice-tour-hélice.
III.2 La famille de protéines à doigts de zinc
Ce type de protéines comporte des éléments répétitifs avec une forme de doigts de gant. On peut retrouver de nombreux doigts. Ainsi, la protéine Sp1 qui se fixe sur les botes GC possède trois doigts de zinc. L'ion Zn2+ sert à stabiliser le motif sous forme de doigt.
Le motif à doigts de zinc comprend le domaine de liaison à l'ADN. Il a été caractérisé dans un premier temps sur le facteur TFIIIA, qui est nécessaire à la transcription des gènes ARNr 5S par l'ARN pol III. Ces protéines tirent leur nom de leur structure, dans laquelle un groupe d'acides aminés conservés lient un ion de zinc. Deux sous-familles de ces protéines sont connues : la famille classique à doigts de zinc et la famille des récepteurs nucléaires.
Une protéine à doigt de zinc comporte typiquement une série de doigts de zinc, dont la séquence consensus pour un doigt est la suivante :
Cys-X2-4-Cys-X3-Phe-X3-Leu-X2-His-X3-His
Le motif tire son nom de la boucle d'acides aminés qui dépasse du site de liaison de l'ion zinc et est décrit comme le doigt Cys2/His2 (Figure 2).
Figure 2: Une série de trois doigts de zinc (exemple le facteur SP1)A.
Les doigts sont généralement organisés comme une série de
répétitions en tandem allant jusqu 9 répétitions qui occupent toute la
protéine (comme TFIIIA). Le facteur de transcription général SP1 contient 3
doigts de zinc. La partie C-terminale de chaque doigt de zinc forme des hélices
a qui lient l'ADN, et la partie N-terminale forme des feuillets b. La partie non
conservée en C-terminal de chaque doigt est responsable de la reconnaissance
spécifique de séquences d'ADN au niveau des gènes cibles.
Les récepteurs stéroidiens, qui sont activés par la liaison d'un ligand stéroide (glucocorticoides, hormone thyroide, acide rétinoique), comportent un autre type de structure en ' doigt ', basée sur une séquence similaire à celle reconnue par l'ion zinc : Cys-X2-Cys-X13-Cys-X2-Cys (Figure 3). Ces doigts, appelés les doigts Cys2/Cys2 sont souvent non-répétés, contrairement aux motifs Cys2/His2. Ils reconnaissent des séquences d'ADN petites et palindromiques.
Figure 3: Le domaine de liaison à l'ADN d'un récepteur nucléaire.
III.3 La famille des facteurs à glissière à leucine
La glissière à leucine est constituée d'un domaine riche en
acide aminé leucine. Les protéines avec glissière à leucine se fixent à l'ADN
sous forme de dimères. Elles possèdent deux régions importantes. Une région à
base du dimère, constituée par deux hélices alpha face à face riches en leucine
et interagissant par des liaisons de type hydrophobe. Une autre région riche en
charges positives se fixe sur les groupes phosphates de l'ADN. La région
adjacente à la répétition riche en leucine est fortement basique dans chacune
des protéines à glissière à leucine, et comprend un domaine de liaison à l'ADN
(Figure 4).
Figure 4: Un motif de glisisière à leucine.
Les deux glissières à leucine forment une structure en Y, dans
laquelle les glissières constituent la tige du Y et les deux régions basiques
les deux branches du Y qui lient l'ADN. Ceci est au moins connu pour le domaine
structural appelé bZIP. Ceci explique pourquoi les séquences reconnues par ces
protéines sont des séquences répétées inversées sans région de séparation. Les
glissières peuvent êtres utilisés pour former aussi bien des homo- ou des
hétéro- dimères. Ainsi, le facteur C/EBP (qui lie sous forme de dimère la bote
CAAT) comporte 4 répétitions, et les facteurs
III.4 La famille Hélice-Boucle-Hélice
Le motif Hélice-Boucle-Hélice ou Helix-Loop-Helix en anglais
(HLH) a été identifié sur quelques protéines régulatrices du développement et
des gènes eucaryotes qui codent pour des protéines qui lient l'ADN. Les
protéines contenant ce domaine ont la capacité de lier l'ADN et de dimériser.
Elles ont en commun un motif de 40-50 acides aminés comportant deux hélices
alpha séparées par une région de longueur différente en forme de boucle. Ces
protéines forment des dimères via l'interaction entre les résidus hydrophobes
sur les 2 hélices alpha. La plupart des protéines à domaine HLH contiennent un
domaine basique adjacent au domaine HLH, ce domaine basique (b) est nécessaire
pour la liaison à l'ADN. Les protéines contenant ce domaine sont appelées les
bHLH, comme les facteurs ubiquitaires E12/E47 ou bien les facteurs spécifiques
de tissu comme les bHLH myogéniques.
Contributor(s) |
Written | 2003-01 | Valentina Guasconi, Hakima Yahi, Slimane Ait-Si-Ali |
CNRS, UPR 9079, Institut André Lwoff, 7, rue Guy Moquet, Bât. B, 1er étage, 94800 Villejuif, France |
© Atlas of Genetics and Cytogenetics in Oncology and Haematology | indexed on : Sat Dec 5 19:11:21 CET 2020 |
For comments and suggestions or contributions, please contact us