*
In eukaryotischen Zellen gibt es drei verschiedenen RNA polymerasen (RNA Pol). Jeder RNA Pol ist eine andere Klasse der Transkription zugeordnet: PolI transkribiert rRNA (ribosomale RNA), PolII mRNA (messenger RNA) und PolIII tRNA (transfer RNA) und andere kurze RNAs. Jedes Protein, welches zur Initiierung des Transkriptionsvorganges benötigt wird, wird als Transkriptionsfaktor bezeichnet. Viele Transkriptionsfaktoren funktionieren, indem sie cis-agierende DNA-Regionen erkennen, die Teil eines Promoters oder Enhancers sind. Die Bindung an die DNA ist jedoch nicht die einzige Aktionsweise eines Transkriptionsfaktors. Ein Transkriptionsfaktor kann einen anderen Transkriptionsfaktor oder RNA Polymerasen erkennen. In Eukaryoten sind es eher die Transkriptionsfaktoren, und nicht die Enzyme selber (Polymerasen), die einen Promoter erkennen.
Transkriptionsfaktoren können spezifische Muster kurzer konervierter Sequenzen binden, die Bestandteil jedes Promoters sind. Einige dieser Elemente und Faktoren sind häufig und finden sich in vielen Promotoren, wo sie konstitutiv verwendet werden. Andere Elemenete sind spezifisch und in ihrer Verwendung reguliert.
Die Faktoren, die RNA PolII assistieren, können in 3 Gruppen unterteilt werden:
Die allgemeinen Faktoren, die für die Initiierung der RNA-Synthese bei allen Klasse II Promotoren gebraucht werden (kodierende Gene). Zusammen mit RNA PolII bilden sie einen Komplex, der den Transkriptionsstart umfasst, wodurch sie die Stelle der Initiierung bestimmen. Dieser Komplex bildet den "basal transcription apparatus", den basalen Transkriptionsapparat.
Die Upstream Faktoren sind DNA-bindenden Proteine, die spezifische kurze Konsensus-Elemenete erkennen, die sich "oberhalb" oder 5’ des Transkriptionsstartpunktes befinden (z.B. Sp1, das die GC Box bindet). Diese Faktoren sind ubiquitär und wirken auf jeden Promoter, der eine entsprechende Bindungsstelle besitzt. Sie erhöhen die Effizienz der Initiation.
Die induzierbaren Faktore funktionieren ähnlich wie die Upstream Faktoren, haben jedoch eine regulative Rolle. Sie werden zeit- und gewebeabhängig synthetisiert oder aktiviert. Die von ihnen gebundenen Sequenzen nennt man response elements.
Das RNA Pol II Enzym kann Transkription nicht alleine initiieren, sondern ist von Hilfs-Transkriptionsfaktoren (TFIIX genannt, wobei "X" ein Buchstabe ist, der den individuellen Faktor identifiziert) abhängig. Das Enzym bildet mit diesen Hilfsfaktoren den basalen (oder minimalen) Transkriptionsapparat, der gebraucht wird, um einen Klasse II Promoter zu transkribieren.
Die Effizienz und Spezifität, mit der ein Promoter erkannt wird, hängt von kurzen Sequenzen ab, der sich "oberhalb" oder 5’ befindlichen TATA Box, die von Upstream Faktoren und induzierbaren Faktoren erkannt wird. Beispiele für solche Sequenzen sind die CAAT Box, die eine groβe Rolle für die Bestimmung der Effizienz einen Promoters spielt und die in verschiedenen Promotoren von verschiedenen Faktoren erkannt wird. So z.B. den Faktoren der CTF Familie, den Faktoren CP1 und CP2 und den Faktoren C/EBP und ACF. Die GC Box wird vom Faktor Sp1 erkannt. Diese Faktoren haben die Fähigkeit, mit einander durch Protein-Protein-Interaktionen zu interagieren. Die Hauptaufgabe dieser Elemente ist es, die von ihnen gebundenen Faktoren in die Nähe des Initiationskomplexes zu bringen, wo Protein-Protein-Interaktionen die Effizienz der Initiationsreaktions bestimmen.
Figur 1: Schematisches Modell für die Zusammenstellung dem basalen Transkriptionsapparat.
Häufige Motive, die für das Binden der DNA verantwortlich sind, können in verschiedenen Transkriptionsfaktoren gefunden werden. Es gibt mehrere Gruppen von Proteinen, die die Transkription regulieren, indem sie bestimmte DNA-Motive binden.
Das Helix-Turn-Helix Motiv wurde ursprünglich als die DNA-bindende Domäne von Phagenrepressoren gefunden. Eine a-Helix kommt in der groβen Furche der DNA zu liegen, die andere liegt in einem Winkel quer zur DNA. Eine andere Form dieses Motivs ist in der Homeodomäne zu finden, eine Sequenz, die zu aller erst in Proteinen charakterisiert wurde, die von Genen kodiert werden, die in der Embryonalentwicklung von Drosophila involviert sind. Sie ist ebenso in Genen vorhanden, die für Säugertranskriptionsfaktoren kodieren. Die Homeobox ist eine Sequenz, die für eine Domäne von 60 Aminosäuren kodiert. Die Homeodomäne ist für das Binden von DNA verantwortlich. Die Spezifizät der DNA-Erkennung liegt innerhalb der Homeodomäne. Die C-ter Region hat Homologie zum Helix-Turn-Helix Motiv von prokaryotischen Repressoren.
Zinkfingermotive enthalten DNA-bindende Domänen. Dieses Motiv wurde zuerst im Faktor TFIIIA gefunden, der von RNA PolIII gebraucht wird, um 5S rRNA Gene zu transkribieren. Diese Proteine haben ihren Namen von ihrer Struktur, in der eine kleine Anzahl von konservierten Aminosäuren ein Zinkion binden. Zwei Arten von DNA-bindenden Proteinen haben Strukturen dieses Typus: die klassischen "Zinkfinger"-Proteine und die Steroidrezeptoren.
Ein "Fingerprotein" hat typischerweise eine Reihe von Zinkfingern, die Konsensussequenz eines einzelnen Fingers ist:
Cys-X2-4-Cys-X3-Phe-X3-Leu-X2-His-X3-His
Das Motiv hat seinen Namen von der Schleife der Aminosäuren, die von der zink-bindenden Stelle herausragen und als Cys2/His2 Finger beschrieben wird.
Diese Finger sind gewöhnlich als einzelne Serien von Tandemwiederholungen angeordnet. Der Bereich der Finger reicht von 9 Wiederholungen, der beinahe das gesamte Protein belegt (wie in TFIIIA), bis zu einer einzigen kleinen Domäne bestehend aus 2 Fingern. Der allgemeine Transkriptionsfaktor Sp1 hat eine DNA-bindenden Domäne bestehend aus 3 Zinkfingern. Der C-terminale Teil jedes Fingers bildet eine a-helix, welche DNA bindet; der N-terminale Teil bildet b-Faltblätter. Die nicht-konservierten Aminosäuren der C-terminalen Seite jedes Fingers sind verantwortlich für die Erkennung spezifischer Zielstellen.
Steroidrezeptoren, die durch die Bindung bestimmter Steroide (z.B. Glucocroticoide, Schilddrüsenhormon, Retinolsäure) und einigen anderen Proteinen aktiviert werden, haben einen anderen Fingertypus. Die Strukture basiert auf folgender Zink-bindender Konsensussequenz:
Cys-X2-Cys-X13-Cys-X2-Cys
Diese werden Cys2/Cys2 Finger genannt. Proteine mit Cys2/Cys2 Fingern haben oft nicht-repetitive Finger im Gegensatz zu den Tandemwiederholungen des Cys2/His2 Typs. Die Bindungsstellen an der DNA sind normalerweise kurz und palindromisch. Die Glucocorticoid- bzw strogenrezeptoren haben je 2 Finger, die a-Helices bilden, die sich so falten, daβ sie eine groβe globuläre Domäne bilden.
Ein Leuzinzipper ist eine Kette von Aminosäuren reich an Leucinmonomeren, die ein Dimerisationsmotiv zur Verfügung stellen. Dimerisation erlaubt die Nebeneinanderstellung der DNA-bindenden Region jeder Untereinheit. Ein Leucinzipper bildet eine amphipathische Helix, in der die Leucine des Zippers an einem Protein aus der α-Helix hervorragen und mit den Leucinen des Zippers eines anderen Proteins fingerartig ineineandergreifen können um eine "coiled coil" Domäne zu bilden. Die Region benachbart den Leucienwiederholungen ist in beiden Zipperproteine hoch basich und kann eine DNA-Bindungsstelle umfassen. Die 2 Leucinzipper bilden eine Y-geformte Struktur, in der die Zipper den Stamm bilden und die 2 basischen Regionen symmetrisch bifurkate ste darstellen, die die DNA binden. Diese Struktur ist auch als bZIP Struktur-Motiv bekannt. Es erklärt, warum die Zielsequenzen für solche Proteine invertierte Wiederholungen ohne Separation sind. Zipper können unterstützend für die Bildung von Homo-oder Heterodimeren verwendet werden. Es gibt 4 Wiederholungen im Protein C/EBP (ein Faktor, der als Dimer sowohl CAAT Box als auch SC40 Kernenhancer bindet), 5 Wiederholungen in den Faktoren Jun und Fos (welche den heterodimerischen Transkriptionsfaktor AP1 bilden).
Das amphipathische Helix-Loop-Helix (HLH) Motiv wurde in einigen Regulatoren der Embryonalentwicklung identifiziert bzw in Genen, die für eukaryotische DNA-bindende Proteine kodieren. Die Proteine, welche dieses Motiv besitzen, haben sowohl die Fähigkeit, DNA zu binden als auch Dimere zu bilden. Sie verbindet ein gemeinsamer Sequenzmotiv-Typ: ein Bereich von 40-50 Aminosäuren, der 2 amphiöathische α-Helices getrennt durch eine Linkerregion (der Schleife/Loop) von unterschiedlicher Länge beinhaltet. Die Proteine dieser Gruppe bilden Homo- und Heterodimere durch Interaktion zwischen den hydrophoben Monomeren auf den entsprechenden Flächen von 2 Helices. Die Fähigkeit, Dimere zu formen, kommt von diesen amphipathischen Helices und ist allen HLH Proteinen gemeinsam.
Die meisten HLH Proteine haben eine Region benachbart dem HLH Motiv selbst, die hoch basich ist und für DNA-Bindung gebraucht wird. Mitglieder einer Gruppe mit einer solchen Region werden bHLH Proteine genannt. Ein Dimer, in dem beide Untereinheiten eine solche basiche Region besitzen, können DNA binden. HLH Proteine können in 2 allgemeine Gruppen geteilt werden. Klasse A besteht aus Proteinen, die ubiquitär exprimiert werden, inklusive des Säugergens E12/E47. Klasse B besteht aus Proteinen, die gewebespezifisch exprimiert werden, dazu gehören die Säugergene MyoD, Myf5, Myogenin und MRF4a (eine Gruppe von Transkriptionsfaktoren, die in der Myogenese oder Muskelentwicklung involviert sind, genannt myogene Regulationsfaktoren oder MRFs). Ein gemeinsamer modus operandi für die gewebe-spezifischen bHLH Proteine scheint zu sein, daβ sie Heterodimere mit universellen Partnern bilden. Es gibt auch eine Gruppe von Genprodukten, die die Entwicklung des Nervensystem in Drosophila melanogaster spezifizieren (in der Ac-S eine gewebe-spezifische Komponente spezifiziert, und "da" die allgemeine Komponente). Die Proteine Myc bilden eine eigene Klasse der bHLH Proteine.
Ubersetzung : Katrina Vanura
Valentina Guasconi~Hakima Yahi~Slimane Ait-Si-Ali
Atlas of Genetics and Cytogenetics in Oncology and Haematology 2022-05-17
Transkriptionsfaktoren
Online version: http://atlasgeneticsoncology.org/teaching/209046/transkriptionsfaktoren