I Introduzione II Inizio della trascrizione III Le diverse famiglie di fattori di trascrizione III.1 Proteine Elica-Giro-Elica III.2 Proteine a Dita di Zinco III.3 Proteine a Cerniera di Leucine III.4 Proteine Elica-Gomito-Elica
III.1 Proteine Elica-Giro-Elica III.2 Proteine a Dita di Zinco III.3 Proteine a Cerniera di Leucine III.4 Proteine Elica-Gomito-Elica
*
Le cellule eucariotiche contengono tre distinti enzimi di trascrizione (RNA polimerasi), ciascuno responsabile della trascrizione di diverse classi di geni. La RNA polimerasi I (RNA polI) trascrive i geni per gli RNA ribosomali (rRNA) 28S, 18S e 5,8S; la RNA polimerasi II (RNA polII) trascrive i geni che codificano le proteine sintetizzando gli RNA messaggeri (mRNA); la RNA polimerasi III (RNA polIII) trascrive i geni per gli RNA transfer (tRNA), l’RNA ribosomale 5S ed alcuni piccoli RNA nucleari e citoplasmatici (snRNA e scRNA). Tutte le proteine necessarie per l’inizio della trascrizione vengono definite fattori di trascrizione. Più fattori di trascrizione agiscono riconoscendo direttamente delle sequenze cis-regolatrici localizzate a livello dei promotori o degli “enhancer”. Tuttavia, non tutti i fattori di trascrizione si associano a sequenze specifiche del promotore, ma possono legarsi ad altre proteine già su di esso inserite, oppure possono riconoscere direttamente le RNA polimerasi.
I fattori di trascrizione riconoscono generalmente piccole sequenze di DNA conservate contenute nei promotori dei geni. Alcuni di questi fattori e di queste sequenze sono comuni a più promotori e sono utilizzati in maniera costitutiva; altri sono specifici e la loro attività è regolata.
I fattori di trascrizione che cooperano con la RNA polII possono essere divisi in tre gruppi:
La RNA polII non può iniziare la trascrizione da sola, ma necessita di fattori di trascrizione ausiliari chiamati TFIIX (TF indica fattore di trascrizione; II indica polimerasi II e “X” è una lettera che identifica dei fattori individuali). La RNA polII e i fattori ausiliari costituiscono assieme la macchina trascrizionale di base che è necessaria per la trascrizione di tutti i geni di classe II (Figura 1).
L’efficienza e la specificità con cui un promotore di classe II è riconosciuto dipende da piccole sequenze di DNA localizzate a monte del TATA box, le quali sono riconosciute dai fattori “upstream” o dagli inducibili. Ad esempio il CAAT box gioca un ruolo importante nel determinare l’efficienza di un promotore, esso è riconosciuto in diversi promotori da diversi fattori, come i fattori della famiglia CTF, i fattori CP1 e CP2, o i fattori C/EBP e ACF. Questi diversi fattori hanno la capacità di interagire tra loro. La presenza di questi fattori a livello di un promotore determina l’efficienza della reazione di inizio.
I promotori di molti geni trascritti dalla RNA polimerasi II contengono una sequenza di consenso TATAA (chiamata TATA box), situata 25-30 nucleotidi a monte del sito di inizio della trascrizione. Questa sequenza è riconosciuta dal fattore di trascrizione TFIID. Il fattore TFIIA stabilisce l’associazione TFIID/TATA box. TFIIB si lega al TFIID, seguito dall’attacco della RNA polimerasi II in associazione con TFIIF. Infine TFIIE e TFIIH si associano al complesso. TFIIH è un fattore composto da diverse subunità, una di queste è una proteina chinasi che fosforila sequenze ripetute presenti nel dominio C-terminale della subunità più grande della RNA polimerasi II. La fosforilazione di queste sequenze rilascia la polimerasi dalla sua associazione con il complesso di inizio, permettendole di procedere lungo lo stampo ed allungare la catena di RNA in crescita.
Diversi gruppi di proteine che regolano la trascrizione condividono motivi (configurazioni ricorrenti) di legame al DNA I motivi più comuni sono: elica-giro-elica, dita di zinco, cerniera di leucine e elica-ansa-elica.
III.1 Proteine Elica-Giro-Elica
Il motivo elica-giro-elica (helix-turn-elix) è stato individuato per la prima volta come dominio di legame al DNA in repressori di fagi. Una forma correlata del motivo è presente nell’omeodominio, una sequenza inizialmente caratterizzata in diverse proteine implicate nella regolazione dello sviluppo della Drosophila e successivamente individuata anche in fattori di trascrizione presenti nei mammiferi. L’omeodominio è codificato da una sequenza di DNA di 180 pb, altamente conservata e conosciuta come homeobox. Attraverso questa regione, la proteina è in grado di legarsi a specifiche sequenze di DNA, regolando l’espressione genica. Il motivo è costituito da due segmenti ad a –elica, collegati da una stretta curva: una delle eliche, detta elica di riconoscimento, è posizionata in modo da adattarsi perfettamente al solco maggiore del DNA; l’altra elica stabilizza l’interazione tra proteine e DNA senza avere un ruolo particolare nel riconoscimento.
III.2 Proteine a Dita di Zinco
I domini a dita di zinco (zinc finger) contengono ripetizioni di residui di cisteina e istidina che legano ioni zinco e si ripiegano in strutture ad ansa (dita) che legano il DNA. Questi domini furono identificati inizialmente nel fattore di trascrizione TFIIIA, richiesto dalla RNA polIII per trascrivere i geni della subunità 5S del rRNA, ma sono comuni anche fra i fattori di trascrizione che regolano i promotori della RNA polII, compreso Sp1. Strutture di questo tipo sono presenti in due tipi di proteine che legano il DNA (DNA-binding proteins): proteine a dita di zinco classiche e recettori steroidei.
Tipicamente, le “dita di zinco” hanno per ogni dito la seguente sequenza consenso:
Cys-X2-4- Cys-X3-Phe- X3-Leu- X2-His- X3-His
Il motivo prende nome dal cappio di amminoacidi che sporge dal sito di legame dello ione zinco, descritto come dito Cys2/Hys2 (Figura 2)
Le dita sono organizzate come una serie di ripetizioni in tandem che possono arrivare fino a 9 ripetizioni, che occupano l’intera proteina (come in TFIIIA). Il fattore di trascrizione generale Sp1 contiene un dominio a 3 dita di zinco. La parte C-terminale di ogni dito forma delle a-eliche che legano il DNA e la parte N-terminale forma un foglietto ß. Gli amminoacidi non conservati nel C-terminale di ogni dito sono responsabili del riconoscimento di siti specifici.
I recettori steroidei, che sono attivati attraverso particolari legami con ligandi steroidei (glucocorticoidi, ormone tiroideo e acido retinoico), sono caratterizzati da un altro tipo di struttura a “dito”, basata su una sequenza simile a quella riconosciuta per dallo ione zinco:
Cys-X2-Cys-X13- Cys-X2-Cys (Figura 3).
Queste sono chiamate dita Cys2/Cys2 e non sono ripetute, contrariamente ai motivi Cys2/His2. Esse riconoscono piccole sequenze palindromiche di DNA. Il glucocorticoide e i recettori per gli estrogeni hanno 2 dita ognuno. Esse formano a-eliche che si avvolgono insieme a formare un largo dominio globulare.
III.3 Le proteine a cerniera di leucina
La cerniera di leucina (leucine zipper) è costituita da un dominio ricco in residui di leucina, presenti ogni 7 aminoacidi lungo un’a-elica di 30-40 residui aminoacidici. Esse si legano al DNA sotto forma di dimeri: le a-eliche hanno un passo che espone tutte le leucine dallo stesso lato. Due a-eliche di questo tipo possono protrudere dall’a-elica e unirsi a formare una struttura a spirale (coiled-coil) nella quale le leucine di un’elica sono addossate alle leucine dell’altra elica, come in una cerniera (Figura 4).
Le 2 a-eliche formano una struttura a Y, il cui fusto è costituito dalla cerniera e le 2 regioni simmetricamente biforcate formano i bracci che legano il DNA. Questa struttura è conosciuta come motivo bZIP. Essa spiega perché le sequenze target per queste proteine sono ripetute e invertite senza regioni di separazione. Le cerniere possono essere utilizzate per formare omeodimeri o eterodimeri. Per esempio ci sono 4 ripetizioni nella proteina C/EBP (un fattore che si lega come dimero sia alla CAAT box che al core dell’enhancer dell’ SV40) e 5 ripetizioni nei fattori che eterodimerizzano per formare il fattore di trascrizione AP1).
III.4 Le proteine elica-ansa-elica
L’elica-ansa-elica (helix-loop-helix, HLH) è un motivo anfipatico identificato su alcune proteine regolatrici dello sviluppo e nei geni eucariotici che codificano per proteine che legano il DNA. Le proteine contenenti questi domini hanno la capacità di legare il DNA e di dimerizzare. Esse hanno in comune un motivo di 40-50 aminoacidi che contengono 2 a-eliche separate da un’ansa di lunghezza variabile. Le proteine di questo gruppo formano sia omodimeri che eterodimeri attraverso interazioni tra i residui idrofobici delle due a-eliche. La maggior parte delle proteine a dominio HLH contengono un dominio basico (b) adiacente a un dominio HLH, necessario per il legame al DNA. Le proteine di tale gruppo sono chiamate bHLH, come i fattori ubiquitari E12/E47 o i fattori tessuto-specifici come le bHLH miogeniche.
Traduzione : Daniela Virginia Frau
Guasconi V, Yahi H, Ait-Si-Ali S
Atlas of Genetics and Cytogenetics in Oncology and Haematology 2003-01-01
Fattori di trascrizione
Online version: http://atlasgeneticsoncology.org/teaching/30139/fattori-di-trascrizione