*
Enlas células eucariotas existen tres polimerasas de ARNdistintas (Pol ARN). Cada una de ellas es responsable de latranscripción de distintos genes y genera distintos tipos deARN: la Pol ARN I genera ARNr (ARN ribosomal), la Pol ARN II generaARNm (ARN mensajero), y la Pol ARN III general ARN de transferencia(ARNt) y otros ARNs pequeños. Un factor de transcripciónes, por definición, cualquier proteína necesaria parainiciar el proceso de transcripción. Muchos de los factores detranscripción actúan mediante el reconocimiento deposiciones en cis que forman parte de los promotores ointensificadores de los genes. Sin embargo, un factor detranscripción no solo actúa por medio de su uniónfísica al ADN. Un factor puede reconocer a otro factor o a unade las polimerasas de ARN. Sin embargo, en eucariotas, los factoresde transcripción, más que tener una funciónenzimática su función es reconocer los promotores.
Losfactores de transcripción son capaces de unirse a gruposconcretos de secuencias cortas conservadas que se encuentran dentrode cada uno de los promotores de los genes. Algunos de estoselementos y factores son comunes a varios genes, y se encuentran enuna cierta variedad de promotores que hace que se utilicen de maneraconstitutiva. Por el contrario, otros son bastante específicos,lo que hace que su utilización esté bastante regulada.
Losfactores que ayudan a la labor de la Pol ARN II pueden dividirse entres grupos:
Factoresgenerales, necesarios para el comienzo de la síntesis deARN a partir de todos los promotores de clase II (genescodificantes). Junto a la Pol ARN II forman un complejo alrededordel punto de inicio de la transcripción, y determinan enpunto concreto de inicio de ésta; este complejo constituye elcomplejo de transcripción basal.
Factorescorriente arriba,(upstream) o situados en 5', sonproteínas de unión al ADN que reconocen secuenciasconsenso cortas específicas situadas corriente arriba o en 5'(proximales) del punto de inicio de la transcripción (p. ej.Sp1, que se une a la caja GC). Estos factores son ubicuos y actúansobre cualquier promotor que contiene el lugar apropiado de uniónal ADN. Su función es incrementar la eficiencia del comienzode la transcripción.
Factoresinducibles, que funcionan de manera semejante a los factorescorriente arriba, pero con un papel más regulador. Sesintetizan o activan en momentos específicos en tejidosdeterminados. Las secuencias a las que se unen sedenominan elementos de respuesta.
Laenzima Pol ARN II no es capaz de iniciar la transcripción porsí sola, sino que es absolutamente dependiente de factores detranscripción auxiliares (denominados TFIIX -transcriptionfactor RNA pol II, donde la "X" es la letra concreta queidentifica a cada uno de los distintos factores individuales). Lapropia enzima, junto con estos factores, forma el complejo o aparatotranscripcional basal o mínimo necesario para la transcripcióna partir de cualquier promotor de clase II.
Laeficiencia y especificidad con la que se reconoce un promotor dependede secuencias cortas, situadas bastante corriente arriba de la cajaTATA, que son reconocidas por los factores corriente arriba(proximales) y los factores inducibles. Algún ejemplo de estassecuencias son la caja CAAT, que juega un importante papel en ladeterminación de la eficiencia del promotor, y que esreconocida en distintos promotores por factores diferentes, como losfactores de la familia CTF, los factores CP1 y CP2, y los factoresC/EBP y ACF; y la caja GC, que es reconocida por el factor Sp1. Estosfactores tienen la capacidad de interaccionar con otros medianteinteracciones proteína-proteína. La function principalde los elementos de secuencia a los que se unen es traer a losfactores unidos a la proximidad del complejo de iniciación dela transcripción, en el que las interaccionesproteína-proteína determinan la eficiencia de lareacción de comienzo de la transcripción.
Figura1: Esquema del modelo del ensamblaje del complejo de transcripciónbasal
Diferentesfactores de transcripción comparten ciertos tipos de motivosproteicos responsables de la unión al ADN y cuya presenciapermite agrupar a estas proteínas en familias :
Elmotivo hélice-giro-hélice se identificóoriginalmente como un dominio de unión al ADN presente enrepresores de fagos; una hélice a se une al surco mayor delADN, mientras que la otra descansa formando un ángulo a lolargo del ADN. Una forma relacionada con este dominios es la presenteen el homeodominio, que fue inicialmente caracterizada en variasproteínas codificadas por genes implicados en la regulacióndel desarrollo de Drososphila; y también está presenteen genes que codifican para factores de transcripción humanos.La secuencia homeobox codifica para un dominio de 60 aminoácidos.El homeodominio es responsable de la unión al ADN y en ésteradica la especificidad del reconocimiento al ADN. Su regiónC-terminal muestra homología con el motivo hélice-giro-hélicede los represores de procariotas.
Elmotivo dedo de zinc es un motivo de unión al ADN. Inicialmentese encontró en el factor TFIIIA, necesario para que la Pol ARNIII transcribe los genes del ARNr 5S. Las proteínas de estegrupo toman su nombre de su estructura, en la que un grupo pequeñode aminoácidos conservados se unen a un ión de zinc.Existen dos tipos de proteínas de unión al ADN quetienen estructuras de este tipo: las "clásicas"proteínas con dedos de zinc y los receptores de esteroides.
Una"proteína dedo" generalmente tiene una seriede dedos de zinc; la secuencia consenso de un solo dedo es:
Cys-X2-4-Cys-X3-Phe-X3-Leu-X2-His-X3-His
Elmotivo toma su nombre de uno de los tipos en los que salen del lugarde unión al zinc un bucle de aminoácidos (dedoCys2/His2) (figura 2).
Figura2: Serie de tres dedos de zinc (ejemplo del factor SP1)
Lasestructuras en dedo se suelen organizar como series individuales derepeticiones en tándem; la extensión de los dedos vadesde las 9 repeticiones que ocupan prácticamente toda laproteína (como en TFIIIA), a algunos casos en los que existenúnicamente dos dedos; por ejemplo, el factor general detranscripción Sp1 tienen un dominio de unión al ADNformado por 3 dedos de zinc. La porción C-terminal de cada unode los dedos forma hélices a que se unen al ADN; la porciónN-terminal forma hojas b. Los aminoácidos no conservadossituados en el extremo C-terminal de cada uno de los dedos son losresponsables del reconocimiento de los puntos específicos deunión.
Los receptoresde esteroides, activados por la unión de determinadosesteroides (p. ej. glucocorticoides, hormona tiroidea, ácidoretinoico), y algunas otras proteínas, tienen otro tipo dededo de zinc. Su estructura está basada en una secuenciaconsenso con una zona de unión al zinc :
Cys-X2-Cys-X13-Cys-X2-Cys(figura 3)
Sonlos denominados dedos Cys2/Cys2. Las proteínas con dedosCys2/Cys2 e menudo tienen dedos no repetidos, a diferencia de larepetición en tándem de los dedos Cys2/His2. Sus puntosde unión al ADN son generalmente cortos y palindrómicos.Los receptores para glucocorticoides y el estrógeno tiene cadauno 2 dedos, que forman hélices a que se pliegan para formarun gran dominio globular.
Figura3: Dominio de unión al ADM de un receptor nuclear o deesteroides
Lacremallera de leucina está formada por un segmento deaminoácidos rico en leucinas que forman un motivo dedimerización. La dimerización permite la yuxtaposiciónde las regiones de unión al ADN de cada una de lassubunidades. Una cremallera de leucina forma una héliceanfipática en la que las leucinas de la cremallera de una delas proteínas pueden sobresalir de la hélice a ytrabarse o engranarse con las leucinas de la cremallera de otraproteína que se encuentra situada de manera paralela paraformar un dominio de bobina en espiral (coiled-coil). La regiónadyacente a las repeticiones de leucina es altamente básica encada una de las proteínas que forman la cremallera, y podríaabarcar un dominio de unión al ADN (figura 4).
Figura4: Motivo de cremallera de leucina
Dehecho, las dos cremalleras de leucina forman una estructura en formade Y, en la que las cremalleras forman el tallo y las dos regionesbásicas se bifurcan de manera simétrica para formar losbrazos que se unen al ADN. Esto es lo que se conoce como el motivoestructural bZIP y explica la razón por la que las secuenciasdiana de tales proteínas son repeticiones invertidas sinseparación. Las cremalleras pueden utilizarse para promover laformación de homodímeros o heterodímeros.Existen cuatro repeticiones de este tipo en la proteína C/EBP(un factor que se une como dímero tanto a la caja CAAT como alintensificador o potenciador del núcleo de SV40), y cincorepeticiones en los factores que forman el factor de transcripciónheterodimérico AP1.
Elmotivo anfipático hélice-bucle-hélice (HLH,helix-loop-helix) se ha identificado en varios reguladores deldesarrollo y en genes codificantes para proteínas de uniónal ADN de eucariotas. Las proteínas que poseen este motivotienen tanto la capacidad de unión al ADN como la dedimerizar. Todas comparten un motivo común de secuencia: unsegmento de 40-50 aminoácidos que contiene 2 hélices aantipáticas separadas por una región de unión(el bucle) de longitud variable. Las proteínas de este grupoforman tanto homodímeros como heterodímeros medianteinteracciones entre los aminoácidos hidrofóbicossituados en la parte enfrentada de ambas hélices. La capacidadpara formar dímeros se sitúa en estas hélicesanfipáticas, y es común a todas las proteínascon dominios HLH.
Lamayor parte de las proteínas HLH tienen una regiónaltamente básica adyacente al motivo HLH, que es necesariopara su unión al ADN. Los miembros de este grupo de proteínasque tienen esta región se denominan proteínas bHLH. Undímero en el que ambas subunidades tengan la regiónbásica puede unirse al ADN. Las proteínas bHLHpertenecen a dos grupos principales. La clase A está formadapor proteínas de expresión ubicua, e incluyen porejemplo la E12/E47 de mamíferos. La clase B estáformada por proteínas que se expresan de manera específicade tejido, e incluyen por ejemplo la MyoD, Myf5, miogenina y MRF4 demamíferos (un conjunto de factores de transcripciónimplicados en la miogénesis, denominados factores reguladoresbiogénicos (MRFs, myogenic regulatory factors). Un modusoperandi común para una proteína específica detejido bHLH sería la de formar un heterodímero con otraproteína de expresión ubicua. Existen también ungrupo de productos génicos que intervienen en el desarrollodel sistema nervioso de Drosophila melanogaster (en el que Ac-S es elcomponente específico de tejido, y da es el componenteubicuo). Estas proteínas forman una clase distinta deproteínas bHLH.
Traducción: José Luis Vizmanos. Departamento de Genética,Facultad de Ciencias, Universidad de Navarra, Pamplona, Spain
Valentina Guasconi~ Hakima Yahi~Slimane Ait-Si-Ali
Atlas of Genetics and Cytogenetics in Oncology and Haematology 2022-05-30
Factores de transcripción
Online version: http://atlasgeneticsoncology.org/teaching/209038/factores-de-transcripci-n