Análisis de ligamiento genético


Contributor(s)

Written 2002-05-01 Françoise Clerget-Darpoux
Unité de Recherche d'Epidémiologie Génétique


Content

I. Fracción de recombinación
II. Definición de la puntuación Lod (lod score) de una familia
III. Prueba de ligamiento                                                                                                                                                         Francés
IV. Estimación de la fracción de recombinación                                                                                                                    Inglés
V. Fracción de recombinación entre un locus relacionado con la enfermedad y un locus marcador


Una manera de comprobar la independencia de la transmisión de una serie de genes situados en distintos loci es analizar su segregación simultánea. Esta independencia se refleja en la fracción de recombinación, θ, que es el porcentaje de gametos recombinantes transmitidos por los progenitores. Si los loci se transmiten de manera independiente, existirán el mismo número de gametos recombinantes que de gametos con las combinaciones parentales de alelos, por lo que θ = 1/2. Sin embargo, si estos loci no se transmiten de manera independiente, los gametos con las combinaciones parentales de alelos se transmitirán en una frecuencia mayor, y 0 ≤ θ

I. Fracción de recombinación

Consideremos el caso de dos loci, A y B, con dos alelos codominantes en cada uno de ellos, A1, A2 y B1, B2 respectivamente. Un individuo doble heterocigoto para ambos puede producir cuatro tipos de gametos:

A1B1
A2B1
A1B2
A2B2

Son posibles dos situaciones:

(1) Que los loci A y B se encuentren en distintos pares cromosómicos. En este caso, cada uno de los cuatro gametos tiene la misma probabilidad de producirse: 1/4.

Figura 1

(2) Que los loci A y B se encuentren en el mismo par cromosómico. En este caso, de nuevo, tendremos dos situaciones posibles: que los alelos A1 y B1 se encuentren en el mismo cromosoma del par, esto es, que A1 y B1 estén en "acoplamiento" (coupling); o que los alelos A1 y B1 se encuentren en distintos cromosomas del par, esto es, que A1 y B1 estén en "repulsión" (repulsion).


Figura 2

Por ejemplo, supongamos que A1 y B1 están en "acoplamiento". Se producirán cuatro tipos de gametos:


Figura 3

Los gametos A1B1 y A2B2 se dice que son "parentales", ya estas combinaciones estaban presentes en los cromosomas parentales o de los progenitores.

Por el contrario, los gametos A1B2 y A2B1 se considerarán "recombinantes" ya que serán consecuencia de la existencia de recombinación o entrecruzamiento entre los loci A y B. 

Figura 4

Asumiendo que la existencia de un entrecruzamiento entre un par homólogo de cromosomas sigue la ley de Poisson, y que un gameto parental tiene entre cero y un número par de entrecruzamientos, mientras que un gameto recombinante tiene un número impar, se puede demostrar que la frecuencia de gametos recombinantes es siempre igual o inferior a la frecuencia de los gametos parentales, por lo que:

0 ≤ θ

Cuando θ = 1/2, todos los tipos de gametos tienen la misma probabilidad de producirse y los alelos situados en los loci A y B se transmiten de manera independiente. Por ello, en ese caso los loci A y B no están ligados. Esta es la situación que se produce cuando A y B se encuentran en distintos pares de cromosomas, y también cuando A y B se encuentran en el mismo par pero a una distancia importante el uno del otro.

Sin embargo, si θ

En una pareja en la que se conocen los genotipos de A y B, la probabilidad de los genotipos de la descendencia dependerá del valor de θ.

Consideremos el siguiente cruzamiento:  

Figura 5

Esa pareja puede tener cuatro tipos de descendientes:

Figura 6

Asumiendo que existe equilibrio gamético entre los loci A y B, en el progenitor 1 existe una probabilidad de 1/2 de que los alelos A1 y B1 se encuentren en "acoplamiento", y una probabilidad de 1/2 de que se encuentren en "repulsión".

(1) Si A1 y B1 se encuentran en "acoplamiento", la probabilidad de que el progenitor (1) suministre cada uno de los gametos A1B1 y A2B2 es (1-θ)/2 y la probabilidad de que este progenitor suministre cada uno de los gametos A1B2 y A2B1 es θ/2. Dado que el otro progenitor produce un único tipo de gameto (A1B1) la probabilidad de que la pareja tenga un descendiente de tipo (1) ó (2) será (1-θ)/2, y de que tenga un descendiente de tipo (3) ó (4) será θ/2.

Por lo tanto, la probabilidad de encontrar n1 descendientes de tipo (1), n2 de tipo (2), n3 de tipo (3) y n4 de tipo (4) es: 

[(1- θ)/2]n1+n2 x (θ/2)n3+n4

(2) Si A1 y B1 se encuentran en un estado de "repulsión", la probabilidad de que el progenitor (1) suministre cada uno de los gametos A1B2 y A2B1 es (1-θ)/2 y la probabilidad de que este progenitor suministre cada uno de los gametos A1B1 y A2B2 será θ/2.

Por lo tanto, la probabilidad en este caso de encontrar n1 descendientes de tipo (1), n2 de tipo (2), n3 de tipo (3) y n4 de tipo (4) es:

(θ/2)n1+n2 x[(1-θ)/2]n3+n4

Por ello, sin información acerca de la fase (acoplamiento o repulsión) en la que se encuentran los alelos A1 y B1, asumiendo que los genes A y B se encuentran ligados y en equilibrio de ligamiento, la probabilidad de encontrar n1, n2, n3 y n4 descendientes de las categorías (1), (2), (3), (4) es:   


p(n1,n2,n3,n4/θ)=1/2 [[(1-θ)/2]n1+n2 x (θ/2)n3+n4 + (θ/2) n1+n2 x [(1-θ)/2] n3+n4]

Por lo que la probabilidad de θ para una observación de n1, n2, n3, n4 se puede escribir como:

L(θ/n1,n2,n3,n4)=1/2 [[(1-θ)/2]n1+n2 (θ/2)n3+n4 + (θ/2) n1+n2 [(1-θ)/2] n3+n4]

Caso especial: número de descendientes n= 1

Independientemente de la categoría a la que pertenezca el descendiente 

L(θ) = 1/2 [(1-θ)/2] + 1/2 [θ/2] = 1/4


La probabilidad de esta observación en la familia no depende de θ, sino que es al azar. Podemos decir que esta familia no será informativa para θ.

Familias informativas

Una "familia informativa" es aquélla para la cual la probabilidad de la descendencia es una función variable de θ.

Por lo tanto, una condición esencial para que una familia sea informativa es que tenga más de un descendiente. Más aun, uno de los progenitores debe ser heterocigoto.

Definiciones: cuando uno de los progenitores es heterocigoto doble y el otro es:

  • un doble homocigoto, tenemos un cruzamiento prueba
  • un homocigoto para uno de los loci, tenemos un cruzamiento prueba simple
  • un doble heterocigoto, tenemos un cruzamiento doble

II. Definición de la puntuación Lod (lod score) de una familia

Consideremos una familia para la cual conocemos los genotipos de los loci A y B de cada uno de sus miembros. 

Llamemos L(θ) a la probabilidad de una frecuencia de recombinación 0 ≤ θ

L(1/2) será la probabilidad de θ = 1/2, que es el caso de independencia de A y B, esto es, que ambos loci no se encuentran ligados y segregan de manera independiente.

El lod score de la familia para una determinada θ es: 

Z(θ) = log10 [L(θ)/L(1/2)]

Por lo que Z será una función de θ definida sobre el rango de [0,1/2].


Lod score de un conjunto de familias

La probabilidad de un determinado valor de θ obtenido a partir de un conjunto de familias independientes es el producto de la probabilidad en cada una de las familias, por lo que el lod score del conjunto será la suma de los lod scores de cada una de las familias. 

III. Prueba de ligamiento

Se han propuesto varios métodos para detector el ligamiento: las puntuaciones U (U score), la prueba de pares de hermanos (sib pair test), los cocientes de probabilidades (likelihood ratios), o la puntuación lod (lod score). En la actualidad el más utilizado es la puntuación lod (lod score). 
La prueba mediante el método de lod score es secuencial. La información, por ejemplo, el número de familias de la muestra, se acumula hasta que sea posible decidir entre las hipótesis alternativas H0 y H1:

H0: independencia θ = 1/2

y

H1: ligamiento con θ1, siendo 0 ≤ θ1

El lod score de la muestra considerando θ1 es:

Z(θ1) = log10 [L(θ1)/L(1/2)]


Que indica el cociente de probabilidades de que la muestra se encuentre bajo la hipótesis H1 ó H0. Así, un lod score de 3 indica que la probabilidad de que nuestra muestra se encuentre bajo la hipótesis H1 (ligamiento con esa frecuencia de recombinación) es 1000 veces superior a que se encuentre bajo la hipótesis H0 (independencia).

("lod = logaritmo de probabilidades o verosimilitudes, logarithm of the odds").

Los umbrales de decisión de la prueba son -2 y +3, por lo que si:

Z(θ1) ≥ 3 se rechaza H0, y se acepta que hay ligamiento.

Z(θ1) ≤ -2 se rechaza que hay ligamiento con θ1.

-21) 0 y H1. Se hace necesario continuar acumulando información (datos de más familias).

Para ambos umbrales escogidos, -2 y +3, podemos mostrar que:

El error de primer grado, α -3

El error de segundo grado, β -2

La fiabilidad, 1-ρ > 0.95 ∀ θ1

La potencia, P(θ) > 0.80 ∀ θ1 si el valor verdadero de θ

Figura 7

De hecho, lo que se comprueba no es un único valor de θ1 frente a θ = 1/2, sino un conjunto de valores entre 0 y 1/2 (cada 0,01 ó 0,05 unidades).

Si existe un valor de θ1 tal que Z(θ1) ≥ 3: se dice que hay ligamiento, probablemente con esa frecuencia de recombinación. 


Figura 8

Si hay un valor de θ1 tal que
Z(θ1) = -2

Se excluye el ligamiento para cualquier θ ≤ θ1



Figura 9

Si ∀ θ -2

Figura 10

Esta prueba tiene la ventaja de ser muy simple, y de ser lo suficientemente robusta para excluir falso ligamiento. Sin embargo, tiene varios inconvenientes, no solo por los criterios que utiliza sino por su propio procedimiento secuencial a la hora de ir añadiendo los datos de nuevas familias. Sin embargo, en realidad, rara vez se escoge el número de familias en función de los resultados obtenidos.

IV. Estimación de la fracción de recombinación

Si la prueba sobre una muestra de la familia ha demostrado ligamiento entre A y B, se puede desear estimar la fracción de recombinación entre ambos loci.

El mejor estimador del valor de θ es el valor que maximiza la función lod score Z, que es equivalente a tener en cuenta el valor de θ para el cual la probabilidad de ligamiento es la mayor.

IV. Fracción de recombinación entre un locus relacionado con la enfermedad y un locus marcador

Consideremos una enfermedad producida por un único gen, determinada por el alelo g0, localizado en el locus G (g0: alelo dañado, G0: alelo normal).

Lo que buscamos es el locus G de manera relativa al locus marcador T, cuyo lugar en el genoma se conoce. Para ello, podemos utilizar familias con uno o varios afectados por la enfermedad en los cuales se conoce el genotipo para T de cada uno de sus miembros.

Para ser capaces de usar el método lod score, deberemos ser capaces de extrapolar el genotipo en el locus G (o su probabilidad genotípica) a partir de los datos fenotípicos de los individuos (afectado, no afectado).


Figura 11
Necesitaremos conocer, en realidad:
  1. la frecuencia de g0
  2. la penetrancia f1, f2, f3
        f1 = probabilidad de afectado siendo g0g0
        f2 = probabilidad de afectado siendo g0G0
        f3 = probabilidad de afectado siendo G0G0

A menudo sucede que la información disponible para el propio locus marcador no es genotípica sino fenotípica. En este caso se deberían considerar también todos los casos posibles.

Como regla general, la información disponible sobre una familia hace referencia al fenotipo. Para calcular la probabilidad de θ, debemos tener previstas todas las posibles configuraciones de los distintos genotipos en cada uno de los loci para esta familia, escribir la probabilidad de θ para cada una de estas configuraciones, ponderarlas por la probabilidad de estas configuraciones, y conocer los fenotipos de los individuos en A y B.

Por ello, para poder estimar θ, es necesario conocer los parámetros genéticos de cada uno de los loci bajo estudio (frecuencias alélicas, valores de penetrancia fenotípica).

Además, debemos tener en cuenta que el cálculo de los valores de lod score, a pesar de ser muy simple en teoría, en realidad es un proceso lento y laborioso (se deben probar múltiples frecuencias de recombinación teniendo en cuenta múltiples situaciones); por lo que, en la práctica, se utilizan programas informáticos diseñados de manera específica.

El análisis del ligamiento genético ha hecho posible construir un mapa genético mediante la localización de nuevos polimorfismos de manera relativa unos con otros en el genoma. La medida utilizada en los mapas genéticos no es la fracción de recombinación, que no es aditiva, sino la distancia genética, que se define en otro capítulo.

Traducción: José Luis Vizmanos. Departamento de Genética, Facultad de Ciencias, Universidad de Navarra, Pamplona, Spain

Keywords

Linkage,Recombination fraction,lod score

Citation

Françoise Clerget-Darpoux

Atlas of Genetics and Cytogenetics in Oncology and Haematology 2022-03-04

Análisis de ligamiento genético

Online version: http://atlasgeneticsoncology.org/teaching/209082/an-lisis-de-ligamiento-gen-tico