Análisis de ligamiento genético

I- Fracción de recombinación

II- Definición de la puntuación Lod (lod score) de una familia

III- Prueba de ligamiento

IV- Estimación de la fracción de recombinación

V- Fracción de recombinación entre un locus relacionado con la enfermedad y un locus marcador

Una manera de comprobar la independencia de la transmisión de una serie de genes situados en distintos loci es analizar su segregación simultánea. Esta independencia se refleja en la fracción de recombinación, θ, que es el porcentaje de gametos recombinantes transmitidos por los progenitores. Si los loci se transmiten de manera independiente, existirán el mismo número de gametos recombinantes que de gametos con las combinaciones parentales de alelos, por lo que θ = 1/2. Sin embargo, si estos loci no se transmiten de manera independiente, los gametos con las combinaciones parentales de alelos se transmitirán en una frecuencia mayor, y 0 ≤ θ < 1/2. En este ultimo caso se dice que existe "ligamiento" entre los loci.

I- Fracción de recombinación

Consideremos el caso de dos loci, A y B, con dos alelos codominantes en cada uno de ellos, A1, A2 y B1, B2 respectivamente. Un individuo doble heterocigoto para ambos puede producir cuatro tipos de gametos:

A₁B₁A₂B₁A₁B₂
A₂B₂

Son posibles dos situaciones:

1- Que los loci A y B se encuentren en distintos pares cromosómicos. En este caso, cada uno de los cuatro gametos tiene la misma probabilidad de producirse: 1/4.

Figura 1

2- Que los loci A y B se encuentren en el mismo par cromosómico. En este caso, de nuevo, tendremos dos situaciones posibles: que los alelos A₁ y B₁ se encuentren en el mismo cromosoma del par, esto es, que A₁ y B₁ estén en "acoplamiento" (coupling); o que los alelos A₁ y B₁ se encuentren en distintos cromosomas del par, esto es, que A₁ y B₁ estén en "repulsión" (repulsion).

Figura 2

Por ejemplo, supongamos que A₁ y B₁ están en "acoplamiento". Se producirán cuatro tipos de gametos:

Figura 3

Los gametos A₁B₁ y A₂B₂ se dice que son "parentales", ya estas combinaciones estaban presentes en los cromosomas parentales o de los progenitores.

Por el contrario, los gametos A₁B₂ y A₂B₁ se considerarán "recombinantes" ya que serán consecuencia de la existencia de recombinación o entrecruzamiento entre los loci A y B.

Figura 4

Asumiendo que la existencia de un entrecruzamiento entre un par homólogo de cromosomas sigue la ley de Poisson, y que un gameto parental tiene entre cero y un número par de entrecruzamientos, mientras que un gameto recombinante tiene un número impar, se puede demostrar que la frecuencia de gametos recombinantes es siempre igual o inferior a la frecuencia de los gametos parentales, por lo que

0 ≤ θ < 1/2

Cuando θ = 1/2, todos los tipos de gametos tienen la misma probabilidad de producirse y los alelos situados en los loci A y B se transmiten de manera independiente. Por ello, en ese caso los loci A y B no están ligados. Esta es la situación que se produce cuando A y B se encuentran en distintos pares de cromosomas, y también cuando A y B se encuentran en el mismo par pero a una distancia importante el uno del otro.

Sin embargo, si θ < 1/2, se dice que ambos loci se encuentran genéticamente ligados.

En una pareja en la que se conocen los genotipos de A y B, la probabilidad de los genotipos de la descendencia dependerá del valor de θ.

Consideremos el siguiente cruzamiento:

Figura 5

Esa pareja puede tener cuatro tipos de descendientes:

Figura 6

Asumiendo que existe equilibrio gamético entre los loci A y B, en el progenitor 1 existe una probabilidad de 1/2 de que los alelos A₁ y B₁ se encuentren en "acoplamiento", y una probabilidad de 1/2 de que se encuentren en "repulsión".

(1) Si A1 y B1 se encuentran en "acoplamiento", la probabilidad de que el progenitor (1) suministre cada uno de los gametos A₁B₁ y A₂B₂ es (1-θ)/2 y la probabilidad de que este progenitor suministre cada uno de los gametos A₁B₂ y A₂B₁ es θ/2. Dado que el otro progenitor produce un único tipo de gameto (A₁B₁) la probabilidad de que la pareja tenga un descendiente de tipo (1) ó (2) será (1-θ)/2, y de que tenga un descendiente de tipo (3) ó (4) será θ/2.

Por lo tanto, la probabilidad de encontrar n₁ descendientes de tipo (1), n₂ de tipo (2), n₃ de tipo (3) y n₄ de tipo (4) es:

[(1- θ)/2]ⁿ¹⁺ⁿ² x (θ/2)ⁿ³⁺ⁿ⁴

(2) Si A1 y B1 se encuentran en un estado de "repulsión", la probabilidad de que el progenitor (1) suministre cada uno de los gametos A₁B₂ y A₂B₁ es (1-θ)/2 y la probabilidad de que este progenitor suministre cada uno de los gametos A₁B₁ y A₂B₂ será θ/2.

Por lo tanto, la probabilidad en este caso de encontrar n₁ descendientes de tipo (1), n₂ de tipo (2), n₃ de tipo (3) y n₄ de tipo (4) es:

(θ/2)ⁿ¹⁺ⁿ² x[(1-θ)/2]ⁿ³⁺ⁿ⁴

Por ello, sin información acerca de la fase (acoplamiento o repulsión) en la que se encuentran los alelos A₁ y B₁, asumiendo que los genes A y B se encuentran ligados y en equilibrio de ligamiento, la probabilidad de encontrar n₁, n₂, n₃ y n₄ descendientes de las categorías (1), (2), (3), (4) es:

p(n₁,n₂,n₃,n₄/θ) = 1/2{[(1 -θ)/2]ⁿ¹⁺ⁿ² x (θ/2)ⁿ³⁺ⁿ⁴ + (θ/2)ⁿ¹⁺ⁿ² x [(1-θ)/2]ⁿ³⁺ⁿ⁴}

Por lo que la probabilidad de θ para una observación de n₁, n₂, n, n₄ se puede escribir como:

L(θ/n1,n2,n3,n4) = 1/2 {[(1-θ)/2]ⁿ¹⁺ⁿ² (θ/2)ⁿ³⁺ⁿ⁴ + (θ/2)ⁿ¹⁺ⁿ² [(1-θ)/2]ⁿ³⁺ⁿ⁴}

Caso especial: número de descendientes n= 1

Independientemente de la categoría a la que pertenezca el descendiente

L(θ) = 1/2 [(1-θ)/2] + 1/2 [θ/2] = 1/4

La probabilidad de esta observación en la familia no depende de θ, sino que es al azar. Podemos decir que esta familia no será informativa para θ.

Familias informativas

Una "familia informativa" es aquélla para la cual la probabilidad de la descendencia es una función variable de θ.

Por lo tanto, una condición esencial para que una familia sea informativa es que tenga más de un descendiente. Más aun, uno de los progenitores debe ser heterocigoto.

Definiciones: cuando uno de los progenitores es heterocigoto doble y el otro es

un doble homocigoto, tenemos un cruzamiento prueba

un homocigoto para uno de los loci, tenemos un cruzamiento prueba simple

un doble heterocigoto, tenemos un cruzamiento doble

II- Definición de la puntuación Lod (lod score) de una familia

Consideremos una familia para la cual conocemos los genotipos de los loci A y B de cada uno de sus miembros.

Llamemos L(θ) a la probabilidad de una frecuencia de recombinación 0 ≤ θ< 1/2

L(1/2) será la probabilidad de θ = 1/2, que es el caso de independencia de A y B, esto es, que ambos loci no se encuentran ligados y segregan de manera independiente.

El lod score de la familia para una determinada θ es:

Z(θ) = log₁₀ [L(θ)/L(1/2)]

Por lo que Z será una función de θ definida sobre el rango de [0,1/2].

Lod score de un conjunto de familias

La probabilidad de un determinado valor de θ obtenido a partir de un conjunto de familias independientes es el producto de la probabilidad en cada una de las familias, por lo que el lod score del conjunto será la suma de los lod scores de cada una de las familias.

III- Prueba de ligamiento

Se han propuesto varios métodos para detector el ligamiento: las puntuaciones U (U score), la prueba de pares de hermanos (sib pair test), los cocientes de probabilidades (likelihood ratios), o la puntuación lod (lod score). En la actualidad el más utilizado es la puntuación lod (lod score).

La prueba mediante el método de lod score es secuencial. La información, p.ej. el número de familias de la muestra, se acumula hasta que sea posible decidir entre las hipótesis alternativas H₀ y H₁:

H₀ : independencia θ = 1/2

H₁: ligamiento con θ₁, siendo 0 ≤ θ₁ < 1/2

El lod score de la muestra considerando θ₁ es

Z(θ₁) = log₁₀ [L(θ₁)/L(l/2)]

Que indica el cociente de probabilidades de que la muestra se encuentre bajo la hipótesis H₁ ó H₀. Así, un lod score de 3 indica que la probabilidad de que nuestra muestra se encuentre bajo la hipótesis H₁ (ligamiento con esa frecuencia de recombinación) es 1000 veces superior a que se encuentre bajo la hipótesis H₀ (independencia).

("lod = logaritmo de probabilidades o verosimilitudes, logarithm of the odds").

Los umbrales de decisión de la prueba son -2 y +3, por lo que si:

₁

₀

Z(θ₁) ≤ -2 se rechaza que hay ligamiento con θ₁.

-2< (Zθ₁) < 3 es imposible decidir entre H₀ y H₁. Se hace necesario continuar acumulando información (datos de más familias).

Para ambos umbrales escogidos, -2 y +3, podemos mostrar que:

El error de primer grado, α < 10^-3

El error de segundo grado, β < 10^-2

La fiabilidad, 1-ρ > 0.95 ∀ θ₁

La potencia, P(θ) > 0.80 ∀ θ₁ si el valor verdadero de θ < 0.10

Figura 7

De hecho, lo que se comprueba no es un único valor de θ₁ frente a θ = 1/2, sino un conjunto de valores entre 0 y 1/2 (cada 0,01 ó 0,05 unidades).

Si existe un valor de θ₁ tal que Z(θ₁) ≥ 3: se dice que hay ligamiento, probablemente con esa frecuencia de recombinación.

Figura 8

Si hay un valor de θ₁ tal que

Z(θ₁) = -2

Se excluye el ligamiento para cualquier θ ≤ θ₁

Figura 9

Si ∀ θ -2 < Z(θ) < 3, no se puede llegar a ninguna conclusión, la muestra no es lo suficientemente informativa.

Figura 10

Esta prueba tiene la ventaja de ser muy simple, y de ser lo suficientemente robusta para excluir falso ligamiento. Sin embargo, tiene varios inconvenientes, no solo por los criterios que utiliza sino por su propio procedimiento secuencial a la hora de ir añadiendo los datos de nuevas familias. Sin embargo, en realidad, rara vez se escoge el número de familias en función de los resultados obtenidos.

IV- Estimación de la fracción de recombinación

Si la prueba sobre una muestra de la familia ha demostrado ligamiento entre A y B, se puede desear estimar la fracción de recombinación entre ambos loci.

El mejor estimador del valor de θ es el valor que maximiza la función lod score Z, que es equivalente a tener en cuenta el valor de θ para el cual la probabilidad de ligamiento es la mayor.

V- Fracción de recombinación entre un locus relacionado con la enfermedad y un locus marcador

Consideremos una enfermedad producida por un único gen, determinada por el alelo g₀, localizado en el locus G (g₀: alelo dañado, G₀: alelo normal).

Lo que buscamos es el locus G de manera relativa al locus marcador T, cuyo lugar en el genoma se conoce. Para ello, podemos utilizar familias con uno o varios afectados por la enfermedad en los cuales se conoce el genotipo para T de cada uno de sus miembros.

Para ser capaces de usar el método lod score, deberemos ser capaces de extrapolar el genotipo en el locus G (o su probabilidad genotípica) a partir de los datos fenotípicos de los individuos (afectado, no afectado).

Figura 11

Necesitaremos conocer, en realidad:

la frecuencia de g₀

la penetrancia f₁, f₂, f₃

f₁ = probabilidad de afectado siendo g₀g₀

f₂ = probabilidad de afectado siendo g₀G₀

f₃ = probabilidad de afectado siendo G₀G₀

A menudo sucede que la información disponible para el propio locus marcador no es genotípica sino fenotípica. En este caso se deberían considerar también todos los casos posibles.

Como regla general, la información disponible sobre una familia hace referencia al fenotipo. Para calcular la probabilidad de θ, debemos tener previstas todas las posibles configuraciones de los distintos genotipos en cada uno de los loci para esta familia, escribir la probabilidad de θ para cada una de estas configuraciones, ponderarlas por la probabilidad de estas configuraciones, y conocer los fenotipos de los individuos en A y B.

Por ello, para poder estimar θ, es necesario conocer los parámetros genéticos de cada uno de los loci bajo estudio (frecuencias alélicas, valores de penetrancia fenotípica).

Además, debemos tener en cuenta que el cálculo de los valores de lod score, a pesar de ser muy simple en teoría, en realidad es un proceso lento y laborioso (se deben probar múltiples frecuencias de recombinación teniendo en cuenta múltiples situaciones); por lo que, en la práctica, se utilizan programas informáticos diseñados de manera específica.

El análisis del ligamiento genético ha hecho posible construir un mapa genético mediante la localización de nuevos polimorfismos de manera relativa unos con otros en el genoma. La medida utilizada en los mapas genéticos no es la fracción de recombinación, que no es aditiva, sino la distancia genética, que se define en otro capítulo.

Traducción : José Luis Vizmanos. Departamento de Genética, Facultad de Ciencias, Universidad de Navarra, Pamplona, Spain

Contributor(s)

Written	2002-05	Françoise Clerget-Darpoux
		Unité de Recherche d'Epidémiologie Génétique, INSERM U535, Kremlin-Bicêtre, France

Citation

Clerget-Darpoux F

Atlas of Genetics and Cytogenetics in Oncology and Haematology 2002-05-01

Análisis de ligamiento genético

Online version: http://atlasgeneticsoncology.org/teaching/30091/an-aacute;lisis-de-ligamiento-gen-eacute;tico