viernes, 7 de mayo de 2010

Los archivos de la evolución II/II

Por primera vez en la historia, los científicos tiene la oportunidad de estudiar la evolución de genomas completos, y de reconstruir la historia de la vida. La cantidad de datos y la complejidad de los procesos que moldean los genomas plantean serios problemas que apenas empiezan a ser atacados.
El proceso para reconstruir una historia evolutiva inicia normalmente con un alineamiento entre secuencias homólogas de ADN o de aminoácidos (cuando se compara la evolución a nivel de proteínas); alinear quiere decir encontrar los sitios equivalentes entre las secuencias, e identificar los gaps, que son regiones en las que una de las secuencias ha ganado o perdido un fragmento.


Ejemplo de alineamiento entre 4 secuencias se ADN. Los guiones representan gaps

Los algoritmos tradicionales crean un árbol guía de baja calidad en el cuál se basan para alinear las secuencia, esto tiene como desventaja que todo el análisis posterior depende de la elección del árbol guía; además, la mayoría de estos algoritmos consideran los gaps o indeles como información faltante, ignorando una buena parte de la dinámica evolutiva de las secuencias.

Los intentos más recientes por mejorar estos métodos, se basan en cadenas de Markov combinadas con métodos Monte Carlo (MCMC), que básicamente consisten en simular cada sitio en un alineamiento, como una variable en transición entre tres estados (coincidencia, diferencia, gap) con probabilidades asociadas, lo que permite calcular la verosimilitud de un alineamiento dado. Desde un punto de vista matemático, la solución óptima es la integral a lo largo de la distribución conjunta de árboles y alineamientos; sin embargo, no es factible resolver esta integral computacionalmente por lo que todos los métodos se basan en un camino aleatorio a lo largo y ancho de esta distribución.

Una vez obtenido el alineamiento, éste se usa para estimar la filogenia (o árbol) de los organismos de donde provienen las secuencias alineadas. El mayor reto metodológico en este paso, es que los alineamientos representan las historia de los genes, y normalmente lo que se busca es la historia de los organismos. Es muy importante recalcar esta diferencia, ya que incluso muchos trabajos científicos la pasan por alto, que se comprende mejor cuando entendemos que el repertorio de genes de una población no es estable a lo largo del tiempo; genes se ganan y pierden a lo largo de la historia mediante una variedad de procesos, y este problema es análogo al de los indeles en un alineamiento.


Esquema del proceso de reconstrucción filogenética. La historia de los organismos afecta a las secuencias que se usan en el alineamiento, que se estima simultáneamente con los árboles. Para estimar los árboles de organismos es necesario tomar en cuenta la dinámica del genoma que es afectada por la historia evolutiva.

La duplicación génica es uno de los procesos mejor comprendidos, tanto a nivel molecular como evolutivo, y recientemente se desarrolló un algoritmo que usa un método MCMC, para modelar un proceso de nacimiento-muerte de los genes de un organismo. Este algoritmo ha mejorado a sus predecesores en varios aspectos, pero su mayor limitación es que utiliza una sola tasa de duplicación y pérdida para todas las ramas en una filogenia, cuando se sabe que existe una gran heterogeneidad en estos parámetros. Un modelo más realista tendrá que esperar a que se desarrolle la estadística necesaria, y contribuirá no sólo a una mejor estimación de las filogenias, sino a una mejor comprensión de este aspecto de la dinámica de los genomas.

El mayor de todos los problemas, que enfrentan quienes intentan reconstruir filogenias, es sin duda la transferencia genética horizontal (TGH), esto significa básicamente que un gen no es transmitido a la progenie, sino a un organismo no relacionado directamente. Los mecanismos moleculares son muy variados, y las implicaciones para la reconstrucción filogenética enormes. Si un gen pasa de una rama del árbol de los organismos a otra entonces no podemos usarlo para la reconstrucción. La comunidad científica apenas ha dado el primer paso para enfrentar este problema; consiste en un algoritmo que estima simultáneamente el árbol de los organismos y los árboles de una gran cantidad de genes, y usa la distribución conjunta para calcular, tanto la probabilidad de que un gen haya pasado por TGH, como el mejor árbol de los organismos. Aunque esto representa un avance enorme, la complejidad del problema hace que sólo se puedan analizar hasta 6 organismos.

La historia de los genomas es básicamente la historia de la seres vivos, el aumento en la cantidad de datos disponibles ha demostrado que se trata de entidades dinámicas sujetas a una gran variedad de procesos. Hasta la fecha no existe un modelo estadístico que capaz de incluir todo los procesos conocidos, pero los avances realizados permiten no sólo reconstruir la historia de la vida, sino comprender mejor los procesos que la moldean.

Los archivos de la evolución I/II

Referencias:
  • Bossau & Daubin "Genomes as documents of evolutionary history" (2010), Trends in Ecology And Evolution Vol. 25 No. 4 pp. 224-232.
  • Zuckerkandl & Pauling. "Molecules as documents of evolutionary history" (1965). Journal of Theoretical Biology Vol. 8 No. 2 pp. 357-366.

1 comentario:

Anónimo dijo...

Qué tal somos de la Agencia Investigación y Desarrollo. Nos damos a la tarea de trabajar con información de ciencia, tecnología e innovación. Estamos interesados en hacerles llegar nuestros textos para que de ahí puedan retomar temas, ideas o las mismas notas.
Nuestra prioridad es darle a conocer a la sociedad los avances que se hacen en México en torno a la ciencia.

Dejamos nuestra página para que puedan revisarla www.invdes.com.mx/

Estamos en contacto

Atte: AgenciaID

Publicar un comentario

 
Creative Commons License
La Ciencia explicada by La Ciencia explicada is licensed under a Creative Commons Attribution-Noncommercial 3.0 Unported License.