Defensa Tesis Licenciatura Diego Larralde y David Vacca
Título: "Estudio del uso de la NCD para la inferencia de árboles filogenéticos". Director: Martín Urtasun
| Qué |
|
|---|---|
| Cuándo |
27/10/2009 de 03:00 pm a 04:00 pm |
| Dónde | Aula Magna, Pab. I |
| Agregar evento al calendario |
|
- Título: "Estudio del uso de la NCD para la inferencia de árboles filogenéticos"
- Alumnos: Diego Larralde y David Vacca
- Director: Martín Urtasun
- Jurados: Verónica Becher, Esteban Hasson
RESUMEN
La similitud de secuencias es la noción matemática primordial para los estudios biológicos sobre filogenética. Los enfoques clásicos aportados desde la bioinformática para la resolución de estos problemas utilizan algoritmos de alineamiento para obtener una noción de similitud entre dos secuencias biológicas. Sin embargo este tipo de métodos no son adecuados cuando las secuencias a comparar son muy diferentes entre sí. Esta es una de las razones principales, por las que las medidas de similitud entre secuencias que no requieren el alineamiento de las mismas, son una nueva alternativa para abordarlos. Paul Vitányi definió la Medida de Similitud Universal (Universal Similarity Metric) basada en la complejidad de largo de programa definida por Chaitin-Kolmogorov. Dado que esta noción no es computable, el mismo Vitányi propuso su aproximación utilizando compresores estándares de texto, definiendo así la Distancia de Compresión Normalizada (Normalize Compression Distance).
En este trabajo abordamos el estudio del uso de la NCD definida por Vitányi a un importante problema de la biología como lo es la inferencia de árboles filogenéticos. El mismo Vitányi abordó ligeramente este tema, sin profundizar ni realizar un análisis crítico al respecto.
En primer lugar, estudiamos este problema y las herramientas informáticas existentes que se utilizan para resolverlo. Luego analizamos y comparamos el uso de distintos compresores que pueden ser utilizados para aplicar el método de Vitányi, analizando sus limitaciones y ventajas. Clasificamos este método, desde el punto de vista de los tipos de métodos actualmente utilizados para la inferencia de árboles filogenéticos. Para la realización de los experimentos se utilizaron datasets tradicionales, utilizados en distintas publicaciones relacionadas con este tema y que conforman la bibliografía de este trabajo; también se programaron adaptadores que permiten utilizar la métrica basada en la NCD dentro del PAUP. El PAUP es un paquete de software utilizado para inferir árboles evolutivos, ampliamente difundido en la comunidad bioinformática. Incorporar la NCD al conjunto de métricas disponibles dentro de PAUP, nos permitió comparar nuestros resultados, directamente con los obtenidos mediante los métodos actualmente existentes.


