Defensa Tesis Licenciatura Marcos Foglino
Título: "Identificación biológica de repeticiones en secuencias de ADN del genoma humano". Directores: Martín Urtasun y Verónica Becher.
| Qué |
|
|---|---|
| Cuándo |
29/10/2009 de 03:00 pm a 04:00 pm |
| Dónde | Aula E24 |
| Agregar evento al calendario |
|
- Título: "Identificación biológica de repeticiones en secuencias de ADN del genoma humano"
- Alumno: Marcos Foglino
- Directores: Martín Urtasun y Verónica Becher
- Jurados: Irene Loiseau, Hernan Dopazo (ausente), Pablo Turjanski
RESUMEN
Paul Vitányi definió la Medida de Similitud Universal (Universal Similarity Metric) basada en la complejidad de largo de programa definida por Chaitin-Kolmogorov. Esta métrica aplicada a dos secuencias de caracteres, permite medir su similitud en función de la cantidad de información que tienen en común. Dado que esta noción no es computable, el mismo Vitányi propuso su aproximación utilizando compresores estándares de texto, a la cual denominó Distancia de Compresión Normalizada (Normalized Compression Distance, NCD).
Esta noción de distancia o similitud, puede ser aplicada al dominio de la biología molecular, debido a la utilización de cadenas de caracteres como medio de representación. En particular, el ADN es representado como una secuencia de caracteres correspondientes al alfabeto A, G, C y T. El estudio de las repeticiones de secuencias dentro del ADN, es algo de relevante importancia hoy en día.
Con el objetivo de aplicar los conceptos relacionados con la NCD a grandes volúmenes de información de naturaleza biológica, el grupo KAPOW del Departamento de Computación de la FCEN de la UBA desarrolló e implementó varios algoritmos, dentro de los cuales se destaca la herramienta findpat, la cual es capaz de identificar repeticiones entre secuencias de gran tamaño.
El principal aporte del presente trabajo, consistió en la identificación biológica de las repeticiones detectadas por findpat al aplicarse a cromosomas enteros del hombre. Dicha identificación, permitió no sólo confirmar el buen funcionamiento de la herramienta, sino también despertar el interés del estudio particular de las salidas generadas por el programa, aplicado a diversas fuentes de datos (genes, transposones, etc.). A partir de la identificación lograda, se realizó un análisis comparativo entre las repeticiones encontradas entre los cromosomas de la especie humana y algunas bases de datos de secuencias conocidas, obteniendo conclusiones que abren las puertas para futuros estudios.


