Cargando Eventos

Título: Estudio de Complejidad en Secuencias de Aminoácidos de Proteínas
Director: Dr. Pablo Turjanski
Co-Director: Dr. Ignacio Sánchez
Jurados:
Dra. Verónica Becher
Dr. Diego Ferreiro

Resumen:
Motivados por la necesidad de explorar patrones estructurales y niveles de aleatoriedad en secuencias biológicas, este trabajo presenta el diseño e implementación de una herramienta para analizar la complejidad algorítmica de secuencias de aminoácidos en proteínas. La herramienta integra diversas medidas de complejidad: Icalc, discrepancia, discrepancia en bloque, entropía de Shannon, entropía de segundo orden, compresión basada en gzip y aproximaciones de Kolmogorov y Bennett.
Estas métricas se aplicaron a datos en formato FASTA de proteínas naturales obtenidas de UniProt, así como a variantes sintéticas generadas a partir de la modificación de dichas secuencias. Entre las variantes consideradas se incluyeron: shuffled (reordenamiento aleatorio de aminoácidos), random (generación aleatoria uniforme sobre el alfabeto de aminoácidos), sorted (orden alfabético) y single character (reemplazo por un único carácter repetido).
La herramienta permite cargar conjuntos de secuencias, aplicar funciones de complejidad y comparar resultados entre métodos, ofreciendo un marco flexible para futuros análisis. Los resultados obtenidos refuerzan la hipótesis de que las secuencias de aminoácidos de proteínas naturales son, en su mayoría, indistinguibles de secuencias sintéticas generadas al azar, siempre que se preserve la misma distribución de aminoácidos que en las proteínas reales.