2026-03-17T00:00:00-03:00
Cargando Eventos

Título: Clasificación de proteínas usando maximal repeats: Desarrollo de funciones de distancia bajo un esquema de cambio de alfabeto
Director: Dr. Pablo Turjanski
Co-Director: Dr. Diego Ferreiro
Jurados:
Dr. R. Gonzalo Parra
Dra. Verónica Becher

Importante: Si bien la defensa coincide con una semana en la que se desarrollarán acciones vinculadas al reclamo por el cumplimiento de la Ley 27.795 de Financiamiento de la Educación Universitaria y la recomposición del salario docente, la fecha había sido fijada con anterioridad a dicha convocatoria y se ha decidido mantenerla de manera excepcional, dado que la estudiante iniciará una beca del Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET) a partir de abril.

Resumen:

Las proteínas son macromoléculas esenciales para la vida, caracterizadas por su gran diversidad funcional y estructural. Su clasificación resulta fundamental para permitir su estudio y compresión, así como para facilitar la caracterización de nuevas secuencias. Tradicionalmente, la clasificación estructural de proteínas se ha abordado mediante métodos basados en alineamiento de secuencias, los cuales presentan limitaciones computacionales y conceptuales. En este trabajo se analiza el potencial de las repeticiones maximales (MRs) como base para el desarrollo de métodos libres de alineamiento para la clasificación estructural de familias de proteínas. Se propusieron esquemas de reducción de alfabeto sobre las secuencias de proteínas, considerando un cambio de alfabeto previo (Pre-MRs) y posterior (Post-MRs) al cálculo de las repeticiones maximales. Ambos esquemas aplicados a funciones de distancia basadas en conjuntos de MRs, mostraron ser capaces de preservar la capacidad de las funciones de distancia para distinguir entre familias de proteínas generadas al azar(control) y familias naturales, aunque no permitieron recuperar agrupaciones estructurales de familias naturales entre sí. El esquema Post-MRs mostró poder recuperar esta separación incluso para alfabetos pequeños no triviales. Se exploraron además diferentes enfoques para el desarrollo de nuevas funciones de distancia. Se evaluó el potencial de usar las distancias contra las familias control como medida de agrupamiento, mostrando que varias de ellas permiten discriminar entre familias generadas al azar y naturales. Se presenta una nueva función de distancia basada en una extensión y variante simple de una función de familiaridad basada en cobertura de MRs. La misma demostró, al ser aplicada sobre familias de proteínas con el alfabeto original, tener la capacidad para diferenciar entre familias control y naturales, así como también para recuperar a un subconjunto de familias repetitivas. Este último enfoque constituye un primer acercamiento prometedor para el desarrollo de nuevas funciones de distancia bajo un esquema de cambio de alfabeto. Por último, se plantean nuevas variaciones de esta función para evaluar en líneas futuras.
Ir a Arriba