
Defensa Tesis Licenciatura Patricio Tarantino
20 diciembre, 2019 @ 5:00 pm - 6:00 pm
Titulo: Compresores de datos como estimadores de diversidad en repertorios de células T
Director: Esteban Lanzarotti
Jurados: Pablo Turjanski y Diego Ferreiro
Resumen:
La diversidad de receptores de células T presentes en el cuerpo humano es una forma de saber la eficiencia del mismo, ya que nos permite saber a cuántos antígenos distintos es capaz de reconocer. Sin embargo, su medición es difícil pues no todos se presentan en muestras sanguíneas, y más aún, aunque tengamos a los receptores de células T, no es fácil saber qué antígeno reconocerán. Pero sí podemos suponer que receptores de células T con estructura similar reaccionarán frente a las mismas moléculas externas.
Proponemos entonces un modelo basado en los compresores de datos, que son capaces de reconocer patrones en cadenas de texto (cadenas de aminoácidos), que intentarán, dado un conjunto de receptores de células T, estimar su diversidad basado en su composición estructural, y a su vez, a cuántos antígenos distintos reconocen. Mejoraremos luego dicho modelo, que llamaremos CompreScore, agregando la noción de similitud entre aminoácidos provista por las matrices BLOSUM, que proveerá más información a los compresores a la hora de encontrar patrones y obtener información. Por último, probaremos nuestro modelo CompreScore frente a pacientes, y veremos que genera una nueva métrica de diversidad, independiente de las ya conocidas como Shannon o Simpson, y más aún, es también capaz de brindar información en otras dimensiones del paciente, como es su rango etario.