El 14 de diciembre Pablo Ariel Heiber -doctor en Ciencias de la Computación de la FCEN-UBA e ingeniero de software en Google Inc San Francisco- dictó en el DC la charla ‘Encuestando más que personas: técnicas de muestreo pesado y su implementación distribuida’.
Durante el encuentro, que reunió a alumnos, docentes e investigadores de esta casa de estudios, Heiber puntualizó que la técnica de muestreo no se usa solamente cuando el universo analizado consiste en personas (como por ejemplo serían las encuestas de opinión pública para las elecciones presidenciales) sino siempre que cierta parte de la información a analizar es muy costosa a nivel plata, tiempo, memoria o cualquier otro recurso, con respecto al tamaño del universo analizado.
En esta presentación, desarrolló un análisis teórico y experimental sobre los métodos de muestreo y su implementación en un entorno distribuido cuando el universo analizado es pesado, es decir, considerando una distribución no uniforme. Al respecto, señaló que al momento de conseguir financiamiento se puede “pesar” a las personas por su capacidad económica, o cuando se analiza la velocidad de acceso a cierto sitio de internet, se puede ponderar por la frecuencia de los accesos.
Como resultado, Heiber presentó un método de muestreo de mínima varianza entre todos los métodos no sesgados, y demostró experimentalmente que esta técnica reduce un 50% el costo del análisis en relación a otras alternativas posibles. Por último, explicó que, por ejemplo, este tipo de técnicas pueden implementarse de manera sencilla para los buscadores de internet o la publicidad online, por lo que las mismas se encuentran en pleno desarrollo.
Acerca del Conferencista
Pablo Ariel Heiber se licenció y doctoró en Ciencias de la Computación en la FCEN, UBA, en la que también fue docente por 9 años. Actualmente continúa conectado con la facultad contribuyendo a la organización local, nacional y latinoamericana de la competencia ACM ICPC. Desde 2015 trabaja en Google Inc en San Francisco, donde se dedica a estudiar cuantitativamente el índice del buscador de dicha compañía.