Herramientas Personales
Usted está aquí: Inicio / Agenda / Defensa Tesis Licenciatura Martín Fixman

Defensa Tesis Licenciatura Martín Fixman

Título: Estudio Comparativo de Métodos para la Inferencia de Nivel Socioeconómico en un Grafo de Comunicaciones. Director: Carlos Sarraute. Codirector: Esteban Feuerstein. Jurados: Agustín Gravano y Leandro Lombardi.

Detalles del evento

Cuándo

12/11/2018
de 11:00 a 12:00

Dónde

Aula a confirmar

Agregar evento al calendario

  • Título: Estudio Comparativo de Métodos para la Inferencia de Nivel Socioeconómico en un Grafo de Comunicaciones.
  • Director: Carlos Sarraute.
  • Codirector: Esteban Feuerstein.
  • Jurados: Agustín Gravano y Leandro Lombardi.
  • Resumen:

Obtener y procesar datos demográficos y sociológicos fueron uno de los procesos más importantes para entender fenómenos que afectan a toda la población desde por lo menos el Siglo XVII [Fri06], y encontrar formas simples e intuitivas de visualizarlos tiene un gran impacto en nuestra manera de entender los datos [Min44, Sno55]. Formas comunes de obtener datos cuantitativos de estratificación económica usualmente involucran investigación de archivos o encuestas sociales [Bul77], y dependen de métodos estadísticos.

Las operadoras de telecomunicaciones ("telcos") tienen acceso a una gran cantidad de información sobre las comunicaciones y hábitos de sus usuarios [Huu03], pero la habilidad de guardar y procesar esos datos ha dado grandes pasos en los últimos años gracias a nuevas y más poderosas computadoras y técnicas de minería de datos. Lo mismo puede decirse sobre la información sociológica y económica contenida por bancos y tarjetas de crédito, y por la relación entre estas dos fuentes de datos. La minería de datos de telcos a gran escala es un área relativamente nueva que se usa principalmente para aplicaciones internas [HAK+02], pero la gran cantidad de información sociológica es de gran interés para temas académicos relacionados a la sociología. Esta tesis se basa en métodos usaros por Óskarsdottir et al. [ÓBV+16] y Singh et al. [SFLP13], además de una fuente de información de una telco y de un banco grande para encontrar que la distribución de ingresos de los usuarios sigue de manera cercana (pero no exacta) la distribución de ingresos de la población en general.

Hay una fuerte homofilia entre los ingresos de contactos en la telco, que se usa junto con la distribución desigual de dinero en la población para crear una metodología, basada en estadística bayesiana, para inferir el nivel socioeconómico de un gran subconjunto de usuarios en la red sin información bancaria con AUC = 0.746. El método bayesiano es luego comparado con otros métodos basados en aprendizaje automático supervisado para probar que, aunque toma menos información de entrada, es un mejor predictor de características sociales en este tipo particular de red.