La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, estructurados o no estructurados, siendo una continuación de áreas de análisis de datos como pueden ser la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.
En los últimos años, varios factores están contribuyendo al progreso de esta ciencia: la disponibilidad de los datos, la disponibilidad de equipos de cómputo de alto rendimiento y el desarrollo de arquitectura de aprendizaje automático que permita procesar los datos y entenderlos.
¿Qué hace un científico de datos?
El proceso que sigue un científico de datos para resolver algún problema que se le plantea se puede resumir en estos pasos:
- Extraer los datos, independientemente de la fuente y de su volumen. Muchas veces es necesario complementar con otros tipos de datos que ayuden a resolver el problema de que se pretende resolver.
- Limpiar y completar los datos, para eliminar lo que pueda sesgar los resultados e incluir información que de momento no se tiene.
- Procesar los datos usando métodos: estadísticos, de aprendizaje automático, métodos heurísticos, etcétera.
- Diseñar experimentos adicionales para aumentar la información que nos proporcionan los datos.
- Crear visualizaciones gráficas de los datos relevantes para la resolución del problema.
El programa de Maestría en Ciencia de Datos capacita a los egresados para poder cumplir con estas tareas y además les proporciona formación que les permite desarrollar e implementar soluciones a problemas reales de la sociedad en los ámbitos de los sectores productivos y de servicios.