miércoles, 4 de enero de 2017

La ciencia de datos dice: Presente

En el mundo de hoy, la ciencia de los datos ha crecido inmensamente en una multitud de industrias incluyendo finanzas, viajes, gobierno, etc., pero aún más importante, las universidades han comenzado a reconocer la importancia de ofrecer cursos y programas especializados en este campo.

La ciencia de datos es una de las piedras angulares de la innovación a medida que las empresas exploren su potencial revolucionario para transformar los procesos de negocio, generar nuevos modelos de negocio, aumentar la eficiencia de las operaciones y catalizar la innovación.

Podemos definir la ciencia de datos es un campo multidisciplinario que involucra procesos y sistemas para extraer conocimiento, centrado en el futuro realizando análisis exploratorio para brindar recomendaciones basados en modelos identificados por los datos pasados y presentes, representando alto valor para el negocio.

Mientras la ciencia de datos se pregunta:

Que sucederá luego? Y Que debemos hacer para prevenir...? El análisis de datos se pregunta Qué pasó? Y Por qué pasó?

La siguiente tabla explica las diferencias con respecto a los procesos, herramientas, técnicas, habilidades y resultados esperados:


Analisis de Datos
Ciencia de Datos
Perspectiva
Looking backward.
Looking forward.

Naturaleza del Trabajo
Report and optimize.
Explore, discover, investigate and visualize.

Resultados
Reports and Dashboards.
Data Product.

Herramientas usadas
Hive, Impala, Spark SQl and HBase.

MLib and Mahout.
Técnicas usadas
ETL and exploratory analytics.

Predictive analytics and sentiment analytics.
Habilidades Necesarias
Data engineering, SQL and programming.

Statistics, Machine Learning and programming.



















No hay comentarios:

Publicar un comentario