En el mundo
de hoy, la ciencia de los datos ha crecido inmensamente en una multitud de
industrias incluyendo finanzas, viajes, gobierno, etc., pero aún más
importante, las universidades han comenzado a reconocer la importancia de
ofrecer cursos y programas especializados en este campo.
La ciencia de datos es una de las piedras angulares de la innovación a medida que las empresas exploren su potencial revolucionario para transformar los procesos de negocio, generar nuevos modelos de negocio, aumentar la eficiencia de las operaciones y catalizar la innovación.
Podemos
definir la ciencia de datos es un campo multidisciplinario que involucra
procesos y sistemas para extraer conocimiento, centrado en el futuro realizando
análisis exploratorio para brindar recomendaciones basados en modelos
identificados por los datos pasados y presentes, representando alto valor para
el negocio.
Mientras la
ciencia de datos se pregunta:
Que sucederá
luego? Y Que debemos hacer para prevenir...? El análisis de datos se pregunta Qué
pasó? Y Por qué pasó?
La siguiente
tabla explica las diferencias con respecto a los procesos, herramientas, técnicas,
habilidades y resultados esperados:
Analisis
de Datos
|
Ciencia
de Datos
|
|
Perspectiva
|
Looking backward.
|
Looking forward.
|
Naturaleza
del Trabajo
|
Report and optimize.
|
Explore, discover, investigate and
visualize.
|
Resultados
|
Reports and Dashboards.
|
Data Product.
|
Herramientas
usadas
|
Hive, Impala, Spark SQl and HBase.
|
MLib and Mahout.
|
Técnicas
usadas
|
ETL and exploratory
analytics.
|
Predictive analytics and
sentiment analytics.
|
Habilidades
Necesarias
|
Data engineering, SQL and programming.
|
Statistics, Machine Learning and
programming.
|
