Big Data es una palabra de moda que se utiliza en los medios para hablar de cualquier cosa que tenga que ver con datos, tanto lo referido a captura, almacenamiento o visualización como con el proceso analítico que lleva a extraer valor de los datos.
Predicción: dentro de unos años ya no se hablará de “Big Data”. En Estados Unidos el término “Big Data” ya está quedando obsoleto. Pronto lo estará aquí también.
Un poco de contexto sobre Datos, Analítica y Big Data
Con las grandes cantidades de datos disponibles actualmente, las empresas en casi todas los sectores están almacenando y analizándolos para obtener una ventaja competitiva.
Muy a menudo, se utilizan datos para conocer el comportamiento de los clientes con el fin de minimizar el riesgo de abandono y maximizar el valor de cada cliente. Le llamamos “Customer Analytics”.
People Analytics es la ciencia y el arte de aplicar técnicas de Ciencia de los datos al área de los recursos humanos con el objetivo de conocer mejor a nuestros colaboradores y aumentar su grado de satisfacción y productividad.
El aumento de los costes en el caso de la industria de la salud hace que el análisis de datos se convierta en crítico para tomar decisiones de negocio. El resultado es que las organizaciones de la industria farmacéutica analizan grandes cantidades de datos para reducir costes, abordar problemas relacionados con la variabilidad de la calidad de la asistencia sanitaria y escalonar el gasto sanitario.
En el sector financiero, la ciencia de datos se utiliza para evaluar la capacidad de crédito de los clientes (”credit scoring”) y para la detección del fraude.
En el sector de Retail (minoristas), las grandes compañías se valen de la ciencia de datos para tomar decisiones estratégicas en su cadena de suministro.
En Smart Cities, podemos contar con redes eléctricas inteligentes, definir las rutas óptimas de recogida de basura en tiempo real, poder anticiparse a los atascos
Sin embargo, datos y analítica no es lo mismo que Big Data, aunque los medios se empeñen en confundirlos. Entonces ¿cuándo empiezan los datos a ganarse el adjetivo Big?
¿Qué significa realmente BIG DATA para los profesionales de datos?
Existe un consenso universal de los profesionales de datos a la hora de definir BIG DATA. Y, ¡atención!, no tiene nada que ver con lo que vemos diariamente en los medios.
Para nosotros, sin ponerse muy técnico, un proyecto de BIG DATA es simplemente el que se necesita más de una máquina para procesar esos datos. Un proyecto de BIG DATA está relacionado siempre con conceptos como computación distribuida, HADOOP, SPARK y tecnologías similares que permiten almacenar y procesar datos por medio de clusters (agrupaciones) de ordenadores generalmente baratos que trabajan juntos agregando almacenamiento y potencia.
Decimos que utilizamos tecnología Big Data cuando por el volumen de datos o por la necesidad de velocidad en las respuestas o por la variedad en los tipos de datos tenemos que utilizar un grupo de ordenadores que trabajan juntos como si fuera uno solo.
En esencia Big Data sigue siendo lo mismo que planteó Doug Laney en 2001, las tres Uves, Volumen, Velocidad y Variedad y sigue señalando desafíos que exigen recursos y procesos de computación que requieren ordenadores trabajando de forma distribuida.
Cada vez más empresas utilizan datos y analítica. Muy pocas utilizan Big Data.
Dan Ariely, el autor de Predictably Irrational ya adelanta ese estado de confusión cuando dijo en 2011 (http://on.fb.me/1PpQcYG):
Big Data es como el sexo en la adolescencia: todo el mundo habla de él, nadie sabe cómo hacerlo, todos creen que los demás lo están haciendo y, claro, todos dicen que lo hacen.
En realidad en España muy pocas organizaciones necesitan recurrir a tecnologías de Big Data para extraer valor de los datos. Todos los profesionales del sector lo confirmarán: en más del 95% de los proyectos en los que trabajamos un servidor contemporáneo es capaz de procesar los datos en el tiempo adecuado. No es necesario, por tanto, recurrir a tecnologías Big Data.
Datos a secas
El término “Big Data” ha sido vapuleado en los últimos años. Lo han estirado y comprimido para llevarlo a cubrir multitud de problemas, tecnología y productos. Es un término confuso. El BIG de Big Data es tan inapropiado como cuando en el siglo XXI algunos siguen hablando de “NUEVAS Tecnologías” para referirse a Internet y otros entornos digitales. ¿Sigue siendo nuevas esas tecnologías, después de tantos años?
Así que preferimos hablar de “Datos” a secas y no de Big Data. Del mismo modo que deberíamos hablar de Tecnología y nunca de Nuevas Tecnologías.
El 23 de noviembre de 2016. Seminario gratuito de People Analytics en Madrid.
En el seminario gratuito de People Analytics trataremos con más profundidad este tema de Big Data.
El seminario de People Analytics va dirigido a profesionales de los departamentos de recursos humanos que vean la necesidad de aprender a tomar decisiones basadas en datos que les ayuden a mejorar sus resultado en las áreas de reclutamiento, evaluación del desempeño, compensaciones, formación o la gestión del talento.
Más información y registro: http://marketing.sngular.team/l/3322/2016-10-21/47whgc