¿Qué es el Data Visualization o cómo interpretar grandes cantidades de datos?

What is Data Visualization or how to interpret major amounts of data?

¿Qué es el Data Visualization o cómo interpretar grandes cantidades de datos?

 


El Data Visualization permite a los analistas de datos extraer insights de su Big Data de forma mucho más rápida. Otro de sus principales usos es ser la herramienta de comunicación ideal entre los analistas y la dirección de una compañía.


La comprensión del Big Data genera un nuevo reto en cuanto al Data Visualization debido a la cantidad y diversidad de variables y datos que se manejan. Analizar la información a través de imágenes es más sencillo, de modo que:
Los gerentes y Data Scientists que utilizan Data Visualization para presentar la data, tienen 28% más de probabilidad de encontrar datos relevantes para el análisis y predicción de tendencias en su negocio, que los que analizan la información en dashboards tradicionales.

1. Mejora el proceso de toma de decisiones
2. Reduce el tiempo dedicado al análisis
3. Facilita la predicción de tendencias

Principios de Data Visualization

El Data Visualization es la forma más óptima de exponer la miríada de datos que están al alcance de las empresas en la era digital, lo conocido como Big Data. Gracias a esta exposición visual de los cientos de variables y cruces que puede incluir una BBDD, el analista de datos tiene una herramienta que le permite extraer y exponer mucho más rápido y con mayor certeza insights de negocio.

Principios para presentar la información adecuadamente:


1. Simplificar: presentar la cantidad de variables adecuadas.
2. Comparar: para facilitar la comprensión y evitar errores de memoria, es importante poder visualizar todos los datos en una imagen.
3. Dónde y cómo mostrar la información que se quiere destacar para captar la atención.
4. Diversificar: diferentes representaciones de los mismos datos pueden llevar a nuevas conclusiones
5. Buscar el por qué: la meta del Data Visualization no es encontrar qué ocurre, si no dar una forma visual fácilmente interpretable a la miríada de datos de los que dispone una compañía

Técnicas de Data Visualization

Crear un gráfico a partir de una tabla de excel o incluso un SQL como los que se han utilizado hasta hace unos años es bastante sencillo. Las variables apenas pasaban las 100 columnas y no todas estaban relacionadas entre sí. Sin embargo, a medida que se agregan e interrelacionan variables esto se vuelve más complicado. Mucho más complicado.

Para datos estructurados, como ventas, ingresos, etc, los gráficos sencillos son más que suficiente. Sin embargo, para la los datos desestructurados, como textos o imágenes, captados con sistemas de Big Data, hace falta otro tipo de técnica para visualizar la información adecuadamente.

Gráficos relacionales

Son especialmente útiles para estudiar la relación de los clientes con una compañía y el nivel de penetración de nuestros productos en cada hogar. Por ejemplo, ¿de los clientes de una compañía telefónica, cuántos tienen solo línea móvil, cuántos tienen pack completo y cuántos han mostrado interés en servicios adicionales como TV bajo demanda o coberturas? ¿Cómo se relacionan dichos productos con los consumidores y qué datos sociodemográficos cumplen?

Graficos relacionales

Nubes de palabras

Para encontrar la moda en una serie de textos. Este gráfico es especialmente indicado para extraer insights a través de la escucha activa en Redes Sociales, pues te permite relacionar tu marca o keywords concretas con aquello que se comenta de ellas, el sentimiento (bueno, neutro o malo) con el que se comenta y el volumen de interacciones que genera. En próximos artículos veremos cómo esto, asociado a usuarios y propuestas políticas concretas, afectaron a las elecciones de Estados Unidos en 2012 y 2016 e incluso a las de España del año pasado.

Nube de palabras

Diseño de Mapas de Calor

Pueden ser cuadriculados o cartográficos. Se pueden utilizar para comparar datos que tienen mucha diferencia entre si: por ejemplo en el caso de una compañía que quiera medir la penetración geográfica de su producto, o el potencial de clientes de una zona concreta en relación con su nivel socioeconómico y la adquisición de productos similares en función del tiempo.

Cuadriculado
Mapas de calor

Cartográfico

Mapas de calor

Diagramas de Dispersión

Son una versión primeriza del Data Visualization, dado que no pueden mostrar por sí mismas más de tres variables para cada registro (situación en los ejes y tamaño de su representación en la tabla). Sin embargo, si dotamos a estos gráficos de interactividad, nos ayudan a dar a nuestra visualización dos niveles de profundidad: los datos que más nos interesan en función de las 3 variables más importantes y, haciendo click en los datos concretos, una muestra desglosada del resto de variables que hayamos establecido.

Por ejemplo, en la gráfica a continuación se puede observar la mejoría o deterioro en la puntualidad de diferentes aerolíneas desde 1985 hasta el 2010, midiendo la cantidad de minutos de retraso en el despegue. Pulsando en cada aerolínea, podríamos acceder a la representación de los datos que expliquen las causas de su mejoría o empeoramiento.

Diagramas de dispersión


La clave del Data Visualization reside en escoger la representación visual que queremos dar a nuestros datos en función del tipo de conclusión que queremos extraer. Es decir, escoger la representación según la hipótesis que queramos demostrar.


Del Big Data al Deep Data o Cómo Extraer Verdadero Valor de tus Datos

Deep Data

Del Big Data al Deep Data o Cómo Extraer Verdadero Valor de tus Datos

  • El Big Data ofrece demasiada información y permite crear modelos estadísticos y predicciones. Sin embargo, no explica el por qué de los hechos.
  • El Deep Data explica la realidad: por qué ocurrieron los hechos que ocurrieron y cuáles son los verdaderos drivers de compra.

Como decía aquel anuncio de neumáticos Pirelli, “la potencia sin control, no sirve de nada”. Lo mismo es aplicable al Big Data: “la recopilación sin control, no sirve de nada”.

Esta es la segunda lección que aprenden las empresas que apuestan por convertirse en Data Driven Businesses. Han recopilado petabytes de datos a la espera de que estos les indiquen qué productos ofrecer, a quién, cuándo, dónde, cómo, por qué… Pero los datos por sí solos no hablan. Hay que saber hacerles cantar.


El Big Data es el encargado de plantear las preguntas; el Deep Data, de resolverlas.


El objetivo con el que se desarrollan las estrategias de Big Data no es explicar qué ha sucedido o hacer predicciones. Es más, el Big Data por sí solo no es capaz de anticipar nada; son solo números. Dicho de otro modo; con el Big Data puedes ver:

  • Los habitantes de cada zona,
  • Su nivel socioeconómico,
  • Si están en facebook,
  • Cuál suele ser su consumo anual…

pero no te dice que debes buscar todas esas métricas si quieres poder predecir el número de ventas que tendrá tu campaña comercial, ni cuales te faltan. No adapta los datos a tu objetivo de negocio ni busca información marginal que te permita entender, no solo qué cada acción concreta funciona mejor, sino por qué lo hace. No sustituye la capacidad de razonamiento humana.

Del Big Data al Deep Data o Como Extraer Verdadero Valor de tus Datos

Enter the Deep Data

Para eso, precisamente, es para lo que necesitas el Deep Data. Datos que aportan una dimensión personal para explicar las decisiones de compra de los consumidores. Así, si:

  • Antes tenías su código postal, ahora tienes su información catastral,
  • Antes tenías su consumo anual, ahora sabes a qué dedica cada parte de su presupuesto,
  • Antes tenías su nivel socioeconómico, ahora tienes acceso a su nivel de endeudamiento y morosidad.

Con el Big Data sabías dónde había gente que podría comprar tu producto y qué querían comprar. Con el Deep Data puedes diferenciar quién te comprará y quién no, qué y por qué.

Del Big Data al Deep Data con un ejemplo: los videojuegos

Los nuevos modelos de negocio en el sector del gaming son un perfecto ejemplo del uso adecuado del Deep Data.

Cuando los primeros videojuegos salieron al mercado, las empresas únicamente podían saber lo que los estudios de mercado tradicionales les podían aportar.

Entonces llegaron las consolas conectadas a internet y plataformas como PlayStation Network o Xbox Live para permitir los juegos multijugador… y comenzaron a recabar datos de cada usuario como una aspiradora.

Los datos relativos a qué cliente jugaba qué juegos para definir los próximos títulos y lanzamientos fueron solo el primer paso. Luego llegaron el resto de servicios como las suscripciones a servicios de streaming, que no solo suponían una línea de negocio, sino que aportaban una dimensión adicional de información de cada usuario: qué consumían cuando no estaban jugando a videojuegos y cuánto pagaban por ello.

Con toda esta información, las franquicias como Call of Duty llevan años adaptando sus lanzamientos a la moda más reciente, apostando sobre seguro con elementos que saben que gustarán a sus clientes hasta el punto que han redefinido el concepto de videojuego en sí.

  • Creando títulos que combinan conceptos como los dibujos, los deportes y torneos y los shooters en una exitosa mezcla como ha sido OverWatch
  • Redefiniendo sus estrategias de contenido y pricing con modelos de suscripción, ampliaciones, actualizaciones y packs de personalización; todos ellos, de pago

OPEN DATA. TRANSPARENCIA CONTRA EL FRAUDE Y LA CORRUPCIÓN

OPEN DATA. TRANSPARENCIA CONTRA EL FRAUDE Y LA CORRUPCIÓN

Open Data. Transparencia contra el fraude y la corrupción

«La información que generan las Administraciones Públicas y los organismos del sector público constituye un importante recurso para promover la economía del conocimiento. De este modo, la reutilización y la puesta a disposición de la información del sector público con fines privados o comerciales, favorece la circulación de información hacia los agentes económicos y la ciudadanía con el fin de fomentar el crecimiento económico, el compromiso social y la transparencia”  

Ley sobre la reutilización de la información del sector público. 

El Open Data es  y deber seguir desarrollándose como catalizador de la sociedad de la información y de la economía del conocimiento pero sin olvidar tampoco esa otra vertiente también recogida en la Ley sobre la reutilización de la información del sector público: “fomentar el compromiso social y la transparencia”. En este punto, como profesionales de los datos, defendemos su valor como herramienta en la lucha contra la corrupción y el fraude.

Los datos no significan ningún peligro para los ciudadanos, sino que son una oportunidad, una herramienta sobre la que construir con solvencia y mejorar. Como ha recordado recientemente nuestro presidente, Antonio Romero Sanchiz, “no usarlos de un modo inteligente sería una auténtica estupidez”.