¿Qué es un Data Lake y cómo aprovecharlo?

data lake representado por mar con pasarela

¿Qué es un Data Lake y cómo aprovecharlo?

Si el Big Data es como un buen whiskey de información, el Data Lake es el vaso en el que mezclarlo con un poco de hielo (otra fuente de información) para hacer un “On the Rocks” de altura.

Continuando con la analogía del “whiskazo”, el Data Lake es ese vaso en el que aunar tus fuentes de información (internas y externas) para poder “disfrutarlas” como un todo y no como una suma de las partes. Igual que el vaso, un Data Lake es un sistema que conecta con diferentes bases de datos. Este sistema permite reestructurar dicha información según la necesidad del usuario.

En ese sentido, podría parecer que hablamos de una BBDD unificada, pero no. ¿Qué diferencia entonces un Data Lake de una base de datos? Tres características:

  1. El Data Lake no contiene los datos, sino que conecta distintas BBDD.
  2. Los datos que conecta el Data Lake pueden ser de cualquier índole: desde datos en bruto y sin tratar hasta datos organizados en una BBDD estructurada.
  3. Como extensión del anterior punto, los datos también pueden tener cualquier tipo de formato: desde código binario hasta imágenes y vídeo.

Gracias a los Data Lake consigues aunar y aumentar todos los datos de diferentes BBDD con fuentes de terceros para usarlas como una sola.


¿Por qué es tan importante para las empresas?

Los Data Lake suponen para las empresas una revolución similar a la que supusieron las BBDD en cuanto a dimensión. Si las primeras permitieron centralizar la recopilación y análisis de información, los Data Lake aúnan las posibilidades de poder trabajar con múltiples bases de datos sin ninguna de sus desventajas.

Gracias a un Data Lake, las empresas pueden trabajar con distintas fuentes de información de forma que se autocompleten, sin necesidad de preocuparse por:

  • Unificar su estructura
  • Unificar su formato
  • Acceder a todas de forma separada

Todo eso lo hace el propio Data Lake y, como resultado, las posibilidades de uso se disparan. Las empresas pueden completar la información de sus propias bases de datos sin necesidad de nuevas campañas de captación ni de atosigar a sus contactos con formularios infinitos y, lo mejor de todo, pueden hacerlo en tiempo real.

Beneficios de un Data Lake 

Un Data Lake, es capaz de conectar las distintas plataformas tecnológicas de tu empresa con fuentes externas, permitíendote por ejemplo:

  • Analizar y evaluar cada uno de los leads que registran en cuestión de segundos y de forma automática.
  • Estudiar el riesgo de crédito, para determinar en cuestión de segundos la concesión o no de servicios financieros, y el rango de los mismos.
  • Un estudio del potencial de negocio, para definir en tiempo real la oferta con mayores posibilidades de compra.
  • Predecir las áreas geográficas de interés comercial, de cara a la apertura de nuevos puntos de venta y cierre de los menos rentables o con posibilidad de canibalización.
  • Normalizar y corregir las propias BBDD para establecer un mejor análisis y conocimiento de tus clientes y el mercado.
  • Reduccir los costes de recopilación y almacenamiento de la información (entre una décima parte y una centésima parte de su coste actual).

¿Y tú empresa?

¿Ves limitadas tus posibilidades comerciales por no disponer de suficientes datos o inviertes demasiado tiempo en analizar bases de datos desestructuradas? En DataCentric, podemos ayudarte a dar sentido a la información existente de tu empresa y conectar con nuevas fuentes de información que completen y corrijan los posibles errores de los datos de tus clientes.

¿Qué es realmente el Big Data?

calle de madrid

¿Qué es realmente el Big Data?

Imaginemos que fuéramos capaces de ponernos los zapatos de nuestro cliente y que pudiéramos entender, en su propia experiencia, cómo se siente y qué necesita de nuestra empresa: qué le haría declararnos su amor incondicional.

Esa situación idílica, como cualquier romance, pasa por almacenar y analizar toda la información que muestran los hábitos de ese cliente, a tiempo real y en interconexión con el momento y el lugar en el que se encuentra. Una utopía que ahora es más real que nunca con el Big Data.

En ciertas publicaciones y conversaciones habrás podido ver cómo se nombra el Big Data como una estrategia empresarial; en otras, como la aplicación de esos datos. La realidad es que lo primero que debe entenderse es la dimensión del Big Data, y por eso es importante conocer su definición correcta.


El Big Data son cantidades de datos tan grandes que son imposibles de gestionar con el software habitual que suelen integrar las empresas.

A través del Big Data, recopilas información, insights, relevantes que mejoran tus procesos de toma de decisión y creación de campañas.


Uno de los principales filtros que pueden ayudarte a determinar si te enfrentas a Big Data o no es el origen de la información. Mientras que las BBDD que gestiona tu empresa actualmente probablemente han sido generadas por tus propios empleados o clientes, el Big Data es TODA la información que tus clientes generan en su día a día mediante el uso de tecnologías móviles, registros en otros sistemas, webs, entes públicos… Información como:

  • Actividad en RRSS
  • Búsquedas en Google
  • Patrones de compra online
  • Hábitos alimenticios
  • Forma física
  • Movimientos y geolocalización
  • Perfiles y datos públicos
  • Estado de nuestra competencia

 

¿Cómo ayuda el Big Data a las empresas?

Omnicanalidad

Para comprender nuestro propio negocio, el producto que queremos vender y cómo hacerlo, primero debemos conocer a la persona que nos lo está comprando y el entorno en el que se mueve.

Ese profiling de clientes y conocimiento del entorno es la principal virtud del Big Data. Un aprovechamiento de la información que existe de ellos (interna en nuestra empresa y externa en fuentes de terceros) para llegar a conclusiones relevantes para nuestro negocio. Conclusiones como:

  • ¿Quienes son mis mejores clientes, en los que tengo que poner el foco realmente?
  • ¿Dónde están esos clientes?
  • ¿Cuándo es el mejor momento para impactarles con campañas de marketing?
  • ¿Qué detalles de nuestra estrategia les atraen? ¿Cuáles no?
  • ¿Dónde y cuándo compran X productos o servicios concretamente?
  • ¿Qué productos o servicios les ofrezco de mi portfolio?

 

Las empresas basadas en datos crecen mucho más rápido

Hay un término que define a las empresas que incorporan estrategias y sistemas capaces de aprovechar el Big Data para forzar palancas de rentabilidad y crecimiento antes inaccionables: son Data Driven Business.

Según un informe del IDG (International Data Group), estas compañías que utilizan la información de los datos para obtener una ventaja respecto a sus competidores, crecen un 35% más rápido que las que no lo hacen.

En DataCentric, ponemos al servicio de nuestros clientes nuestros equipos expertos en datos con soluciones a medidas para activar esa recopilación de información y extracción de insights; o dicho de otro modo, te ayudamos a aumentar tus ingresos, disminuir tus costes y reducir tus tasas de fuga de clientes.

Código de buenas prácticas en protección de datos para proyectos de Big Data

protección de datos

Código de buenas prácticas en protección de datos para proyectos de Big Data

 

La Agencia Española de Protección de Datos (AEPD) e ISMS Forum Spain han publicado un “Código de buenas prácticas en protección de datos para proyectos de Big Data”.


Aunque el documento está enfocado a dar pautas para garantizar el cumplimiento de la normativa sobre protección de datos en los proyectos de Big Data, que será aplicable a partir del 25 de mayo de 2018, es útil para conocer el Reglamento ya que a lo largo del mismo se detallan y explican las nuevas obligaciones que deben cumplir las empresas y se puede extrapolar al resto de tratamientos de datos de carácter personal.


El Código se divide en cuatro partes 

  1. ¿Qué es el Big Data?
  2. Normas y principales obligaciones legales en materia de privacidad
  3. Principios y aspectos procedimentales
  4. Medidas tecnológicas para la mejora de la privacidad, seguridad y confianza.

 

1. ¿Qué es el Big Data?

Como sabéis, el Big Data es un concepto que hace referencia a conjuntos de datos tan grandes, que aplicaciones informáticas tradicionales de procesamiento de datos no son suficientes para tratar con ellos. Característica del Big Data es el gran volumen de información que se plasma en una gran variedad de datos y una acentuada velocidad de respuesta.

Aunque desde un punto de vista legal el Big Data  entraña mayores dificultades en relación al origen y procedencia de la información, futuros usos no previstos en el momento de obtener la información, el consentimiento, la generación de perfiles, la monitorización de la conducta, el plazo de conservación, reutilización de datos previamente disociados (anonimización), uso del cloudcomputing etc…


Las obligaciones que deben cumplir las empresas son las mismas que para cualquier tratamiento de datos de carácter personal.


 

2. Normas y principales obligaciones legales en materia de privacidad

En relación a las normas, actualmente no hay ninguna disposición que específicamente regule el Big Data, la legislación en vigor es la Ley 15/1999 de protección de datos de carácter personal y su reglamento de desarrollo, el Reglamento General de Protección de Datos que fue aprobado el 18 de abril de 2016 y que será aplicable el 25 de mayo de 2018.

Sobre las implicaciones de los tratamientos Big Data en Privacidad hay que tener presentes los cincos puntos que se describen de forma sucinta a continuación:

  • El origen de los datos es el primer aspecto que debe tenerse en cuenta en la cadena de tratamientos contemplados en un sistema de Big Data, aunque la diversidad de orígenes mejora la interoperabilidad y aumento de la calidad de los datos personales, supone elevar el nivel de riesgo de incumplir algún principio general de protección de datos como el principio de minimización de datos y limitación de responsabilidad. Para garantizar el cumplimiento de estos principios se debe cumplir lo establecido en el artículo 25 del Reglamento relativo a la protección de datos desde el diseño y por defecto (cumplimento de las normativas sobre protección de datos desde la fase inicial del proyecto para que la privacidad se integre en las nuevas tecnologías y prácticas empresariales directamente) así como el principio del consentimiento que varía considerablemente.
  • Transparencia de la información, en este punto se deben conciliar, por un lado, el mayor poder de disposición sobre los datos de carácter personal por los que ha apostado el Reglamento y, por otro lado, la no restricción en el desarrollo del mercado.
  • Calidad de los datos y conservación. Ya que en los proyectos de Big Data se procesan grandes cantidades de información, cada empresa debe cumplir con el principio de calidad de los datos (realizar tratamientos compatibles con la finalidad de la recogida, garantizar que los datos estén actualizados etc.)
  • Derechos de los interesados. Aspecto fundamental que deben garantizar todas las empresas que traten datos de carácter personal, pues con la nueva regulación se amplía el abanico de derechos.
  • Decisiones individuales automatizadas. Merece destacarse que los principios de protección de datos no se aplican a la información anónima, sin olvidar el cumplimiento de los principios relativos al tratamiento legal y transparente de los datos y la prohibición general de adoptar decisiones individualizadas automatizadas basadas en datos personales sensibles.

3. Principios y aspectos procedimentales

No debe olvidarse que constituyen un conjunto de acciones que facilitan el logro del fin propuesto. Entre los principios y aspectos procedimentales se destaca:

  • La importancia del concepto ya reseñado en el punto anterior, la privacidad desde el diseño
  • El principio de accountability relacionado con la responsabilidad social corporativa, en concreto se refiere a la responsabilidad de las compañías en la implantación de medidas, en el seno de las organizaciones, de garantía y cumplimiento de los principios y obligaciones en materia de protección de datos
  • Realización de evaluaciones de impacto para permitir a las empresas determinar si los proyectos que involucran uso de información privada representan riesgos para el derecho a la protección de datos
  • Reutilización de datos disociados para garantizar la irreversibilidad de los procesos de anonimización de los datos personales y las relaciones con la autoridad de control. Las empresas deben contemplar la relación e interlocución correspondiente con la autoridad de control.

 

4. Medidas tecnológicas para la mejora de la privacidad, seguridad y confianza.

Finalmente, el Código recoge las medidas tecnológicas para la mejora de la privacidad, seguridad y confianza, haciendo de nuevo hincapié en que el concepto de privacidad y protección de datos desde el diseño es fundamental para hacer frente a los riesgos y mantener la privacidad en las diferentes etapas de la cadena de valor de los proyectos de Big Data. Sobresale la importancia de que las compañías apliquen medidas técnicas y organizativas especificas con independencia de los procesos de anonimización y disociación de datos, junto con otras para mejorar la confianza mediante la elaboración de códigos de conducta, las certificaciones, sellos o etiquetas para demostrar el cumplimiento de la regulación.

En este apartado debemos de tener en cuenta que la confianza de los ciudadanos se convierte en un aspecto estratégico para que pueda existir un despliegue de las potencialidades de las herramientas analíticas y, para que se produzca esa confianza, es imprescindible que las personas estén convencidas de que se ha tomado en serio su derecho a la privacidad y a la protección de datos; en definitiva que todos los tratamientos realizados se ajustan a la normativa de protección de datos en vigor.

Ángeles Martínez Pérez

DataCentric
Directora Área Legal                                             

Big Data, aspectos legales a tener en cuenta

embudo Big Data

Big Data, aspectos legales a tener en cuenta

Es innegable que vivimos en la era de los datos. En los últimos años, las estrategias de marketing y publicidad han evolucionado poniendo en el centro de las mismas al consumidor. La experiencia del mismo a la hora de relacionarse con las distintas marcas, se ha posicionado como la meta a batir y aquí, juega un papel fundamental un concepto que en los últimos tiempos no puede estar más en boga: la personalización.

Llegar al cliente adecuado, en el momento preciso, sin interrumpir y respondiendo de forma certera a sus necesidades e intereses se ha establecido como el nuevo grial a buscar por los anunciantes y empresas. Es aquí donde entra en juego el protagonista de todos los debates del sector: el Big Data.

La recopilación de datos de los usuarios es, a día de hoy, la mejor baza para personalizar al milímetro los mensajes que queremos hacerles llegar y así, conseguir que estos sean lo más eficaces posible. El Big Data puede presumir de ser una de las herramientas tecnológicas con mayor potencial de futuro.

Big Data, el gran aliado de las empresas

De acuerdo a un estudio elaborado por Online Business School (OBS), en la última década, se han generado más datos que en toda la historia de la Humanidad. Las previsiones del informe apuntan a que, en 2018, las conexiones a internet a través de dispositivos móviles alcanzarán la abrumadora cifra de 10.200 millones. Esto se traduce en una cantidad de datos sin precedentes que pueden abrirnos las puertas a un mundo lleno de posibilidades.

Datos que, a cada segundo, se generan a una mayor velocidad, aumentando exponencialmente su volumen y de una variedad casi infinita. ¿Están preparadas las empresas para este escenario? De acuerdo a los datos del estudio citado anteriormente, en la actualidad, el 38% de las compañías españolas ya cuenta con estrategias de Big Data aunque la cifra se duplicará para 2018.

Destacada

¡No se trata de acumular datos!

Uno de los grandes errores que la  industria del marketing y la publicidad comete a diario es el de pensar que el Big Data se basa en recopilar la mayor cantidad de datos posibles. Craso error. ¿De qué nos sirven ingentes cantidades de información sin un análisis y tratamiento posterior que nos permitan optimizar de forma adecuada los mismos? Acumular datos es barato y sencillo pero no nuestro objetivo.

Son dos los grandes pasos que debemos dar. El primero de ellos, apunta directamente a las estrategias de optimización de datos para recoger y analizar sólo aquellos que realmente nos aporten un valor a nuestros objetivos. No por tener más datos se accede al conocimiento. Este pensamiento sólo conduce al caos.

Actuar dentro del marco legal, vital para alcanzar el éxito

El segundo conlleva implicaciones más elevadas, los aspecto legales a tener en cuenta al abordad proyectos de Big Data. Detrás de cada número, de cada dato, hay una persona. Un individuo que no tenemos que ver como una suma de patrones de comportamientos y hábitos de consumo sino como un ser humano que siente, cuenta con unos derechos y que valora su privacidad por encima de todo. No puede (ni  debe) comenzar a recopilar datos sobre sus clientes y usuarios de la noche a la mañana. El asesoramiento legal en estas lindes es vital para el éxito.

No olvide que nos enfrentamos a consumidores cada vez más informados, que saben lo que quieren y que están dispuestos a compartir sus datos siempre y cuando exista una recompensa y los procedimientos se hagan de forma transparente.

Asesoramiento de la mano de los mejores expertos

Un espinoso camino que no está libre de obstáculos en el que compañías como DataCentric, centrada en los datos para impulsar las estrategias de marketing y las ventas a través de análisis y calidad de la información, son de gran ayuda para no acabar inmerso en terrenos pantanosos por andar a ciegas en esta nueva era del Big Data.

El Big Data se ha convertido en el nuevo petróleo y debemos trabajar informando siempre al usuario de nuestras actividades, supervisando las herramientas para una continua optimización de las mismas. Tareas para las que contar con el asesoramiento de expertos en data es vital si queremos alcanzar el éxito con nuestras estrategias.

El trabajo de las empresas en esta materia debe ceñirse a la legalidad para generar un entorno seguro y de confianza en el que los usuarios se sientan cómodos. Los datos son la voz de los usuarios y del mercado en el que se mueven. Hay que escucharlos para poder extraer conocimiento (Insight), dentro de la legalidad, y así avanzar juntos, consumidores y empresas, hacia esa personalización que puede reportar muchos beneficios en ambos sentidos.

¿Aún quiere continuar sólo este viaje sin la ayuda de los verdaderos expertos en la materia?

Agustín Saiz

Dpto. Marketing & Comunicación DataCentric.

Big Data: ¿Moda o revolución?

Big Data moda o revolución

Big Data ¿Moda o revolución?

Ni es moda ni revolución, es simplemente eso, grandes cantidades de datos que pueden provenir de diferentes fuentes, tanto exógenas como endógenas a tu propio negocio. La dificultad estriba en convertir esta masa ingente en marketing eficaz, para generar ROI.

Cada vez más, esta sencilla definición está condicionando el mundo actual de la empresa. Es el momento de preguntarnos si estamos haciendo un uso adecuado de nuestras BBDD, si responden a criterios válidos para emprender este camino hacia la analítica requerida por el Big Data. Supermercados, perfumerías, centros de moda y automoción; son ejemplos de un camino ya iniciado pero no suficiente en muchos casos. Si tienes agendada esta pregunta, ya estás en el buen camino.                                                                                                        Big Data

DataCentric está aportando soluciones que responden con eficacia a tu pregunta. La analítica y el arte de compilar diferentes fuentes de información y BBDD son la clave para generar valor añadido.

Si quieres obtener más información y soluciones pincha aquí

Los datos te hablan del mercado, escúchalos, entenderás mejor a tus clientes.