La revista profesional sobre tecnología y transformación digital
Internet-de-las-cosas
Hicham QAISSI

Hicham Qaissi

Ingeniero de Telecomunicación, profesor de IA for Management en UPM y responsable de proyectos IT en Docaposte España.

Data Brokers: presente y futuro de la industria del dato

Nadie puede dudar de la desmesurada cantidad de datos que genera la humanidad en sus procesos diarios. Hemos saltado del IoP (Internet of People), que suponía conectar a la red los aparatos de uso cotidiano por los humanos, ya sean wearables o electrodomésticos, al IoT (Internet of Things), término que empezó a emerger en el año 2010, justo cuando empezamos a tener más aparatos conectados a la red que personas en el mundo y, a partir de este momento, dejamos de hacer la distinción entre tipos de aparatos y nos centramos en la colección de datos de forma global.

Los datos pueden ser de diferente índole: los datos relacionados con una única persona (los generados por una persona, tanto con su consentimiento como no), los empresariales, gubernamentales, administraciones públicas, ONG, etc. Estos datos acaban almacenados, ya sea en bases de datos operacionales como en Datawarehouses (con los datos ya procesados) de empresas. Algunos se consumen y se desechan y otros se mantienen para uso futuro. Ahora bien, la pregunta inevitable es: ¿quién se queda con estos datos y qué hace con ellos?

Gigantes como Google, Microsoft o Facebook nos ofrecen un curioso y ‘dudoso’ modelo de ‘todos los servicios sin coste, a cambio de tus datos personales e histórico de navegación’. Apple presumía de tener un perfil médico de sus clientes más detallado que el que puede tener la sanidad pública. Google conoce a la perfección los mensajes (con sus diferentes cambios) que llegamos a redactar y que no llegamos a enviar (destinatarios incluidos). A estos grandes actores del sector les otorgamos nuestro consentimiento firmando las condiciones generales (en muchas ocasiones redactadas precisamente para obtener dicho consentimiento). Ni siquiera los gobiernos poseen tal cantidad de datos sobre sus ciudadanos.

La mayoría de los grandes Data Brokers a nivel mundial no operan en la Unión Europea

Evidentemente, estos gigantes no ofrecen la venta de datos al ‘por menor’ (entendidos como información sobre el consumo de un servicio determinado en un área metropolitana, o el perfil de clientes que necesito y sus direcciones de email, etc.), pero existen otros actores en la cadena de valor de la industria del dato, los llamados Data Brokers, desconocidos para la mayoría, de los que sí podemos adquirir este tipo de datos.

¿Qué es un Data Broker? ¿Qué ofrece? ¿De dónde obtiene su materia prima (el dato)? ¿Cómo la transforman en un producto vendible? ¿Cuál es su cadena de valor? ¿Cuáles son los servicios complementarios que ofrecen? ¿Qué obligaciones legales y legislativas tienen? El objetivo de este artículo es arrojar luz sobre todas estas cuestiones.

Qué es un Data Broker
Los Data Brokers, también llamados Information Brokers, Data Agents o Data Banks, son empresas que se especializan en coleccionar datos de diferente índole (sobre personas, empresas, sociedad, ciencia, sector público), procedentes en su mayoría de fuentes públicas; luego almacenan y transforman estos datos en formatos legibles (XML, JSON, CSV, etc.) para posteriormente venderlos a terceros. Les interesa sobre todo la información personal de los usuarios: pueden saber cuántos hijos tiene una persona y sus edades, y es posible que sepan hasta la fecha en la que una persona cambió de estado civil y, si las cosas salieron mal, la fecha del divorcio. Pero esto solo sería el inicio. Un Data Broker puede saber cuánto tiempo dedicamos de media a las redes sociales, las franjas horarias en las que nos conectamos, el contenido de interés y hasta el nivel de nuestro poder adquisitivo. La clave no está únicamente en la simple recopilación de datos, sino en su procesamiento posterior (limpieza, categorización, transformación, contextualización, etc.).

Gartner (una de las mayores instituciones de investigación y principal influyente de IT a nivel mundial) define un Data Broker como una empresa que agrega datos de una variedad de fuentes, aplica unos procesos de limpieza y análisis (conversión en información y conocimiento y construcción de perfiles personales o empresariales), y otorga licencias a otras organizaciones para utilizarlos.

El futuro de la industria del dato será decidido y limitado por las legislaciones del sector

Datos, información y conocimiento
La mayoría de los clientes de los Data Brokers ya no demandan los datos en su formato más abstracto, sino en formatos más detallados y específicos (información y conocimiento). Los clientes saben que no es lo mismo un ‘dato’, una ‘información’ o un “conocimiento”, aunque en lenguaje informal los tres términos suelen utilizarse indistintamente. Aprovecho para recordar la diferencia entre estos tres conceptos desde la perspectiva de la inteligencia de negocios:

– Un dato no es más que un registro de transacciones, es considerado como la mínima unidad semántica, no suele proporcionar un juicio de valor y no dice nada sobre el porqué de las cosas, tiene poca o ninguna relevancia y no es orientativo para la acción. Dicho esto, un dato es muy poco atractivo para los clientes de los Data Brokers.

– Una información se puede definir como un mensaje, con un emisor y receptor, y este mismo mensaje es capaz de influir sobre el juicio de valor del receptor. Los datos se convierten en información de diferentes maneras: contextualizando (relacionar los datos con un contexto), categorizando, corrigiendo o condensando (los datos se han podido resumir de forma más concisa) y restando incertidumbre. Para convertir datos en información, los Data Brokers necesitan de algoritmos de procesamiento y análisis con una altísima capacidad de computación.

– Un conocimiento es una mezcla de experiencias, valores y know how que sirve como marco para la incorporación de nuevas experiencias y directamente relacionado con la acción. Es el formato más demandado por los clientes.

Cómo funciona un Data Broker
El perfil de Data Broker ha cambiado con el tiempo, partiendo de un mero coleccionista de datos a un perfil altamente analista. Los clientes se hacen con el servicio de estas empresas para ahorrar tiempo y coste, ya que los Data Brokers ahora disponen de altísima capacidad de análisis, ya sea análisis descriptivo, diagnóstico o predictivo (algoritmos de aprendizaje supervisado y no supervisado de Machine Learning, como pueden ser las regresiones, clasificaciones, clustering, Dimention Reduction, etc.). Algunos de ellos se especializan en diferentes áreas, por ejemplo, perfiles completos de clientes, datos científicos, análisis estratégicos de mercados, llegando incluso a proporcionar informes personalizados para el binomio mercado-producto (informes que ayudan a practicar el análisis de la matriz de Ansoff) e informes especializados en la disciplina Competitive Intelligence (el uso de tecnología para analizar la información de otras empresas, principalmente con fines de Benchmarking).

El perfil demográfico nos dice quién es el cliente, y el perfil psicográfico cómo es el cliente

Perfiles demográficos y psicográficos
Como últimas tendencias, los Data Brokers, además de seguir ofreciendo perfiles demográficos sobre personas (nombre, apellidos, edad, género, estado civil, profesión, geolocalización, etc.), ofrecen otra calidad de información, como los informes basados en algoritmos de Sentiment Analysis (el uso de NLP, análisis lingüístico, minería del texto, reconocimiento de voz y biometría para obtener conclusiones subjetivas) y los novedosos perfiles psicográficos sobre las personas (características personales y psicológicas, modo de vida, clase social, actitudes, aficiones, creencias, preocupaciones, intereses, etc.). Evidentemente, cuanto más íntimo y sensible es el dato obtenido sobre una persona, más interés tiene, ya que puede suponer una fuente para prácticas de marketing personalizado. Cabe tener en cuenta que el perfil demográfico nos dice quién es el cliente y el perfil psicográfico cómo es el cliente. De esta manera, las empre sas clientes de los Data Brokers pueden afinar aún más sus prácticas de clusterización, asociación y segmentación.

En los últimos meses se han visto Data Brokers que se encargan también de la realización de encuestas bajo demanda de sus clientes, pudiendo aprovechar estos datos para otros sectores.

Fuente: https://www.cbinsights.com/research/what-is-psychographics/

 

Veracidad y control absoluto
Los Data Brokers suelen verificar la veracidad de los datos que obtienen y la fiabilidad de sus fuentes y, sobre todo, suelen tener un control absoluto sobre sus proveedores, para evitar cualquier uso fraudulento y criminal de esos datos. Existen Data Brokers que registran en la Blockchain (Ethereum) todas las transacciones, tanto de compra como venta, de datos que practican (evidentemente, lo que se introduce en la Blockchain son los Hash de las transacciones y no los datos en claro). Se puede decir que, en la mayoría de casos, los datos e informaciones que ofrecen los Data Brokers suelen tener un alto porcentaje de veracidad, ya que deben pasar los filtros necesarios para ello, pero el que realmente suele juzgar la veracidad de dichos datos es el propio cliente.

Los clientes de los Data Brokers pueden pertenecer prácticamente a cualquier sector, desde el sector público, como agencias estatales, ayuntamientos o ministerios, partidos políticos para el desarrollo de campañas electorales, universidades, historiadores o sector inmobiliario, hasta ONGs y empresas del sector privado como banca y seguros (para detección de fraude y análisis de créditos).

Nos preguntamos cómo estas empresas obtienen la información. Y nos podemos llevar una sorpresa al descubrir cómo nuestra información personal está libremente accesible para las compañías que la necesitan. Otras fuentes de información podrían ser el propio sector público, incluyendo información del censo, antecedentes policiales y penales, nuestro histórico en el registro civil y la sanidad pública, etc. Si a todas estas fuentes les sumamos nuestros perfiles en redes sociales, llegaremos a la conclusión de que los Data Brokers no necesitan trabajar duro ni destinar altos presupuestos para la obtención de nuestros datos.

Un sector regulado
Según WebFX, a finales del año 2021 existían en el mundo más de 5.000 Data Brokers. Entre los mayores actores de esta industria podemos encontrar Acxiom, Experian y Epsiloncy CoreLogic. En otro estudio de WebFX, el líder Acxiom tiene información registrada y catalogada sobre 2,5 billones de personas. Cambridge Analytica asegura disponer de 220 millones de perfiles psicográficos de ciudadanos de EE.UU. Todos recordamos el escándalo de Cambridge Analytica en 2017, cuando 270.000 usuarios de la plataforma Facebook dieron su consentimiento para compartir sus datos y finalmente se extrajeron los datos de 50 millones de perfiles. Un ejemplo real, según WebFX: un Data Broker puede ofrecer una lista de 1.000 perfiles demográficos de personas con problemas de salud como anorexia o depresión por un importe de 79 dólares.

Fuente: https://www.webfx.com/blog/internet/what-are-data-brokers-and-what-is-your-data-worth-infographic/

 

Muchos analistas del sector de la industria del dato piensan que los Data Brokers suponen una amenaza real, pero no siempre es así, ya que los Data Brokers operan en un sector relativamente regulado y la comercialización de los datos en sí misma no es considerada una actividad delictiva. Pero, eso sí, muchas normativas no se centran en la actividad en sí, sino en la forma de conseguir dichos datos y el consentimiento que conlleva. En España, este hecho está regulado por el Reglamento General de Protección de Datos (RGPD) del Parlamento Europeo, que regula al milímetro tanto la adquisición y cesión de los datos como cómo se debe pedir el consentimiento para ello. RGPD también insiste en informar al usuario de forma precisa de los datos que se están obteniendo, quién los está obteniendo y por cuánto tiempo. Además, recordemos los artículos 65 (derecho a la rectificación) y 66 (derecho al olvido) del reglamento RGPD. Los Data Brokers que incumplen alguno de los artículos de RGPD pueden enfrentarse a sanciones elevadísimas y es por este motivo que la mayoría de los grandes Data Brokers a nivel mundial no operan en Europa. En otras localizaciones como los EE.UU. o países asiáticos las normativas son bastante más laxas.

En la zona euro, como en la mayoría de las regiones del mundo, la industria del dato está creciendo a niveles imposibles de digerir, pero el consumo de estos datos (principalmente en busca de inteligencia) se ve muy limitado a raíz de las regulaciones poco flexibles. Esta limitación no lo es tanto para firmas multinacionales, ya que la mayoría utiliza a sus filiales fuera de la U.E. para adquirir información de Data Brokers (también fuera de la U.E.) y consumirlos para propósitos de Competitive Intelligence en Europa. Evidentemente, es un hecho difícil de catalogar como fraudulento bajo el paraguas legal del actual reglamento RGPD.

Un Data Broker suele tener altos conocimientos de la industria del dato (tanto a nivel de almacenaje como de análisis) y conocer a la perfección dónde empiezan y terminan tanto la ética como la legalidad. Dicho esto, queda al descubierto que el factor decisivo en el futuro de la industria del dato es, sin lugar a dudas, las legislaciones que regulan este sector tanto a nivel de adquisición como a nivel de venta.

El mercado de la industria del dato se valoró en 233 billones dólares en 2019 y se espera que crezca a un ritmo del 5,9% hasta llegar a los 350 billones en el año 2026.

Comparte