
Compartir datos rebajará el ‘impuesto invisible’ del riesgo

Los datos y la información son dos tipos de activo circulante muy especiales. Son inmutables, es decir, no se consumen a medida que se utilizan; se pueden copiar y ser utilizados simultáneamente por varias personas; son indivisibles, de modo que deben emplearse dentro de un contexto que les dé significado y valor comercial; y son acumulativos, se pueden combinar con otros datos y transformarse en activos de datos adicionales a voluntad.
Otra elemento distintivo fundamental es que los datos tienen un componente de “idoneidad para el propósito”. Al invertir dinero o liquidar acciones, no es necesario preguntarse si son adecuados para una finalidad, pero con los activos de datos es más adecuado cuestionarse su calidad, actualidad y relevancia. La pregunta “¿Son estos datos suficientemente buenos?” siempre debe plantearse y responderse.
La profesora de la Columbia Business School, Laura Veldkamp, sostiene que los datos son “información digitalizada” y que su verdadero valor radica en reducir la incertidumbre en torno a una predicción. El riesgo es, en su opinión, “un impuesto a la economía”, de modo que “si los datos pueden disminuir la pérdida irrecuperable generada por el riesgo empresarial, esto podría cambiar las decisiones de inversión de las empresas y el bienestar social”.
Dentro del concepto de “información digitalizada” caben desde la poesía, a los NFT y las patentes. Su capacidad de impacto no ha hecho más que incrementarse a raíz de la revolución digital. La inteligencia artificial (IA), explica la profesora de la Columbia Business School, ha puesto los datos en el centro del debate moderno, porque se trata de “una tecnología de predicción, utiliza datos para pronosticar resultados”: la demanda, el coste y qué tipos de clientes tienen más probabilidades de hacer clic en un anuncio.
En última instancia, resulta indispensable que los ciudadanos perciban los beneficios de una adecuada gestión de los datos. Laura Veldkamp cree que en una economía perfectamente competitiva, “todas las ganancias de la recopilación de datos deberían repercutir en los consumidores en forma de precios más bajos”. Según su razonamiento, “más transacciones conducen a más datos, lo que mejora la eficiencia y las ganancias. Las empresas más rentables tienden a crecer más rápido, por lo que podrán generar incluso más datos. Esto crea un bucle de retroalimentación de datos de rendimientos crecientes”.
Sin embargo, en realidad, “las empresas a menudo retienen el excedente, en parte porque los consumidores tienen problemas para ver el valor de los datos (para ellos es como una moneda extranjera)”, señala la profesora de la Columbia Business School. “Las estructuras de precios más claras ayudarían a los consumidores a reconocer los datos como un activo, lo que conduciría a opciones más informadas sobre cómo y cuándo compartirlos”.
La confianza sea el gran asunto a considerar en el caso de los datos. En el Geneva Day 2025, que organiza la Oficina Federal de Estadística de Suiza, Pádraig Dalton, ex estadístico jefe de la Oficina Central de Estadística de Irlanda, presentó un estudio sobre la viabilidad de crear un Observatorio de Datos Confiables. Recomendó poner en marcha una plataforma de metadatos que facilite el descubrimiento, pero también la comparación de datos de fuentes fiables.
Boston Consulting Group lleva estas reflexiones al ámbito de la industria, donde “compartir datos con la competencia puede intimidar a los ejecutivos”. Su advertencia al respecto es que muchos de los mayores desafíos a los que se enfrenta la economía “no se resolverán con una empresa trabajando sola y utilizando únicamente sus datos de propiedad exclusiva”. La consultora estima que el valor de la oportunidad de compartir datos es del 2,5% del PIB mundial. Las nuevas tecnologías pueden ayudar a reducir el umbral de confianza entre empresas y superar los desafíos regulatorios y de ingeniería.
Problemas complejos como la detección de fraudes o la optimización de la cadena de suministro se pueden abordar de forma más eficaz mediante la colaboración, compartiendo datos entre múltiples actores. En Estados Unidos, las aseguradoras de automóviles intercambian información sobre historial de reclamaciones en la plataforma LexisNexis CLUE Auto. El proceso de suscripción se ha acelerado significativamente y se ha reducido el riesgo de responsabilidad civil. En Europa, Airbus lanzó en 2017 el ecosistema digital Skywise para abordar desafíos como el mantenimiento predictivo y el rendimiento de la flota, mediante el intercambio de datos.
El temor de los directivos de empresas persiste, no obstante, según los expertos del Boston Consulting Group. “Les preocupa que otras empresas puedan usar los datos que comparten en su contra”, pese a que, tras una investigación de mercado, la consultora sostiene que “estas percepciones están, en gran medida, obsoletas”.
El servicio de agregación Order with Google recopila datos, incluyendo precios y los platos más populares del menú, de múltiples servicios de entrega de comida. Pero Google utiliza también esa información para comprender el mercado y proponer a los servicios de entrega de comida formas de mejorar el negocio de sus clientes. Esta podría ser una de las principales razones por las que Uber Eats, por ejemplo, no participa en el servicio de Google. Probablemente, no quiere que sus datos se utilicen para ayudar a la competencia.
¿Qué ha cambiado? La tecnología. En comparación con hace tan solo cinco años, el software y las herramientas actuales, así como las nuevas formas de datos, están reduciendo la necesidad de confianza entre las empresas que se beneficiarían de la colaboración.
Una solución emergente para evitar la divulgación incontrolada de datos protegidos por las normativas de privacidad, confidenciales y propiedad intelectual es, por ejemplo, el uso de datos sintéticos, creados para tener las mismas características que los reales. Si se sintetizan correctamente son datos de casi imposible reversión.
Datos e IA
La demanda de datos para entrenar modelos de IA (en particular, los modelos de lenguaje extenso, LLM, que sirven de base para la IA generativa) no deja de crecer. Los modelos conjuntos destinados a ecosistemas empresariales, a sectores económicos o ámbitos de la Administración suelen ser entrenados por una única organización de confianza, encargada de recopilar los datos de cada empresa. Ese aprendizaje federado se perfila como un enfoque alternativo: utiliza datos de varias empresas, sin que éstos salgan de las instalaciones de cada una.
Siemens promueve una iniciativa de este tipo en torno a su LLM industrial y ha convencido ya a 60 empresas para que compartan sus datos a cambio de poder beneficiarse en el futuro del modelo de IA resultante. La plataforma compartida MELLODDY ha sido desarrollada por un consorcio europeo de diez compañías farmacéuticas con el objetivo de acelerar el descubrimiento de fármacos.
En la Data Week celebrada en Atenas, se analizó cómo está construyendo Europa, especialmente a través de Laboratorios de Datos, Fábricas de inteligencia artificial (AIF) y los Espacios de Datos. El enfoque se centró en convertir los datos en un activo real para el desarrollo de la IA mediante la creación de infraestructuras compartidas, seguras y fiables.
Para entrenar una buena IA, necesitamos infraestructuras de datos sólidas y un acceso fácil a datos de alta calidad, es necesario, en definitiva, aprender a compartir. Federico Milani, de la Comisión Europea, presentó la idea de los Laboratorios de Datos, concebidos como componentes integrales de las futuras Fábricas de IA (una de las cuales se instalará en el Barcelona Supercomputing Center), ya que su finalidad es promover el suministro, la puesta en común y el intercambio seguro de datos de alta calidad.
Roberta Turra (CINECA) presentó en el evento IT4LIA, la Fábrica Italiana de IA, que ofrece servicios de preparación y gestión de datos, acceso a más de 30 PB de conjuntos de datos científicos y herramientas para entrenar modelos de IA. Los impulsores de IT4LIA buscan asociaciones con instituciones públicas y pymes para crear casos de uso reales.
La Big Data Value Association (BDVA) es una de las entidades más activas en este sentido. Aboga por el desarrollo de ecosistemas de valor de datos e IA y considera los Laboratorios de Datos que impulsa la Unión Europea como un marco fundamental para acelerar el desarrollo de estos ecosistemas y propone fomentar el diálogo con las Fábricas de IA. Estas últimas se presentan como la iniciativa estratégica clave para posicionar a Europa a la vanguardia de la innovación en IA, perdidas ya las batallas por el liderazgo de los modelos de lenguaje extenso (LLM), por el control del hardware de procesamiento y, en buena medida, por el despliegue de los centros de datos. Su objetivo es establecer ecosistemas avanzados que integren computación de alto rendimiento, talento de primer nivel, habilidades de vanguardia y servicios avanzados.
Y este es precisamente uno de los principales objetivos de los espacios comunes de datos europeos: proporcionar acceso a datos industriales privados en condiciones y políticas de uso bien definidas. El desafío, como casi todo lo que tiene que ver con Europa, es de integración: las Fábricas de IA y los Espacios de Datos operan como ecosistemas distintos, cada uno con sus propias reglas de gobernanza, objetivos estratégicos, modelos de negocio y requisitos técnicos.