Atlas Insights publica «El auge de los datos sintéticos», una estrategia para proteger el activo intangible clave de la futura IA

La estrategia en torno al tratamiento de los datos sintéticos en la empresa constituye uno de los mayores desafíos para los derechos de la protección intelectual e industrial en la actualidad, según subrayan los autores del nuevo informe de la serie Atlas Tecnológico Insights que ya puedes consultar en la Zona Premium
9 de febrero de 2022 | Compartir: Compartir en twitter Compartir en LinkedIn
Atlas Insights publica «El auge de los datos sintéticos», una estrategia para proteger el activo intangible clave de la futura IA

El Gabinete de Estudios Atlas Tecnológico presenta el informe de la serie Atlas Tecnológico Insights “El auge de los datos sintéticos. ¿Qué estrategia de innovación es conveniente para este ‘nuevo’ activo intangible?”, un trabajo de análisis que cuenta con el patrocinio de PONS IP en el que se advierte de que, dado que “los derechos de propiedad industrial e intelectual constituyen la mejor herramienta para gestionar la innovación, el tratamiento estratégico de los datos sintéticos constituye uno de los mayores retos que tenemos hoy”. El informe está disponible en exclusiva para los Usuarios Premium de Atlas Tecnológico en la Zona Premium.

Los autores del estudio son tres especialistas de referencia: Luis Ignacio de Vicente, consejero estratégico de Pons IP, CIO de ASTI Mobile Robotics-ABB y miembro del Comité Asesor de FOM y del Gabinete de Estudios de Atlas Tecnológico; Carlos Muñoz Ferrandis, abogado, investigador doctorando en el Max Planck Institute for Innovation and Competition y miembro del grupo de investigación GIPLaw (Universidad de Alicante), además de Co-fundador de HIGH Technology Law Forum; y Pablo Rodríguez Palafox, Ingeniero Industrial, investigador doctorando en la Universidad Técnica de Múnich y co-fundador de HappyRobot, startup en el ámbito de los “datos sintéticos”.

Los datos sintéticos aparecen como el principal elemento técnico de la curva del Gartner Hype Cycle de Inteligencia Artificial 2021. Según el informe de Atlas Insights, “la mayor parte de los datos no estarán asociados a las personas, serán datos no personales precedentes de información de las máquinas que nos llegarán procesados gracias a tecnologías como Internet de las Cosas, 5G o la computación avanzada. La novedad que ahora se plantea es que estos datos serán también ‘sintéticos’; es decir podrán ser simulados”.

La clave es que, para ver “todo el potencial” de la inteligencia artificial, señalan los autores, hay que superar aún obstáculos como el de la disponibilidad de los datos. “Se están convirtiendo en un bien escaso, y cuando se dispone de ellos típicamente no son fácilmente procesables, o, por su carácter personal, es necesario anonimizarlos”. Sectores con las finanzas o la salud serán los principales beneficiarios de este proceso, al tiempo que, en el ámbito industrial, “nuevas tendencias como la navegación autónoma, la visión artificial o los llamados gemelos digitales van a necesitar ‘datos sintéticos’”.

En el caso de los gemelos digitales, apostilla el informe, «son una parte de lo que empezamos a denominar Metaverso, y para su generación, a través de los modelos de inteligencia artificial, los datos sintéticos son una pieza clave a nivel técnico y competitivo”.

Su validez para entrenar modelos de IA al mismo nivel que los datos basados objetos, eventos o personas reales ha quedado acreditada en diversas investigaciones. Microsoft Research, por ejemplo, ha conseguido desarrollar tareas de tratamiento de rostros reales utilizando únicamente datos sintéticos.

La denominada brecha simulación-realidad se ha superado también con técnicas como la aleatorización de dominio (domain randomization) “consistente en aleatorizar aspectos del entorno que son irrelevantes para la tarea en cuestión con el objetivo de que el modelo de visión artificial aprenda a ignorar todo aquello que sea circunstancial”.

Más de 50 empresas ya proporcionan datos sintéticos”, añade el trabajo publicado por el Gabinete de Estudios Atlas Tecnológico, con “aplicaciones interesantes” en retail, sector financiero o médico, pero también con desafíos aún pendientes de resolver. “El hecho de diseñar modelos de negocio basados en el trading de datasets hace que se conciba esta práctica como un trading de activos intangibles. Y en este punto, hay que empezar a pensar: ¿Cuáles son los mecanismos necesarios para competir en trading de datasets?”, plantean los autores.

De hecho, “para abordar una gestión estratégica de los datos sintéticos, es necesario una combinación de conocimiento jurídico, industrial y tecnológico”, porque “en el caso de los datos sintéticos, se interconectan tres activos intangibles que son, por sí mismos, un reto para los especialistas en la materia para discernir cuál es la mejor aproximación jurídica para su protección”: los algoritmos y modelos de inteligencia artificial; el software que implementa estos algoritmos; y los propios datos sintéticos.

Es importante definir “qué estrategia de PI (proyección intelectual) y modelo de protección se alinea con nuestro modelo de negocio”, añaden. El informe aborda en este punto, con multitud de referencias a la resolución judicial de contiendas tecnológicas y el papel que desempeñan fórmulas de protección intelectual como patentes, derechos de autor y derechos sui generis de bases de datos. Todo ello lo convierte en una obra de referencia que puedes consultar en exclusiva en la Zona Premium de Atlas Tecnológico.

Scroll al inicio
Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad