Radar Atlas
Radar Atlas 23/05: a favor, en contra, arneses y ROI de los agentes de IA en las empresas y algo de siderurgia para aliviar
El interés por el papel de la inteligencia artificial, y en especial por los agentes, es máximo, con el colectivo de desarrolladores a la cabeza, así que dedicamos este Radar Atlas casi monográfico a recopilar distintas perspectivas del asunto, sin olvidar la reconversión energética de la siderurgia y el tacto de los humanoides

Invertir antes de 2030 para dejar de depender del carbón en la producción de acero es ahora un 53%, o aproximadamente 800.000 millones de dólares, más barato de lo que costaría reducir la misma cantidad de emisiones más adelante en otros sectores de la economía o mediante la eliminación de carbono (1,5 billones de dólares), en un escenario que contemple un calentamiento inferior a 1,5 °C. Estos hallazgos forman parte de un nuevo estudio publicado en Nature Climate Change, dirigido por científicos del Instituto de Potsdam para la Investigación del Impacto Climático (PIK). "La diferencia clave para el sector siderúrgico radica en si las centrales eléctricas de carbón se siguen construyendo y renovando, o si se sustituyen por alternativas más limpias, como las plantas siderúrgicas preparadas para el hidrógeno o el reciclaje de chatarra de acero", afirman.

Tres cuartas partes de los beneficios económicas de la IA están siendo captados por solo el 20% de las empresas. El retorno de la inversión (ROI) nos vuelve locos al abordar nuestra estrategia de IA. Este informe de PwC analiza precisamente ese aspecto. Concluye que las empresas líderes tienen entre dos y tres veces más probabilidades de utilizar la IA para identificar y aprovechar oportunidades de crecimiento y reinventar su modelo de negocio. Tienen el doble de probabilidades de rediseñar los flujos de trabajo para incorporar la IA que de simplemente añadir herramientas de IA y casi tres veces más de haber aumentado el número de decisiones tomadas sin intervención humana. Las empresas más preparadas para la IA, según PwC, generan ingresos y eficiencias 7,2 veces superiores a los de otras empresas.

En contra de codificar con agentes de IA. Jer (Jeremy) Crane, fundador de la plataforma SaaS para el automóvil PocketOS, cuenta cómo pasó un fin de semana recuperándose de un incidente de pérdida total de datos provocado por el agente de codificación de IA de la compañía en menos de 10 segundos. Según Crane, el agente Cursor detectó una discrepancia en las credenciales en el entorno de prueba de PocketOS y decidió solucionar el problema eliminando un volumen de Railway, el espacio de almacenamiento donde residían los datos de la aplicación. Para ello, buscó un token de API y lo encontró en un archivo no relacionado. Desastre total.

A favor de usar agentes de AI para codificar. Hace menos de un año, Intercom tomó una decisión que abarcaba a toda la empresa: apostar por Claude Code. El departamento de ingeniería adoptó una serie de principios ambiciosos incluso para los estándares. Los agentes escriben, prueban y revisan el código. Se les plantean problemas, no tareas. En cuestión de semanas, cientos de ingenieros estaban produciendo a un ritmo que habría parecido imposible un año antes. No se trataba de una estrategia de marketing. La tecnología de Anthropic se convirtió en la base del desarrollo de software de Intercom.

Cómo diseñar ‘arneses’ fiables. Prithvi Rajasekaran, miembro del equipo de laboratorios de Anthropic, está convencido en este artículo de que el abanico de combinaciones interesantes de arneses no se reduce a medida que mejoran los modelos de IA. Al contrario, se expande, y el trabajo interesante para los ingenieros de IA consistirá en seguir encontrando la siguiente combinación novedosa. A medida que los modelos sigan mejorando, podemos esperar que sean capaces de funcionar durante más tiempo y en tareas más complejas. Siempre es recomendable experimentar con el modelo, analizar su comportamiento en problemas reales y ajustar su rendimiento para lograr los resultados deseados. Al trabajar en tareas más complejas, a veces se puede mejorar descomponiendo la tarea y aplicando agentes especializados a cada aspecto del problema. Y cuando se implementa un nuevo modelo, generalmente es buena idea revisar su estructura, eliminando las partes que ya no contribuyen al rendimiento y añadiendo otras nuevas para lograr una mayor capacidad que antes no era posible.

La alineación automatizada es más difícil de lo que piensas. Una propuesta destacada para alinear la superinteligencia artificial (ASI) es utilizar agentes de IA para automatizar una parte cada vez mayor de la investigación a medida que mejoran las capacidades. Pero, incluso cuando los agentes de investigación no conspiran para sabotear deliberadamente el trabajo de alineación, este plan puede producir evaluaciones de seguridad convincentes, pero catastróficamente engañosas que acaben conduciendo a un despliegue involuntario de IA desalineada. Esto sucede porque la investigación de alineación implica muchas tareas difusas difíciles de supervisar. Es necesario entrenar a los agentes para que realicen de forma fiable tareas difusas difíciles de supervisar. La generalización y la supervisión escalable son las principales candidatas para lograrlo, pero ambas se enfrentan a nuevos desafíos en el contexto de la alineación automatizada.

La técnica "Touch Dreaming" ayuda a los robots humanoides a realizar cinco tareas complejas con un 90,9% más de éxito. La locomoción y manipulación humanoide en el mundo real sigue siendo un desafío, ya que requiere estabilidad de todo el cuerpo, destreza del efector final e interacción sensible al contacto bajo cambios frecuentes de contacto. Este trabajo presenta Humanoid Transformer con Touch Dreaming (HTD), un transformer codificador-decodificador multimodal que modela el tacto como una modalidad central junto con la visión multivista y la propiocepción. En cinco tareas ricas en contacto del mundo real, HTD logra una mejora relativa del 90,9% en la tasa de éxito promedio con respecto a la línea base más fuerte. Los resultados de ablación muestran además que la predicción táctil del espacio latente es más efectiva que la predicción táctil bruta, los que supone una ganancia relativa del 30 % en la tasa de éxito. Estos resultados demuestran que este sistema de aprendizaje mejorado por sueños táctiles permite una manipulación humanoide versátil y de alta destreza en el mundo real. Más información y materiales de código abierto están disponibles en esta URL http .
