El nuevo modelo de lenguaje grande de Antrophic, Claude Mythos, ha despertado una gran polémica antes incluso de su lanzamiento comercial, debido a su gran potencia en el desarrollo de software. De hecho, la firma californiana no lo ha lanzado aún al mercado, temerosa de que sea empleado por bandas de ciberdelincuentes para generar malware, exploits, y detectar agujeros de seguridad en el software. Es por ello que lo está empleando, a modo de prueba, solamente de manera restringida con algunos partners, como es el caso de Mozilla, desarrolladora del navegador web Firefox.
La rapidez y efectividad de la inteligencia artificial en el descubrimiento de problemas en el código fuente del software, choca frontalmente con los métodos tradicionales consistentes en técnicas de análisis por equipos de programadores humanos, cuyos resultados, además, son desiguales según el área del código analizada.
Las vulnerabilidades más complejas han venido siendo identificadas por especialistas capaces de razonar sobre el código fuente, una labor efectiva pero condicionada por la escasez de expertos y el tiempo requerido para el análisis manual.
Por ello, desde el pasado mes de febrero, el equipo de desarrollo de Firefox ha trabajado en la integración de modelos de inteligencia artificial de vanguardia para localizar fallos de seguridad latentes, una iniciativa que empezó con una colaboración orientada al escaneo del código del navegador mediante la herramienta Opus 4.6, desarrollada por la firma Anthropic.
Los resultados de esta fase inicial permitieron la corrección de veintidós fallos de seguridad detectados en la versión 148 del navegador, un proceso que marcó una transición en la capacidad de análisis de la infraestructura del software, permitiendo a las máquinas ejecutar tareas de inspección que anteriormente estaban fuera de su alcance técnico.
La etapa más reciente de este proyecto ha consistido en la aplicación de la versión preliminar del modelo Claude Mythos sobre el código fuente de Firefox 149. Este sistema ha demostrado una capacidad de razonamiento comparable a la de los investigadores humanos de alto nivel. Gracias a esta acción, la última versión (la 150) de Firefox, publicada recientemente, incorpora la subsanación de 271 vulnerabilidades identificadas durante la evaluación con este nuevo modelo de inteligencia artificial.
Esta cifra representa un avance significativo respecto a los métodos de detección anteriores y subraya la eficacia de automatizar el razonamiento sobre el código fuente.
El empleo de modelos de IA de última generación permite descubrir fallos de manera más económica y rápida, reduciendo la ventaja estratégica de los atacantes, que basaban su éxito en procesos manuales costosos, sobre todo a nivel de tiempo. No obstante, los datos que disponemos actualmente sugieren que estas herramientas no están hallando formas de vulnerabilidad desconocidas para los expertos, sino que están acelerando la localización de los fallos ya catalogados.
La integración de estas tecnologías supone un punto de inflexión para los departamentos de seguridad, que ahora cuentan con la capacidad de superar la simple gestión de incidentes. Esta evolución permite vislumbrar un escenario donde la defensa del software pueda imponerse de manera definitiva mediante la identificación exhaustiva de los errores de programación latentes.