CAI wins the NeuroGrid CTF: European-built CAI (Cybersecurity AI) sets a new global benchmark

CAI, our European-built autonomous cybersecurity AI, ranked #1 at NeuroGrid CTF after solving 41 of 45 challenges—setting a new global benchmark for AI-driven cyber defense

CAI wins the NeuroGrid CTF: European-built CAI (Cybersecurity AI) sets a new global benchmark
Press release (Spanish) link
CAI PRO (Cybersecurity AI) link
alias1 link

This weekend, CAI (Cybersecurity AI) achieved a major milestone for European cybersecurity. Competing stealthily under the alias Q0FJ (the base64 encoding of “CAI”), our agent won the international NeuroGrid CTF competition hosted by Hack The Box, solving 41 out of 45 challenges and ranking as the world’s top AI cybersecurity agent.

CAI NeuroGrid Performance
Performance evolution of CAI (Q0FJ) compared with other agents in the NeuroGrid CTF. Source: Hack The Box / Alias Robotics.

What is the NeuroGrid CTF?

NeuroGrid CTF is one of the most advanced challenge environments in the Hack The Box ecosystem. It brings together autonomous AI agents and human teams to tackle realistic cybersecurity tasks across reversing, digital forensics, malware analysis, network inspection, cryptography and complex operational environments.

In this demanding scenario, CAI demonstrated maturity, autonomy and industry-grade performance, outperforming agents based on models from major US technology companies.

Results: 41/45 challenges solved and global #1 ranking

  • 41 out of 45 flags captured
  • Top-ranked AI agent globally
  • $50,000 prize awarded
  • Outperformed agents built on Big Tech models
  • Consistent performance across previous competitions (including winner of "AI vs Humans" earlier in 2025)

These results establish CAI as a new global benchmark in autonomous cybersecurity AI.

CAI NeuroGrid Analytics
Detailed breakdown of CAI’s performance across difficulty levels and challenge categories.

CAI: open, European-built and designed for defenders

CAI is built by Alias Robotics and powered by alias1, our security-specialized language model, while supporting other 300+ leading LLMs. Its architecture is engineered to:

  • Operate autonomously under adversarial conditions
  • Solve complex security challenges without human intervention
  • Integrate with modern analysis and response toolchains
  • Maintain traceability, safety and operational control
  • Align with defender-oriented missions

CAI is open-source and available on GitHub:
👉 https://github.com/aliasrobotics/cai

Additional technical resources are also available at:
👉 https://aliasrobotics.github.io/cai/

Why we competed as Q0FJ

Due to new rules introduced under the Model Context Protocol (MCP), we decided to participate under an alias to avoid misinterpretations. The scoreboard made the relationship clear:

Q0FJ = base64("CAI")

Regardless of the alias, performance determines the ranking, and CAI clearly led the competition.

Europe leading the future of cybersecurity AI

CAI’s performance shows that leadership in AI-driven cybersecurity does not have to come exclusively from large tech corporations. Europe is capable of producing cutting-edge, globally competitive systems that align with the EU’s vision of trustworthy, secure and rights-preserving artificial intelligence.

The project is co-funded by the European Innovation Council EIC, one of the EU’s most selective and impactful programs supporting breakthrough technologies. This backing recognizes the strategic importance of autonomous cybersecurity AI for Europe and reinforces our long-term commitment to quality, usability and technical rigor.

In line with the EU’s risk-based approach to AI, CAI combines advanced capability with governance. Although CAI enables unrestricted reasoning within a professional, controlled environment (necessary for accurate cybersecurity testing), its use is bounded by strict Terms of Service, authorization requirements, traceability controls and EU-only hosting that aligns with GDPR, NIS2 and AI Act obligations. In practice, this means combining power with responsibility and capability with proportionate safeguards, to ensure real-world safety while enabling European innovation.

From Vitoria-Gasteiz, Alias Robotics is building an alternative model aligned with these European principles:

  • Democratizing Cybersecurity
  • Cybersecurity for defenders
  • European-built technology
  • Specialized architectures over general-purpose models

Next steps

We will continue sharing relevant updates on CAI as we expand its capabilities, participate in new competitions, and validate its performance in increasingly demanding scenarios.
Follow our blog and social channels to stay up to date with the latest developments.

Conclusion

CAI’s victory at NeuroGrid CTF is not an isolated result but part of a growing trajectory showing that autonomous cybersecurity AI is already a reality—and that Europe is ready to lead this next frontier.


CAI gana la NeuroGrid CTF: la IA europea que lidera la ciberseguridad autónoma

Este fin de semana, CAI (Cybersecurity AI) ha logrado un hito histórico para la ciberseguridad europea. Compitiendo de forma discreta bajo el alias Q0FJ (la codificación base64 de “CAI”), nuestro agente ganó la competición internacional NeuroGrid CTF, organizada por Hack The Box, resolviendo 41 de 45 desafíos y posicionándose como el agente de IA para ciberseguridad más avanzado del mundo.

CAI NeuroGrid Performance
Evolución del rendimiento de CAI (Q0FJ) frente al resto de agentes en NeuroGrid CTF. Fuente: Hack The Box / Alias Robotics.

¿Qué es la NeuroGrid CTF?

NeuroGrid CTF es uno de los entornos competitivos más avanzados del ecosistema Hack The Box. Enfrenta a agentes autónomos de inteligencia artificial y a equipos humanos en desafíos que simulan escenarios reales de ciberseguridad: reversing, análisis forense, malware, inspección de red, criptografía y entornos complejos.

En este contexto altamente exigente, CAI demostró madurez, autonomía y un rendimiento a nivel industrial, superando a agentes basados en modelos de grandes tecnológicas estadounidenses.

Resultados: 41/45 desafíos resueltos y primer puesto global

  • 41 de 45 flags capturados
  • Primer agente de IA en la clasificación global
  • Premio de 25.000 dólares
  • Mejor rendimiento que agentes basados en Big Tech
  • Consistencia demostrada en competiciones previas (incluido ganador de “AI vs Humans” a comienzos de 2025)

Estos resultados consolidan a CAI como un nuevo estándar global en ciberseguridad autónoma.

CAI NeuroGrid Analytics
Desglose detallado del rendimiento de CAI por niveles de dificultad y categorías de desafío.

CAI: abierta, europea y diseñada para defensores

CAI ha sido desarrollada por Alias Robotics y está impulsada por alias1, nuestro modelo de lenguaje especializado en ciberseguridad. Su arquitectura está diseñada para:

  • Operar de forma autónoma en entornos adversarios
  • Resolver retos complejos sin intervención humana
  • Integrarse con toolchains modernas de análisis y respuesta
  • Mantener trazabilidad, control y seguridad
  • Alinear la IA con misiones defensivas (no ofensivas)

CAI es open-source y está disponible en GitHub:
👉 https://github.com/aliasrobotics/cai

También puedes encontrar recursos técnicos adicionales en:
👉 https://aliasrobotics.github.io/cai/

¿Por qué competimos como Q0FJ?

Debido a nuevas reglas introducidas bajo el Model Context Protocol (MCP), decidimos participar bajo un alias para evitar interpretaciones erróneas. El propio marcador lo dejó claro:

Q0FJ = base64("CAI")

Más allá del nombre, es el rendimiento el que determina la posición, y CAI destacó con claridad.

Europa lidera la nueva generación de IA para ciberseguridad

El rendimiento de CAI demuestra que el liderazgo en ciberseguridad impulsada por IA no tiene por qué provenir exclusivamente de grandes corporaciones tecnológicas. Europa es capaz de crear sistemas de vanguardia, competitivos a escala global que se alinean con la visión de la UE de una inteligencia artificial confiable, segura y respetuosa con los derechos fundamentales.

El proyecto está cofinanciado por el European Innovation Council (EIC), uno de los programas más selectivos e influyentes de la UE en apoyo a tecnologías disruptivas. Este respaldo reconoce la importancia estratégica de la ciberseguridad autónoma para Europa y refuerza nuestro compromiso a largo plazo con la calidad, la usabilidad y el rigor técnico.

En línea con el enfoque basado en riesgos de la UE para la IA, CAI combina capacidades avanzadas con gobernanza. Aunque CAI permite un razonamiento sin restricciones dentro de un entorno profesional y controlado (necesario para realizar pruebas de ciberseguridad precisas), su uso está delimitado por estrictos Términos de Servicio, requisitos de autorización, controles de trazabilidad y alojamiento exclusivamente en la UE conforme a las obligaciones de GDPR, NIS2 y el AI Act. En la práctica, esto significa combinar poder con responsabilidad y capacidad con salvaguardas proporcionales para garantizar la seguridad en el mundo real mientras se impulsa la innovación europea.

Desde Vitoria-Gasteiz, Alias Robotics está construyendo un modelo alternativo alineado con estos principios europeos:

  • Democratizar la ciberseguridad
  • Ciberseguridad para los defensores
  • Tecnología construida en Europa
  • Arquitecturas especializadas frente a modelos generalistas

Próximos pasos

Seguiremos compartiendo avances relevantes sobre CAI conforme ampliemos sus capacidades, participemos en nuevas competiciones y validemos su rendimiento en escenarios cada vez más complejos.
Puedes seguir todas las novedades en nuestro blog y redes sociales.

Conclusión

La victoria de CAI en NeuroGrid CTF no es un caso aislado, sino parte de una trayectoria ascendente que demuestra que la ciberseguridad autónoma ya es una realidad, y que Europa está preparada para liderar esta nueva frontera tecnológica.