OpenAI y Paradigm Presentan EVMbench: La Revolución en Auditorías de Contratos Inteligentes de Ethereum
Una nueva herramienta de inteligencia artificial promete transformar la manera en que se auditan los contratos inteligentes, poniendo en juego más de 100.000 millones de dólares en criptomonedas.
OpenAI, la fuerza detrás de ChatGPT, ha lanzado EVMbench, una innovadora solución desarrollada en colaboración con Paradigm. Esta herramienta tiene como objetivo evaluar el rendimiento de la inteligencia artificial en la auditoría de contratos inteligentes en la red Ethereum.
¿Qué Ofrece EVMbench?
EVMbench permite:
- Identificar vulnerabilidades en el código de contratos.
- Proponer soluciones sin comprometer el funcionamiento del sistema.
- Simular ataques en entornos controlados para probar la seguridad.
Esta herramienta se basa en 120 vulnerabilidades reales, recopiladas de 40 auditorías públicas, como las realizadas en Code4rena. El modelo GPT-5.3-Codex ha logrado un éxito del 72,2% al detectar fallos, superando el 31,9% de su predecesor, GPT-5.
Detección y Parcheo de Vulnerabilidades
EVMbench evalúa tres aspectos esenciales: en primer lugar, detecta vulnerabilidades usando información de auditorías públicas y asigna un riesgo. En segundo lugar, sugiere correcciones que no interrumpen el funcionamiento del protocolo. Por último, simula ataques para drenar fondos en un entorno seguro.
Sin embargo, los resultados no son perfectos. Los agentes a menudo se detienen tras encontrar un solo problema, lo que limita la auditoría completa del código. La eliminación de vulnerabilidades complejas sin comprometer la funcionalidad sigue siendo un reto.
El Contexto Económico en el que Surge EVMbench
OpenAI ha justificado el lanzamiento de esta herramienta debido a la enorme magnitud económica del sector: los contratos inteligentes representan rutinariamente más de 100.000 millones de dólares en activos digitales.
«A medida que los agentes de inteligencia artificial aumentan su capacidad de comprender, crear y ejecutar código, es fundamental medir su desempeño en contextos económicamente significativos», afirmó un representante de OpenAI.
OpenAI amplía su abanico de soluciones para la blockchain de Ethereum.
EVMbench llega en un periodo de rápido crecimiento de agentes autónomos en el ámbito cripto. Recientemente, Coinbase presentó la funcionalidad de Agentic Wallets, permitiendo operaciones sin comisiones en la red Base. Además, Phantom ha habilitado un servidor MCP para que los agentes gestionen automáticamente saldos en Solana.
