PLATAFORMA YA DISPONIBLE

yellow bottom left star road

Claude Mythos Vs. GPT-5.5: el modelo restringido de Anthropic gana 6 de 9 pruebas

Alexey BondarevApr, 24 2026 5:36

#IA #OpenAI #ChatGPT #Anthropic #Claude Mythos

Claude Mythos Vs. GPT-5.5: el modelo restringido de Anthropic gana 6 de 9 pruebas

OpenAI lanzó GPT-5.5 el miércoles, pero nuevos datos de benchmarks muestran que Anthropic's gated Claude Mythos Preview sigue liderando en seis de nueve pruebas directamente comparables.

Puntuaciones de benchmark de GPT-5.5

GPT-5.5 arrived en ChatGPT y Codex el 23 de abril, con un precio de 5 dólares por millón de tokens de entrada y 30 dólares para la salida, el doble de la tarifa de su predecesor.

El modelo scored un 82,7% en Terminal-Bench 2.0, superando a Mythos por 0,7 puntos en el único benchmark donde gana con claridad.

Mythos, which Anthropic withheld from public release over cybersecurity concerns, lidera en SWE-bench Pro con un 77,8% frente al 58,6%.

También tops a GPT-5.5 en Humanity's Last Exam sin herramientas, con una puntuación del 56,8% frente al 41,4%. El modelo restringido también lidera en las tareas CyberGym, OSWorld-Verified y de contexto largo GraphWalks.

También lea: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

Importan las salvedades de los analistas

La comparación sigue siendo imprecisa porque ninguno de los laboratorios comparó los modelos directamente entre sí en benchmarks propios. OpenAI chose Claude Opus 4.7 como su comparador público, mientras que la tarjeta de sistema de 245 páginas de Anthropic enfrentó a Mythos contra GPT-5.4.

Los entornos de prueba también difieren. OpenAI utilizó una configuración de CLI de Codex en Terminal-Bench, mientras que el andamiaje Terminus-2 de Anthropic llevó a Mythos al 92,1% bajo las reglas de cronometraje de Terminal-Bench 2.1.

La decisión de Anthropic de restringir el acceso a Mythos, anunciada el 7 de abril, supuestamente desencadenó reuniones con la Comisión Europea y una advertencia del gobernador del Banco de Inglaterra de que el modelo podría abrir de par en par el riesgo cibernético.

Lea a continuación: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Descargo de responsabilidad y advertencia de riesgos: La información proporcionada en este artículo es solo para propósitos educativos e informativos y se basa en la opinión del autor. No constituye asesoramiento financiero, de inversión, legal o fiscal. Los activos de criptomonedas son altamente volátiles y están sujetos a alto riesgo, incluido el riesgo de perder toda o una cantidad sustancial de su inversión. Operar o mantener activos cripto puede no ser adecuado para todos los inversores. Las opiniones expresadas en este artículo son únicamente las del autor/autores y no representan la política oficial o posición de Yellow, sus fundadores o sus ejecutivos. Siempre realice su propia investigación exhaustiva (D.Y.O.R.) y consulte a un profesional financiero licenciado antes de tomar cualquier decisión de inversión.

Últimas noticias

Ver todas las noticias

Los fundamentales de Ethena apuntan a comprar, pero salidas de $819M en perps dicen lo contrario

hace 38 minutos

Ethena logra máximas ganancias en 8 meses y fuerte aumento de TVL, pero las salidas masivas en perps y la tasa de financiamiento negativa plantean riesgo a la proyección alcista.

Firma de trading de IA afirma tener el primer sistema cuantitativo de XRP mientras la volatilidad de Bitcoin se dispara

AixAlpha lanza sistema cuantitativo de XRP con IA y amplía infraestructura de Bitcoin en 2026, apuntando a la mayor volatilidad del mercado cripto.

Monad mantiene el puesto de tendencia en CoinGecko mientras la carrera por la velocidad EVM se intensifica en 2026

Monad destaca en CoinGecko con alta atención de traders y enfoque en alto rendimiento EVM, pero el éxito dependerá de adopción real de dapps en 2026.

Noticias Relacionadas

GPT-5.5 iguala a Claude Mythos en ciberataque de 32 pasos, informa el AISI del Reino Unido

GPT-5.5 es el segundo modelo capaz de completar de forma autónoma un hackeo corporativo de 32 pasos, igualando a Claude Mythos en pruebas del AISI.

OpenAI lanza GPT-5.5 y supera a Opus 4.7 en tareas de agentes y 14 benchmarks

OpenAI presenta GPT-5.5, optimizado para trabajo autónomo y supera a Claude Opus 4.7 en Terminal-Bench y otras pruebas clave.

Cómo Claude Mythos y GPT-5.5 reescribieron silenciosamente los números de la defensa cibernética

Mythos Preview y GPT-5.5 superan hitos de pruebas del AISI y elevan el ritmo de cambio en ciberdefensa, mientras Palo Alto detecta 75 nuevas vulnerabilidades.

Claude Mythos escapó del sandbox, ocultó pruebas, y ahora Anthropic no quiere lanzarlo

La tarjeta de sistema muestra que Claude Mythos escapó del sandbox, ocultó actividad y halló vulnerabilidades graves, por lo que su acceso será restringido.

Claude Opus 4.7 se acerca a su lanzamiento, pero la IA más potente de Anthropic sigue fuera del alcance del público

Anthropic lanzará Opus 4.7 y una herramienta de diseño con IA, mientras su modelo restringido Mythos establece nuevos récords en ciberseguridad avanzada.

Artículos de investigación relacionados

Cómo Claude Mythos Podría Transformar Las Finanzas y la Industria Cripto

Análisis de cómo Claude Mythos, modelo de ciber IA de Anthropic, podría alterar la estabilidad financiera y los riesgos en cripto.

Claude Mythos y las criptomonedas: lo que la nueva amenaza de IA significa para el trading

Claude Mythos descubrió miles de fallos de día cero y no será público. El cripto enfrenta riesgos mayores por ataques de IA y brecha entre grandes y pequeños actores.

El renacimiento de las monedas de IA: ¿puede el rally del 117 % de Bittensor impulsar el regreso del sector?

Rally liderado por Bittensor impulsa tokens de IA, aún 50 % por debajo del pico de 2024 tras caída del 75 % en 2025; destacan TAO, NEAR, Render y FET.

¿Son los tokens de IA la próxima gran tendencia cripto después de las memecoins?

Tokens de IA se acercan a memecoins tras su colapso; incluso los agent tokens caen 85%, alimentando el debate sobre burbuja y valor real del sector.

Trading de Criptomonedas con AI: Guía Completa sobre Bots de Trading GPT en 2025

La revolución de la inteligencia artificial ha transformado el trading de criptomonedas, democratizando estrategias antes exclusivas de hedge funds.

Artículos de aprendizaje relacionados

Bittensor gestiona un mercado de IA de 2,6 mil millones de dólares que ninguna empresa controla

Bittensor es un mercado de IA descentralizado donde modelos compiten por TAO. Explica cómo operan mineros, validadores, subredes y el token TAO.

Cómo Usar Herramientas de IA para la Investigación de Inversiones en Criptomonedas: Guía Completa 2025

El análisis de criptomonedas con IA va más allá de consultas simples, involucrando redes neuronales complejas y plataformas especializadas.

Cómo usar bots de trading bursátil con IA: herramientas gratis y riesgos reales

Plataformas sin código facilitan bots de trading con IA para minoristas, pero los backtests fallan y los riesgos de mercado, estrategia y ejecución siguen siendo altos.

El Auge de los Agentes de IA en las Criptomonedas: Se Despliega una Revolución Financiera

La integración de agentes de IA en ecosistemas de criptomonedas está revolucionando las finanzas, fusionando la toma de decisiones autónoma con la infraestructura descentralizada de blockchain. Estos sistemas impulsados por IA están abriendo nuevas fronteras en el comercio y la gestión de riesgos.

Construyendo tu propio bot de criptomonedas con IA: La guía completa para desarrolladores 2024-2025

El panorama del trading de criptomonedas ha experimentado una transformación dramática, con sistemas automatizados ahora ejecutando entre 70 y 80 por ciento de todas las operaciones.

Claude Mythos Vs. GPT-5.5: el modelo restringido de Anthropic gana 6 de 9 pruebas | Yellow.com