Anthropic se prepara para lanzar Claude Opus 4.7 y una herramienta de diseño impulsada por IA para crear sitios web y presentaciones, un movimiento que sacudió el lunes las acciones de Adobe, Wix y Figma.
Detalles del lanzamiento de Opus 4.7
The Information reported el 14 de abril que ambos productos podrían enviarse tan pronto como esta semana, citando a una persona con conocimiento de los planes. La herramienta de diseño acepta instrucciones en inglés sencillo y está dirigida tanto a desarrolladores como a usuarios no técnicos.
Eso puts a Anthropic en competencia directa con startups como Gamma y Stitch de Google.
Opus 4.7 ni siquiera es el modelo más avanzado de Anthropic.
Esa distinción pertenece a Claude Mythos, un sistema centrado en ciberseguridad que la empresa solo distribuye a firmas de seguridad seleccionadas a través de Project Glasswing, manteniéndolo alejado del público en general.
También lee: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
Crisis de benchmarks de IA y Mythos
OpenAI declaró recientemente que SWE-bench Verified, el principal benchmark de programación, estaba «contaminado» tras descubrir que los modelos más avanzados habían memorizado sus soluciones durante el entrenamiento. Aun así, los laboratorios siguen citando esas mismas pruebas en comparaciones entre modelos.
Una evaluación independiente, ARC-AGI-3, subrayó la brecha entre los sistemas de IA y el razonamiento humano. Gemini obtuvo un 0,37 % y GPT-5.4 alcanzó un 0,26 %, mientras que los humanos lograron un 100 %. Sin una ficha técnica detallada de modelo por parte de Anthropic, las afirmaciones sobre las mejoras de Opus 4.7 siguen siendo difíciles de verificar de forma independiente.
El AI Security Institute del Reino Unido evaluó Mythos Preview recientemente y descubrió que puede ejecutar de forma autónoma ciberataques sofisticados a un ritmo que ningún otro modelo ha igualado. Se convirtió en la primera IA en completar «The Last Ones», una simulación de ataque a una red corporativa de 32 pasos que normalmente lleva 20 horas a los equipos rojos humanos.
Lee también: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers






