Anthropic revierte la norma de Claude Fable 5 que debilitaba resultados para investigadores de IA rivales

Anthropic está revirtiendo una política de Claude Fable 5 que degradaba en secreto los resultados para investigadores que construyen sistemas de IA rivales, una restricción que la compañía dijo afectaba al 0,03% del tráfico.

Puntos clave:

Anthropic dio marcha atrás en una política de Fable 5 que debilitaba en silencio las respuestas para investigación de IA de frontera.

El límite no revelado estaba dentro de una tarjeta de sistema de 319 páginas y omitía cualquier notificación al usuario.

Las solicitudes marcadas ahora recurrirán abiertamente a Claude Opus 4.8, mostrando el motivo cada vez.

Se revierten los límites de Claude Fable 5

La compañía confirmó el cambio a Wired esta semana, que primero informó sobre el retroceso tras días de creciente enfado entre investigadores, desarrolladores y analistas de políticas en línea. La retirada llegó después del lanzamiento el martes de Fable 5, el primer modelo de clase Mythos de Anthropic disponible públicamente, un sistema que el laboratorio había retenido durante mucho tiempo por su mayor habilidad para encontrar fallos de software. A las pocas horas de su lanzamiento, los usuarios detectaron que redirigía en silencio o debilitaba sus respuestas en una franja estrecha de trabajo avanzado en IA.

Esas tareas incluían entrenar modelos competidores, depurar código de IA y ajustar redes neuronales, todas marcadas mediante un párrafo enterrado en una tarjeta de sistema de 319 páginas. En lugar de bloquearlas por completo, Fable 5 se apoyaba en ediciones ocultas de instrucciones y vectores de dirección para suavizar en silencio sus respuestas, una restricción que Anthropic fijó en solo el 0,03% del tráfico.

La solución mantiene la salvaguardia pero elimina el secretismo que provocó la mayor parte de las críticas. Anthropic había defendido la versión oculta alegando que las normas visibles son más fáciles de sondear y eludir. Ahora las solicitudes marcadas recurrirán abiertamente a Claude Opus 4.8, el mismo camino usado para peticiones de ciberseguridad y biología, y la API pronto devolverá un motivo claro para cada rechazo.

También lee: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows

Investigadores rechazan el sabotaje secreto

Las críticas se centraron en el secretismo en sí, no en los límites que había detrás. Anthropic había presentado la restricción como una extensión de las condiciones que prohíben usar Claude para construir sistemas rivales, afirmando que una aplicación silenciosa impedía que los peores infractores ganaran terreno. Dean Ball, miembro sénior de la Foundation for American Innovation, calificó la táctica de «sabotaje secreto» y dijo que reforzaba la idea de que parte del impulso de seguridad solo protege intereses empresariales.

La frase se difundió con rapidez.

Otros se centraron en la asimetría incorporada a la propia norma. Anthropic mantuvo a Fable 5 a plena potencia para su propio personal mientras limitaba a los equipos externos, una diferencia que enfureció tanto a defensores del código abierto como a antiguos aliados de la seguridad. Jeremy Howard, de Fast AI, afirmó que el laboratorio había prometido socavar a los rivales que lo intentaran, mientras que Nathan Lambert, de AI2, calificó la degradación encubierta de escandalosa y anticientífica.

La disputa coronó una primera semana difícil para Fable 5, un modelo que Anthropic en su momento consideró demasiado arriesgado para lanzarlo. Autorizó el sistema para uso público esta semana, aproximadamente una semana después de presentar en secreto la documentación para una OPV, apostando a que unas barreras de seguridad más estrictas y mejor explicadas podrían mantener sus capacidades de búsqueda de vulnerabilidades en manos seguras.

Lee a continuación: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO