Claude Fable 5: El modelo que no querían liberar ahora está en tus manos
En abril escribí sobre un modelo demasiado peligroso para ser liberado. Anthropic había construido algo que encontraba miles de fallas de seguridad desconocidas en todos los sistemas operativos principales. Armaron una coalición de cien millones de dólares, restringieron el acceso a cincuenta socios, y dijeron que lo responsable era mantenerlo bajo llave. Ese post terminaba con “esto es solo el principio.”
En junio, Anthropic liberó ese modelo. Mismos pesos. Misma arquitectura. El mismo cerebro que encontró un bug de 28 años en OpenBSD por cincuenta dólares. Le cambiaron el nombre a Claude Fable 5, lo envolvieron en una capa de clasificadores de seguridad y lo publicaron en la API — al alcance de cualquiera con una tarjeta de crédito. El modelo demasiado peligroso para ser liberado se convirtió en un modelo con el que simplemente puedes hablar.
¿Cómo pasa un modelo de “demasiado peligroso para cualquiera” a “disponible en todos lados” entre abril y junio? Esa es la pregunta que este post desarma: qué cambió realmente, qué puede hacer el modelo, y qué significa para quienes construimos con estas herramientas.
Qué cambió
La respuesta corta: el modelo no cambió. Cambió el harness — el sistema de controles que lo envuelve. Piensa en la diferencia entre un motor de Fórmula 1 suelto sobre una mesa y ese mismo motor dentro de un carro con frenos, cinturón y airbags.
Entre abril y junio pasaron tres cosas. Primero, Project Glasswing se expandió. La coalición de defensores que recibió acceso al modelo restringido pasó de cincuenta socios a unas doscientas organizaciones en más de quince países: compañías de energía, acueductos, hospitales, fabricantes de hardware. La infraestructura de la que dependes todos los días sin pensarlo. En esa ventana encontraron más de diez mil fallas de seguridad graves. Diez mil. El modelo haciendo exactamente aquello para lo que lo construyeron: encontrar los huecos antes de que los encuentre alguien con malas intenciones.
Segundo, Anthropic construyó la capa de seguridad. La pieza central son los clasificadores: filtros que revisan cada consulta antes de responderla y detectan si toca terreno delicado — hackear sistemas, biología, química, o intentos de copiar el modelo para entrenar otro. Cuando ninguno se activa, te responde Fable 5 a plena potencia. Cuando uno se activa, la respuesta viene de Claude Opus 4.8, el modelo de la generación anterior: todavía excelente, solo un escalón abajo. No es un rechazo — no te chocas contra una pared ni recibes un “no puedo ayudarte con eso”. Es el motor bajando un cambio justo en la curva peligrosa. Y para probar que la capa aguanta, ofrecieron recompensas a expertos externos por romperla: más de mil horas de intentos de jailbreak — el arte de engañar a una IA para que se salte sus propias reglas — y nadie encontró una forma universal de lograrlo.
Tercero — y aquí es donde todo encaja — midieron qué tan seguido saltan esos filtros. Menos del cinco por ciento de las sesiones. El resto del tiempo — más del noventa y cinco por ciento — estás hablando con el modelo completo, sin nada en el medio. La correa existe, pero casi nunca se siente.
Pero cuando la correa importa, importa de verdad. Hay una prueba llamada ExploitBench que mide justo lo que hacía aterrador a Mythos: su habilidad para hackear. Mythos 5 — la versión sin filtros que reciben los defensores de Glasswing — saca 78 sobre 100. Fable 5, el mismo modelo con los filtros puestos, saca cero. Mismos pesos. Mismo cerebro. En esa única materia, los filtros lo bajan de mejor del mundo a nada. Todo el diseño resumido en dos números: potencia completa en todo, excepto en lo único que puede usarse como arma.
Hasta los nombres cuentan la historia. Anthropic explica en una nota al pie que Fable viene del latín fabula — “lo que se cuenta” — primo hermano del griego mythos. La misma historia, contada de dos maneras. Mythos 5, sin filtros, para los ciberdefensores. Fable 5, con filtros, para todo el mundo. CyberScoop lo bautizó “Mythos on a leash” — Mythos con correa — y honestamente, es el resumen más preciso de dos palabras que he visto.
Abril y junio, lado a lado:
| Abril — Mythos Preview | Junio — Fable 5 | |
|---|---|---|
| Quién puede usarlo | ~50 socios verificados | Cualquiera con una API key |
| Precio (por millón de tokens) | $25 entrada / $125 salida | $10 entrada / $50 salida |
| Project Glasswing | 12 socios fundadores + 40 organizaciones | ~200 organizaciones en más de 15 países |
| Capacidad de hackeo | Completa, tras verificación | Bloqueada por filtros — reservada para Mythos 5 |
Cada fila se mueve en la misma dirección: más acceso, menor costo, y un control más estricto sobre la única capacidad que asustaba a todos.
Qué puede hacer
No necesitas otra pared de benchmarks. Lo que vale tu tiempo es lo que reportaron las empresas cuando tuvieron acceso temprano.
Stripe tomó un codebase de cincuenta millones de líneas en Ruby e hizo una migración completa en un día. Su equipo estimó que la misma migración les habría tomado más de dos meses a mano. El CEO de Cursor dijo que Fable 5 abrió “una clase de problemas de largo horizonte que estaban fuera de alcance para modelos anteriores.” Uno de los socios con acceso temprano de Anthropic reportó que en investigación de física de frontera, Fable 5 llegó en 36 horas casi a donde GPT-5.5 aterrizó después de cuatro días — usando un tercio de los tokens de razonamiento.
Si escribes software, hay un benchmark que vale la pena conocer: SWE-bench Pro, que les tira problemas de software difíciles y de múltiples pasos a los modelos. Fable 5 saca 80.3%. Opus 4.8 saca 69.2%. GPT-5.5 aterriza en 58.6%. Eso no es una ventaja incremental. Es una brecha donde el modelo está resolviendo problemas que los otros no pueden.
Esa brecha se ve mejor en una gráfica. FrontierCode es un examen armado con los 50 problemas de programación más difíciles de un banco de 150 — tan difíciles que todos los modelos todavía fallan más de lo que aciertan. La prueba deja que cada modelo gaste más o menos esfuerzo en pensar, y mide cuánto le rinde ese gasto:
Mira las tres curvas. GPT-5.5 (gris) no se mueve: gaste lo que gaste, ronda el 5%. Opus 4.8 (verde) mejora hasta cierto punto y se estanca cerca del 13% — de ahí no pasa, aunque le des más recursos. Fable 5 (naranja) es el único que sigue subiendo: cada dólar extra de esfuerzo se convierte en más problemas resueltos, hasta llegar al 31%. Eso es tener el techo más alto: no es que sea más barato — es que es el único al que darle más le sigue sirviendo.
Y no es solo código. Los socios de biología de Anthropic lo usaron para acelerar partes del diseño de fármacos cerca de diez veces, y en un proyecto de genómica construyó un modelo de machine learning a la medida que superó un resultado publicado en Science siendo cien veces más pequeño. Mi demo favorito es más modesto que todo eso: le pidieron un diseño imprimible en 3D, y primero construyó el editor CAD, y luego diseñó la pieza ahí. La herramienta no existía, así que hizo la herramienta.
Y después está lo de Pokémon. Los modelos anteriores de Claude no podían pasar Pokémon FireRed ni siquiera con un sistema elaborado de ayuda que les daba mapas, herramientas de navegación e información extra del estado del juego. Fable 5 terminó el juego con nada más que capturas de pantalla crudas — una configuración mínima, solo visión. Suena a benchmark de juguete hasta que te das cuenta de lo que realmente está probando: razonamiento autónomo sostenido a través de cientos de decisiones secuenciales, sin andamiaje al cual agarrarse.
Esa última parte es a la que hay que prestarle atención. No es que el modelo sea más inteligente en ningún paso individual — es que mantiene la coherencia durante horizontes más largos sin desviarse. Si alguna vez has visto a un agente perder el hilo a mitad de una tarea, sabes exactamente cuánto vale eso.
El horizonte de trabajo
La pregunta obvia es qué cambia frente a Opus 4.8, que ya podía trabajar solo durante horas — y lo hacía bien. La diferencia no es de resistencia sino de capacidad. Mientras más larga y enredada es una tarea, más le exige al modelo: cada decisión depende de las anteriores y los errores pequeños se van acumulando. Opus completa la maratón en terreno plano. Fable 5 la corre en montaña: planes más grandes, problemas más enredados, cientos de decisiones encadenadas — y llega al final con el objetivo intacto.
Eso cambia el tamaño de lo que se le puede delegar. Trabajo que antes había que partir en pedazos — un refactor entero, una migración, una suite de tests completa — ahora se entrega de una sola pieza y se recoge terminado al final del día. La diferencia no es cuántas horas trabaja. Es qué tan grande es el problema que puede sostener en la cabeza de principio a fin.
Qué significa todo esto
Quita el ruido del lanzamiento y queda una sola idea en pie.
El mismo modelo es el arma y la herramienta. La inteligencia que encontró miles de zero-days es la misma inteligencia que migra un codebase de cincuenta millones de líneas. El cerebro que podía encadenar cuatro vulnerabilidades separadas hasta tomar control total de un sistema es el mismo cerebro que mantiene coherencia a través de cientos de decisiones de código. Las capacidades de seguridad y las capacidades generales no son cosas separadas. Son la misma cosa — razonamiento autónomo profundo — apuntado en diferentes direcciones.
La única diferencia entre el modelo demasiado peligroso para liberar y el modelo que cualquiera puede usar es el sistema envuelto alrededor de él. No los pesos. No el entrenamiento. El harness.
Eso valida algo a lo que sigo volviendo en lo que escribo sobre trabajar con agentes. El modelo ya no es donde vive el valor. El valor vive en el sistema que lo rodea. Anthropic acaba de probarlo a la escala más grande imaginable: puedes tomar el modelo más peligroso jamás construido y hacerlo seguro para uso general construyendo un mejor harness. El modelo no cambió. Todo lo que está alrededor de él sí.
El movimiento de negocio
Aquí también hay una historia de negocio, y el timing la cuenta sola. Anthropic presentó confidencialmente su prospecto de IPO la misma semana que expandieron Glasswing. Una semana después de eso, liberaron el modelo al público. Lo pusieron a $10 por millón de tokens de entrada y $50 por millón de salida — menos de la mitad de lo que costaba Mythos Preview. Salió en AWS Bedrock, GitHub Copilot, Vertex AI y Microsoft Foundry desde el día uno — e incluso los planes de suscripción de Claude lo incluyeron sin costo extra durante la ventana de lanzamiento.
Eso no es distribución cautelosa. Es máximo alcance en el primer día. Pasaron de “nadie puede tener esto” en abril a “todo el mundo puede tener esto, en todas las plataformas” en junio. La capa de seguridad no solo resolvió un problema técnico. Resolvió un problema de negocio.
Y hay una pregunta más difícil debajo: ¿qué significa que ahora puedes rentar el modelo más capaz jamás construido por diez dólares por millón de tokens? La asimetría que hacía a Mythos aterrador — una IA encontrando vulnerabilidades críticas por cincuenta dólares — no desaparece porque el modelo cambió de nombre. Solo significa que la misma asimetría ahora aplica a todos los problemas, no solo a seguridad. El costo de resolver problemas difíciles con el modelo de IA más capaz disponible se redujo en más de la mitad entre abril y junio.
Qué viene después
¿Honestamente? Nadie lo sabe. Cualquiera que te venda aquí una predicción segura está adivinando.
Lo que sí sabemos: en abril, un modelo que era demasiado poderoso para liberar existía detrás de una puerta cerrada. En junio, ese modelo estaba corriendo en mi máquina. La brecha entre “capacidad de frontera” y “disponible al público” se comprimió de años a meses. Si Fable 5 es lo que pasa cuando construyes una capa de seguridad alrededor de Mythos Preview, ¿qué pasa cuando llega el siguiente modelo de clase Mythos y la capa de seguridad ya está construida?
El ritmo no se ha frenado. Si acaso, este lanzamiento prueba que es más rápido que la línea de tiempo que mapeé cuando escribí por primera vez sobre la revolución silenciosa. La revolución sigue haciéndose más fuerte.
A seguir construyendo. Con cuidado, todavía — pero la puerta ya está abierta.
Recursos
- Claude Fable 5 and Claude Mythos 5 — Anthropic — Anuncio oficial de lanzamiento con benchmarks, salvaguardas y detalles de disponibilidad
- Expanding Project Glasswing — Anthropic — Expansión de junio de 2026 que suma ~150 organizaciones de energía, agua, salud y hardware en más de 15 países
- Claude Fable 5 on AWS — AWS News Blog — Disponibilidad en Bedrock y detalles de integración
- Claude Fable 5 for GitHub Copilot — GitHub Changelog — Integración con Copilot y política de retención de datos
- Anthropic’s new model is Mythos on a leash — CyberScoop — Análisis de seguridad de la arquitectura de salvaguardas
- Claude Fable 5 & Mythos 5: The Frontier, Split in Two — Digital Applied — Comparación detallada de benchmarks entre modelos de frontera
- Claude API Models Overview — Anthropic Docs — Especificaciones técnicas, precios e identificadores de API
Mantente al día
Recibe una notificación cuando publique algo nuevo. Sin spam, cancela cuando quieras.
Sin spam. Cancela cuando quieras.