Anthropic bloqueó temas peligrosos en su nuevo modelo Fable 5

Anthropic lanzó su nuevo modelo de inteligencia artificial, llamado Fable 5. La compañía dijo que Fable 5 es muy poderoso, pero también decidió bloquear algunos temas para evitar problemas. Los temas bloqueados incluyen seguridad informática, biología y química.
Cuando los usuarios hicieron preguntas sobre estos temas, Fable 5 no respondió directamente. En lugar de eso, el modelo usó una versión anterior llamada Opus 4.8 y mostró un aviso. Anthropic explicó que las reglas fueron muy estrictas. A veces, el sistema bloqueó preguntas que no eran peligrosas. Esto pasó en menos del cinco por ciento de los casos.
La compañía dijo que estos bloqueos fueron importantes para evitar que personas malas usaran el modelo. Anthropic también probó el modelo durante más de mil horas. Equipos externos intentaron engañar a Fable 5, pero no pudieron. El modelo rechazó muchos intentos de jailbreak automático.
Advertisement
Anthropic usó una prueba llamada ExploitBench para medir la seguridad. El modelo Mythos 5 obtuvo un 78 por ciento en esta prueba. El modelo anterior, Opus 4.8, obtuvo solo un 40 por ciento. Esto mostró una gran mejora.
En el pasado, Anthropic solo bloqueó preguntas sobre armas biológicas. Pero ahora, Fable 5 bloqueó todas las preguntas de biología y química. La compañía dijo que las personas malas podían usar preguntas simples para ayudar en investigaciones biológicas peligrosas.
Anthropic entendió que esto fue difícil. Las mismas preguntas fueron útiles para científicos, pero peligrosas para otros. Por eso, la compañía decidió quién fue confiable. Un programa para profesionales de seguridad informática, llamado Project Glasswing, permitió acceso especial. Ahora, también hubo un programa para organizaciones de ciencias de la vida. Estos grupos eliminaron los bloqueos de biología y química, pero mantuvieron los de seguridad informática.
El modelo Fable 5 estuvo disponible para API y usuarios empresariales. Costó diez dólares por millón de tokens de entrada y cincuenta dólares por millón de tokens de salida. Estos precios fueron más altos que los de GPT-5.5 de OpenAI.
Anthropic dijo que Fable 5 fue el primer modelo de su clase Mythos. La compañía afirmó que superó a los modelos Opus anteriores en muchas capacidades.
Take a position. Out loud, if you can.
Four ways to start. Pick one and try saying it before you scroll on.
Tip · Record yourself, use in a notebook, or practice with a language partner.
¿Qué hizo Anthropic cuando los usuarios preguntaron sobre temas peligrosos?
Pretérito indefinido (Simple past)
The simple past is used for completed actions in the past. In this article, we see verbs like 'lanzó' (launched), 'dijo' (said), 'decidió' (decided), 'obtuvo' (obtained). These describe events that happened and finished.
“Anthropic lanzó su nuevo modelo de inteligencia artificial, llamado Fable 5.”
What to know · A2
Try saying this aloud
Scenario: You are explaining to a coworker why an AI system refused to answer a question about chemistry.
- 01“bloquearon el tema”
- 02“era demasiado peligroso”
- 03“usó otro modelo”
Register tip · informal
🔑Key Phrases
Shows the past tense of 'usar' and the adjective 'anterior' (previous). Good for comparisons.
El teléfono usó una batería anterior.
🎙️ Article Audio — Kokoro TTS
Anthropic bloqueó temas peligrosos en su nuevo modelo Fable 5
Adapted from Ars Technica · Read the original. LinguaPress rewrites the facts as original graded-reader text for language learners.
Advertisement


