Anthropic lanza la primera versión pública de Claude Mythos, con importantes salvaguardias

La compañía anunció el lanzamiento de Claude Mythos 5, para un 'pequeño grupo de expertos en ciberseguridad y proveedores de infraestructura' que ya tenían acceso a la versión preliminar.

Anthropic afirmó que la nueva versión, llamada Claude Fable 5, contará con medidas de seguridad para prevenir su uso indebido en ámbitos como la ciberseguridad. Foto: Getty Images

Anthropic lanzó este martes Claude Fable 5, la primera versión pública de su muy esperado y temido modelo Claude Mythos, equipado con medidas de seguridad para evitar que los usuarios lo utilicen para explotar vulnerabilidades de ciberseguridad o desarrollar armas biológicas.

Datos clave

La compañía también anunció el lanzamiento de otro modelo más potente, Claude Mythos 5, para un “pequeño grupo de expertos en ciberseguridad y proveedores de infraestructura” que ya tenían acceso a la versión preliminar.

Anthropic afirma que los dos nuevos modelos son superiores en ingeniería de software, análisis de datos (como el análisis financiero) y tareas que requieren “visión” y “contexto a largo plazo”.

La compañía de IA indicó que está colaborando con el gobierno estadounidense para “ampliar progresivamente el acceso” al modelo más avanzado, que, según afirma, posee las “capacidades de ciberseguridad más sólidas del mundo”.

Claude Fable 5 y Mythos 5 tendrán un precio de 10 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, aproximadamente el doble del precio de los modelos Claude Opus más avanzados de Anthropic disponibles actualmente, pero aún menos de la mitad del precio al que se ofrecía la versión preliminar de Claude Mythos.

Los rumores sobre el lanzamiento previsto comenzaron a circular después de que el boletín Sources informara por primera vez que Anthropic se estaba preparando para lanzar una versión pública con “medidas de seguridad sustanciales” el martes, noticia que posteriormente también publicó The Information.

Te interesa: La gente común pronto podrá invertir en las OPV de OpenAI, Anthropic y SpaceX: aquí te explicamos cómo y por qué es arriesgado

¿Cómo funcionarán las medidas de seguridad de Claude Fable?

Anthropic anunció que Claude Fable se lanzará con nuevos sistemas para detectar el uso indebido, como los intentos de “desbloquear” el modelo para acceder a información potencialmente dañina. Estos sistemas, que Anthropic denomina “clasificadores”, funcionan redirigiendo las consultas sobre ciertos temas a Claude Opus tras su detección.

Estos clasificadores incluirán consultas sobre ciberseguridad, incluidos los intentos de usar Claude para el “hackeo de agentes”, así como ciertas preguntas sobre biología y química que podrían conducir al desarrollo de armas biológicas. El tercer clasificador es lo que Anthropic denomina “destilación”, que detecta los intentos de usar Claude para crear modelos de IA alternativos.

Contexto clave

Anthropic lleva meses ofreciendo detalles sobre su próximo modelo, anunciándolo en abril pero sin publicarlo por motivos de seguridad. En su lugar, optó por lanzar una versión para un grupo de empresas tecnológicas como Apple, Microsoft y Google a través del Proyecto Glasswing con el fin de identificar vulnerabilidades de ciberseguridad.

Anthropic lanzó públicamente Mythos poco más de una semana después de presentar confidencialmente su solicitud para una oferta pública inicial. Se informa que la empresa tiene previsto salir a bolsa a finales de este año y actualmente está valorada en 965,000 millones de dólares tras una ronda de financiación en mayo.

Este artículo fue publicado originalmente en Forbes US

¿Te gustan las fotos y las noticias?, síguenos en nuestro Instagram

Busqueda

Enlaces Rápidos

Anthropic lanza la primera versión pública de Claude Mythos, con importantes salvaguardias

Datos clave

¿Cómo funcionarán las medidas de seguridad de Claude Fable?

Contexto clave

MÁS COBERTURA

También te puede interesar

Anthropic vs. OpenAI: detrás de la amarga batalla por el futuro de la IA

CEO de Anthropic: ‘No sabemos exactamente cómo’ se utilizó la IA Claude en el ataque de una escuela en Irán

La gente común pronto podrá invertir en las OPV de OpenAI, Anthropic y SpaceX: aquí te explicamos cómo y por qué es arriesgado

Anthropic, incluida en la lista negra, y la Casa Blanca reducen las tensiones antes de su salida a bolsa

El impacto de los precios de la IA podría frenar el crecimiento de Anthropic

CEO de Anthropic: ‘No sabemos exactamente cómo’ se utilizó la IA Claude en el ataque de una escuela en Irán

La gente común pronto podrá invertir en las OPV de OpenAI, Anthropic y SpaceX: aquí te explicamos cómo y por qué es arriesgado

Anthropic, incluida en la lista negra, y la Casa Blanca reducen las tensiones antes de su salida a bolsa

El impacto de los precios de la IA podría frenar el crecimiento de Anthropic

Anthropic respalda orden de Trump que permitirá testar modelos de IA

Anthropic presenta confidencialmente su esperada salida a bolsa

Del ‘Vibe coding’ a la inteligencia empresarial: por qué la mayoría de los proyectos de IA fracasarán

Anthropic alcanza casi un 1 bdd de valoración, superando a OpenAI

ChatGPT, la aplicación de mayor crecimiento de la historia, pierde descargas ante Claude

Anthropic presenta confidencialmente su esperada salida a bolsa

Del ‘Vibe coding’ a la inteligencia empresarial: por qué la mayoría de los proyectos de IA fracasarán

Anthropic alcanza casi un 1 bdd de valoración, superando a OpenAI

ChatGPT, la aplicación de mayor crecimiento de la historia, pierde descargas ante Claude