Anthropic lanzó este martes Claude Fable 5, la primera versión pública de su muy esperado y temido modelo Claude Mythos, equipado con medidas de seguridad para evitar que los usuarios lo utilicen para explotar vulnerabilidades de ciberseguridad o desarrollar armas biológicas.
Datos clave
La compañía también anunció el lanzamiento de otro modelo más potente, Claude Mythos 5, para un “pequeño grupo de expertos en ciberseguridad y proveedores de infraestructura” que ya tenían acceso a la versión preliminar.
Anthropic afirma que los dos nuevos modelos son superiores en ingeniería de software, análisis de datos (como el análisis financiero) y tareas que requieren “visión” y “contexto a largo plazo”.
La compañía de IA indicó que está colaborando con el gobierno estadounidense para “ampliar progresivamente el acceso” al modelo más avanzado, que, según afirma, posee las “capacidades de ciberseguridad más sólidas del mundo”.
Claude Fable 5 y Mythos 5 tendrán un precio de 10 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, aproximadamente el doble del precio de los modelos Claude Opus más avanzados de Anthropic disponibles actualmente, pero aún menos de la mitad del precio al que se ofrecía la versión preliminar de Claude Mythos.
Los rumores sobre el lanzamiento previsto comenzaron a circular después de que el boletín Sources informara por primera vez que Anthropic se estaba preparando para lanzar una versión pública con “medidas de seguridad sustanciales” el martes, noticia que posteriormente también publicó The Information.
¿Cómo funcionarán las medidas de seguridad de Claude Fable?
Anthropic anunció que Claude Fable se lanzará con nuevos sistemas para detectar el uso indebido, como los intentos de “desbloquear” el modelo para acceder a información potencialmente dañina. Estos sistemas, que Anthropic denomina “clasificadores”, funcionan redirigiendo las consultas sobre ciertos temas a Claude Opus tras su detección.
Estos clasificadores incluirán consultas sobre ciberseguridad, incluidos los intentos de usar Claude para el “hackeo de agentes”, así como ciertas preguntas sobre biología y química que podrían conducir al desarrollo de armas biológicas. El tercer clasificador es lo que Anthropic denomina “destilación”, que detecta los intentos de usar Claude para crear modelos de IA alternativos.
Contexto clave
Anthropic lleva meses ofreciendo detalles sobre su próximo modelo, anunciándolo en abril pero sin publicarlo por motivos de seguridad. En su lugar, optó por lanzar una versión para un grupo de empresas tecnológicas como Apple, Microsoft y Google a través del Proyecto Glasswing con el fin de identificar vulnerabilidades de ciberseguridad.
Anthropic lanzó públicamente Mythos poco más de una semana después de presentar confidencialmente su solicitud para una oferta pública inicial. Se informa que la empresa tiene previsto salir a bolsa a finales de este año y actualmente está valorada en 965,000 millones de dólares tras una ronda de financiación en mayo.
Este artículo fue publicado originalmente en Forbes US
¿Te gustan las fotos y las noticias?, síguenos en nuestro Instagram










