DeepSeek lanza un modelo de IA 'intermedio' en camino hacia la próxima generación

El desarrollador chino de IA, DeepSeek, lanzó su último modelo “experimental”. De acuerdo con la empresa, el entrenamiento es más eficiente y el procesamiento de secuencias de texto largas es mejor que las iteraciones anteriores de sus modelos de lenguaje de gran tamaño.

La empresa, con sede en Hangzhou, calificó a DeepSeek-V3.2-Exp como un “paso intermedio hacia nuestra arquitectura de próxima generación” en una publicación en el foro de desarrolladores Hugging Face.

Es probable que esta arquitectura sea el lanzamiento de producto más importante de DeepSeek desde que las versiones V3 y R1 sorprendieran a Silicon Valley y a los inversores tecnológicos fuera de China.

Te podría interesar: El modelo chino de inteligencia artificial DeepSeek aprende más cuando recibe ‘recompensa’

DeepSeek mantiene presión sobre rivales chinos

El modelo V3.2-Exp incluye un mecanismo llamado DeepSeek Sparse Attention, que, según la empresa china, puede reducir los costes informáticos y mejorar el rendimiento de algunos modelos. DeepSeek anunció el lunes en una publicación en X que está reduciendo los precios de las API en más del 50 %.

Si bien es poco probable que la arquitectura de próxima generación de DeepSeek revolucione los mercados como lo hicieron las versiones anteriores en enero, aún podría ejercer una presión significativa sobre rivales nacionales como Qwen de Alibaba y sus homólogos estadounidenses como OpenAI si logra repetir el éxito de DeepSeek R1 y V3.

Eso requeriría demostrar una alta capacidad por una fracción de lo que sus competidores cobran y gastan en el entrenamiento de modelos.

Con información de Reuters

¿Te gustan las fotos y las noticias?, síguenos en nuestro Instagram