Revelan que el misterioso modelo de IA es de Xiaomi tras sospechar de que se trataba de DeepSeek V4

La semana pasada, un potente modelo de inteligencia artificial apareció de forma anónima en una plataforma de desarrolladores y luego se reveló que provenía del gigante chino de smartphones y vehículos eléctricos Xiaomi. Esto desató especulaciones sobre que la startup DeepSeek podría estar probando en secreto su sistema de próxima generación antes de lanzarlo oficialmente.

El lanzamiento de los modelos de bajo coste de DeepSeek, DeepSeek-V3 y R1, provocó una venta masiva global de acciones tecnológicas el año pasado, lo que llevó a los inversores a cuestionarse si las empresas estadounidenses de IA necesitaban gastar miles de millones de dólares en potencia de cálculo de IA. Desde entonces, ha habido un gran interés en DeepSeek-V4, un modelo de nueva generación que aún no ha sido lanzado.

El misterioso modelo gratuito, llamado Hunter Alpha, apareció en la plataforma de pasarela de IA OpenRouter el 11 de marzo sin ninguna atribución por parte de los desarrolladores y fue descrito posteriormente por la plataforma como un “modelo sigiloso”.

El equipo de modelos de IA de Xiaomi, MiMo, dirigido por el exinvestigador de DeepSeek Luo Fuli, dijo el miércoles que Hunter Alpha fue una “primera versión interna de prueba de MiMo-V2-Pro”, un modelo insignia diseñado para servir como el “cerebro” de los agentes de IA, herramientas que permiten a los usuarios ejecutar tareas complejas con menos indicaciones humanas y supervisión en comparación con un chatbot.

El nuevo modelo de Xiaomi llega en un momento en que OpenClaw, un framework de agentes de código abierto, está siendo adoptado rápidamente por usuarios de todo tipo en China.

“Yo llamo a esto una emboscada silenciosa, no porque lo planeáramos, sino porque el cambio del chat al paradigma de agente ocurrió tan rápido que ni siquiera nos lo creíamos”, dijo Luo en una publicación de X el jueves.

“La gente pregunta por qué nos movemos tan rápido”, añadió. “Lo vi de primera mano construyendo DeepSeek R1.”

MiMo-V2-Pro se asociará con cinco grandes frameworks de agentes, incluido OpenClaw, para ofrecer una semana de acceso gratuito a desarrolladores de todo el mundo.

Las acciones de Xiaomi cotizadas en Hong Kong subieron hasta un 5,8% el jueves.

Durante las pruebas realizadas por Reuters la semana pasada, el chatbot Hunter Alpha se describió a sí mismo como “un modelo de IA chino entrenado principalmente en chino” y afirmó que sus datos se remontan a mayo de 2025, el mismo punto de corte de conocimiento que reportó el propio chatbot de DeepSeek.

Sin embargo, cuando se le preguntó por su creador, el sistema declinó identificar a su desarrollador.

Te puede interesar: Roche compró miles de chips de IA Nvidia para acelerar el desarrollo de fármacos

“Solo sé mi nombre, mi escala de parámetros y la duración de mi ventana de contexto”, dijo el chatbot.

La página de perfil de Hunter Alpha lo describe como un modelo de 1 billón de parámetros, lo que significa que fue entrenado usando aproximadamente un billón de valores ajustables que determinan cómo el sistema procesa el lenguaje y genera respuestas.

El sistema también anuncia una ventana de contexto de hasta un millón de tokens, una medida de cuánto texto puede procesar o recordar un modelo de IA durante una sola interacción. Un token corresponde aproximadamente a un fragmento corto de texto, como parte de una palabra.

“La combinación que destacó fue el contexto de un millón de tokens de Hunter Alpha, junto con capacidad de razonamiento y acceso libre”, dijo Nabil Haouam, un ingeniero que desarrolla sistemas de agentes de IA.

“La mayoría de los modelos de frontera con esa ventana de contexto tienen un coste real a gran escala”, añadió.

Esas especificaciones se parecían a las expectativas de los medios locales para el modelo V4 de próxima generación de DeepSeek, que los medios chinos han informado que podría lanzarse ya en abril.

Umur Ozkul, que realiza pruebas independientes de benchmark de IA, dijo que la especulación sobre conectar el modelo con DeepSeek era comprensible dado el momento y las capacidades anunciadas.

Los lanzamientos de modelos sigilosos no son inusuales, ya que plataformas como OpenRouter permiten a los desarrolladores enviar consultas a decenas de modelos de IA a través de una única interfaz, convirtiéndolas en un campo de pruebas popular para nuevos sistemas.

Un modelo anónimo llamado Pony Alpha apareció en OpenRouter en febrero antes de que la empresa china Zhipu AI confirmara que formaba parte de su sistema GLM-5 cinco días después.

Un aviso en la página de perfil de Hunter Alpha decía que todas las solicitudes y completaciones del modelo “son registradas por el proveedor y pueden usarse para mejorarlo”, subrayando la práctica generalizada de la industria de usar lanzamientos de modelos furtivos para obtener retroalimentación imparcial.

El modelo se adoptó rápidamente tras aparecer en la plataforma, superando el billón de tokens en uso total y encabezando las clasificaciones de OpenRouter, según MiMo.

Con información de Reuters

Suscríbete a nuestro canal de YouTube y no te pierdas de nuestro contenido