Enlaces rápidos

    Un potente modelo de inteligencia artificial que apareció de forma anónima en una plataforma para desarrolladores la semana pasada ha generado especulaciones de que la startup china DeepSeek podría estar probando discretamente su sistema de próxima generación antes de su lanzamiento oficial.

    El modelo gratuito, llamado Hunter Alpha, apareció en la plataforma de gateway de IA OpenRouter el 11 de marzo sin ninguna atribución por parte de los desarrolladores y fue descrito posteriormente por la plataforma como un “modelo sigiloso”.

    Durante las pruebas realizadas por Reuters, el chatbot Hunter Alpha se describió a sí mismo como “un modelo de IA chino entrenado principalmente en chino” y dijo que sus datos de entrenamiento se extendieron hasta mayo de 2025, el mismo punto de corte de conocimiento reportado por el propio chatbot de DeepSeek.

    Sin embargo, cuando se le preguntó por su creador, el sistema declinó identificar a su desarrollador.

    “Solo sé mi nombre, mi escala de parámetros y la duración de mi ventana de contexto”, dijo el chatbot.

    Ni DeepSeek ni OpenRouter han identificado al creador del modelo y no respondieron a las solicitudes de comentario.

    La página de perfil de Hunter Alpha lo describe como un modelo de 1 billón de parámetros, lo que significa que fue entrenado usando aproximadamente un billón de valores ajustables que determinan cómo el sistema procesa el lenguaje y genera respuestas. Los modelos con más parámetros generalmente requieren significativamente más potencia de cálculo para funcionar.

    El sistema también anuncia una ventana de contexto de hasta un millón de tokens, una medida de cuánto texto puede procesar o recordar un modelo de IA durante una sola interacción. Un token corresponde aproximadamente a un fragmento corto de texto, como parte de una palabra.

    “La combinación que destacó fue el contexto de 1 millón de tokens de Hunter Alpha, junto con capacidad de razonamiento y acceso libre”, dijo Nabil Haouam, un ingeniero que desarrolla sistemas de agentes de IA.

    “La mayoría de los modelos de frontera con esa ventana de contexto tienen un coste real a gran escala”, añadió.

    Estas especificaciones se asemejan a las expectativas de los medios locales para el modelo V4 de próxima generación de DeepSeek, que medios chinos han informado que podría lanzarse ya en abril. DeepSeek, como muchos de sus competidores chinos, cuenta con una buena financiación, aunque tiene una estructura inusual dado que su empresa matriz es un fondo de cobertura cuantitativo y no un conglomerado tecnológico.

    Te puede interesar: Baidu se suma a la moda de OpenClaw en China con nuevos agentes de IA

    Aunque la superposición no establece una conexión directa, ha intensificado la especulación entre los desarrolladores de que el sistema anónimo podría ser una versión temprana de prueba del próximo lanzamiento de DeepSeek.

    “El patrón de cadena de pensamiento es probablemente la señal más fuerte”, dijo Daniel Dewhurst, ingeniero de IA que analizó el modelo tras su lanzamiento, refiriéndose a cómo el modelo de IA razona.

    “El estilo de razonamiento es difícil de disimular y tiende a reflejar cómo se entrenó un modelo.”

    La escala y la capacidad de memoria de Hunter Alpha también coinciden con las especificaciones que han circulado para DeepSeek V4 desde principios de este año, añadió.

    Aun así, algunos desarrolladores advirtieron que las pruebas que vinculan el modelo con DeepSeek eran inconclusas.

    “Mi análisis sugiere que Hunter Alpha probablemente no sea DeepSeek V4”, dijo Umur Ozkul, que realiza pruebas independientes de benchmarks de IA, citando diferencias en el comportamiento relacionado con los tokens y en los patrones arquitectónicos en comparación con los sistemas existentes de DeepSeek.

    Dijo que la especulación sobre la conexión del modelo con DeepSeek era comprensible dado el momento y las capacidades anunciadas.

    Los lanzamientos anónimos de modelos no son inusuales, ya que plataformas como OpenRouter permiten a los desarrolladores enviar consultas a decenas de modelos de IA a través de una única interfaz, convirtiéndolas en un campo de pruebas popular para nuevos sistemas.

    Un modelo anónimo llamado Pony Alpha apareció en OpenRouter en febrero antes de que la empresa china Zhipu AI confirmara que formaba parte de su sistema GLM-5 cinco días después.

    Un aviso en la página de perfil de Hunter Alpha decía que todas las solicitudes y completaciones del modelo “son registradas por el proveedor y pueden usarse para mejorarlo”, subrayando la práctica generalizada de la industria de usar lanzamientos de modelos furtivos para obtener retroalimentación imparcial.

    El modelo fue adoptado rápidamente tras aparecer en la plataforma y procesó más de 160,000 millones de tokens hasta el domingo, según estadísticas de OpenRouter.

    Gran parte de la actividad provino de herramientas de desarrollo de software y marcos de agentes de IA como OpenClaw, que permiten a los sistemas de IA planificar tareas de forma autónoma e interactuar con software externo.

    Con información de Reuters

    Suscríbete a nuestro canal de YouTube y no te pierdas de nuestro contenido