Enlaces rápidos

    La empresa china DeepSeek, que recientemente publicó en código abierto un gran modelo de lenguaje que, según afirma, funciona tan bien como los sistemas de IA más capaces de OpenAI, es ahora el centro de atención de la comunidad de IA. Su tecnología está siendo elogiada como uno de los mejores rivales de código abierto para los mejores modelos de IA estadounidenses, lo que aviva las inquietudes sobre la formidable capacidad de China en la creciente carrera internacional de la IA y alienta a las empresas emergentes estadounidenses a reexaminar su propio trabajo después de que un rival extranjero aparentemente hiciera mucho más con tan pocos recursos.

    A finales de diciembre, el pequeño laboratorio chino, con sede en Hangzhou, lanzó V3, un modelo de lenguaje con 671 mil millones de parámetros, que según se informa se entrenó en dos meses por solo 5,58 millones de dólares. Se trata de un costo órdenes de magnitud menor que el GPT-4 de OpenAI, un modelo más grande con un estimado de 1,8 billones de parámetros, pero construido con un precio de 100 millones de dólares. La semana pasada, DeepSeek lanzó otro desafío, lanzando un modelo llamado R-1, que según afirma rivaliza con el modelo o1 de OpenAI en lo que se denomina “tareas de razonamiento”, como la codificación y la resolución de problemas complejos de matemáticas y ciencias. OpenAI cobra a los usuarios 200 dólares por mes por dichos modelos; DeepSeek ofrece el suyo propio de forma gratuita.

    El poder del modelo de DeepSeek y su precio ya están cambiando la forma en que las empresas emergentes de inteligencia artificial estadounidenses gestionan sus negocios. Es una alternativa barata y atractiva a las ofertas de empresas tradicionales como OpenAI, según dijo a Forbes Jesse Zhang, director ejecutivo de Decagon, que crea agentes de inteligencia artificial para el servicio de atención al cliente. El nuevo modelo de DeepSeek probablemente obligará a los gigantes estadounidenses de la inteligencia artificial como OpenAI y Anthropic a reevaluar sus propios precios.

    Eiso Kant, CTO y cofundador de Poolside AI, un unicornio que desarrolla IA para ingeniería de software, dijo a Forbes que la fortaleza de DeepSeek está en su capacidad de ingeniería para hacer más con menos.

    “Lo que DeepSeek está demostrando al mundo es que cuando se pone un gran énfasis en hacer que el entrenamiento sea eficiente en términos de computación, se pueden lograr muchas cosas”, afirmó. “Hay cosas increíbles que se pueden seguir extrayendo de estos chips Nvidia para hacerlos increíblemente más eficientes”.

    “Es una locura que alguien pueda gastar cientos de millones de dólares en un modelo de código cerrado y, de repente, conseguir uno de código abierto que está disponible de forma gratuita”.

    Greg Kamradt, presidente del Premio ARC

    Según dijo a Forbes Manu Sharma, director ejecutivo de la empresa de etiquetado de datos Labelbox, el modelo o1 de OpenAI supuestamente superado en ciertos puntos de referencia , algunas empresas emergentes ya han comenzado a adquirir datos para entrenar sistemas más avanzados. “Creo que la carrera de la inteligencia artificial general se ha reiniciado en muchos sentidos”, dijo. “Vamos a ver mucha más competitividad en todos los ámbitos”.

    Alexandr Wang, el multimillonario CEO del gigante de los datos de entrenamiento Scale AI, recientemente calificó el modelo como “revolucionario”. Y Aravind Srinivas, CEO de la startup de búsquedas de inteligencia artificial Perplexity, valorada en 9.000 millones de dólares, ha dicho que planea integrar el modelo en el producto de búsqueda principal. La empresa de chips de inteligencia artificial Groq ya ha añadido el modelo R1 de DeepSeek a sus unidades de procesamiento de lenguaje. (En junio, Forbes envió a Perplexity una orden de cese y desistimiento tras acusar a la startup de utilizar sus informes sin permiso).

    Otros no están tan impresionados. La directora ejecutiva de Writer, May Habib, dijo a Forbes que no le sorprende que los modelos de DeepSeek, entrenados con un presupuesto significativamente menor, sean capaces de igualar a los modelos más inteligentes de Estados Unidos. En octubre, Writer lanzó un modelo que se entrenó con solo 700.000 dólares, cuando a OpenAI le costó 4,6 millones de dólares construir un modelo con capacidades similares. La empresa utilizó datos sintéticos para reducir sus costos de entrenamiento.

    “Incluso antes de que el modelo de DeepSeek apareciera en escena, veníamos diciendo que estos modelos se estaban convirtiendo en productos básicos y que se estaban distribuyendo cada vez más”, afirmó Habib.

    Durante el fin de semana, a medida que crecía el rumor sobre la compañía, DeepSeek superó a ChatGPT en la tienda de aplicaciones de Apple , ocupando el puesto número 1 en descargas gratuitas de aplicaciones en los Estados Unidos. Luego, el lunes, varias acciones tecnológicas estadounidenses se desplomaron a medida que se extendía el pánico en torno al exitoso lanzamiento del modelo de DeepSeek. Al final del día, la capitalización de mercado del gigante de los chips de inteligencia artificial, Nvidia, se había reducido en casi 600 mil millones de dólares.

    Fue un cambio radical en el orden mundial de la IA. “Es una locura que alguien pueda gastar cientos de millones de dólares en un modelo de código cerrado”, dijo a Forbes Greg Kamradt, presidente de ARC Prize, una organización sin fines de lucro que evalúa modelos de IA . “Y de repente aparece uno de código abierto que está disponible de forma gratuita”.

    Durante semanas, los modelos de DeepSeek han sido elogiados por algunos de los nombres más destacados del mundo de la IA, entre ellos el científico jefe de IA de Meta, Yann LeCun, el cofundador de OpenAI, Andrej Karpathy , y el científico investigador principal de Nvidia, Jim Fan . Pero las noticias del último logro de la empresa han hecho que los pesos pesados ​​de la IA de Estados Unidos se apresuren a averiguar cómo la empresa china está obteniendo resultados tan impresionantes gastando mucho menos dinero.

    “Deepseek R1 es el momento Sputnik de la IA”, escribió el inversor multimillonario Marc Andreessen en X.

    “El lanzamiento de DeepSeek, inteligencia artificial de una empresa china, debería ser una llamada de atención para nuestras industrias: debemos concentrarnos plenamente en competir para ganar”.

    Presidente Donald Trump

    A pesar de la pompa y la grandilocuencia de los recientes anuncios de inteligencia artificial de la administración Trump, DeepSeek ha aumentado los temores de que Estados Unidos podría estar perdiendo su ventaja en materia de inteligencia artificial, en particular porque ha tenido tanto éxito a pesar de los estrictos controles de exportación estadounidenses que le impiden utilizar los chips de inteligencia artificial de última generación de Nvidia. El último logro de la empresa es un contrapunto aleccionador al Proyecto Stargate, una empresa conjunta entre OpenAI, Oracle y el conglomerado tecnológico japonés Softbank, para invertir 500.000 millones de dólares en infraestructura de inteligencia artificial.

    Antes de una reunión con los republicanos de la Cámara de Representantes en Florida el lunes, Trump reconoció la amenaza. “El lanzamiento de DeepSeek, inteligencia artificial de una empresa china, debería ser una llamada de atención para nuestras industrias de que debemos concentrarnos en competir para ganar”, dijo .

    El último logro de DeepSeek tiene algunas salvedades. Los investigadores han descubierto que sus modelos de IA tienden a autocensurarse en temas que son sensibles para el Partido Comunista Chino (PCCh). La investigadora de seguridad Jane Manchun Wong dijo a Forbes que los modelos de DeepSeek no responden a preguntas sobre el presidente chino Xi Jinping y las protestas de la Plaza Tiananmen de 1989. Más allá de esto, existen preocupaciones sobre la privacidad. Los datos ingresados ​​en los modelos de DeepSeek se almacenan en servidores ubicados en China, de acuerdo con sus políticas .

    Divyansh Kaushik, vicepresidente de la firma de asesoría en seguridad nacional Beacon Global Strategies, advirtió a Forbes contra el uso de DeepSeek por parte de personas sin una investigación exhaustiva. “A menos que podamos tener evaluaciones claras de seguridad nacional y libertad de expresión de los modelos chinos, deberían ser tratados como brazos de propaganda del PCCh”, dijo. “Deberían ser tratados como Huawei con esteroides”.

    El problema es la propuesta de valor de DeepSeek: un modelo de razonamiento de IA de última generación que se puede utilizar de forma gratuita y abierta en el mundo cerrado y de pago de la IA que están construyendo empresas como OpenAI y Anthropic. “Es mucho mejor tener un modelo chino de código abierto que un modelo estadounidense de código cerrado”, dijo Sharma de Labelbox.

    Con reporte extra de Richard Nieva.

    Este artículo fue publicado originalmente por Forbes US.

    Te puede interesar: Estos son los personajes que rindieron homenaje a Trump en Mar-A-Lago desde su elección