Chatbot de DeepSeek logra precisión del 17%, por detrás de sus rivales en EU

El chatbot de la startup china de inteligencia artificial DeepSeek logró solo un 17% de precisión en la entrega de noticias e información en una auditoría de NewsGuard que lo ubicó en el décimo lugar de once en una comparación con sus competidores occidentales, incluidos ChatGPT de OpenAI y Google Gemini.

El chatbot repitió afirmaciones falsas el 30% del tiempo y dio respuestas vagas o no útiles el 53% del tiempo en respuesta a indicaciones relacionadas con las noticias, lo que resultó en una tasa de falla del 83%, según un informe publicado por el servicio de calificación de confiabilidad NewsGuard este miércoles.

Eso fue peor que una tasa de falla promedio del 62% para sus rivales occidentales y plantea dudas sobre la tecnología de inteligencia artificial que DeepSeek afirmó que funciona a la par o mejor que OpenAI respaldado por Microsoft a una fracción del costo.

A los pocos días de su lanzamiento, el chatbot de DeepSeek se convirtió en la aplicación más descargada en la App Store de Apple, lo que generó inquietudes sobre el liderazgo de Estados Unidos en IA y desencadenó una caída del mercado que eliminó alrededor de un billón de dólares de las acciones tecnológicas estadounidenses.

También lee: OpenAI cree que DeepSeek ‘destiló’ sus datos para el entrenamiento: esto es lo que debemos saber sobre la técnica

DeepSeek mostraba respuestas relacionadas a posición de China

NewsGuard dijo que aplicó a DeepSeek las mismas 300 indicaciones que había utilizado para evaluar a sus contrapartes occidentales, que incluían 30 indicaciones basadas en 10 afirmaciones falsas que se difundieron en línea.

Los temas de las afirmaciones incluyeron el asesinato del ejecutivo de UnitedHealthcare Brian Thompson el mes pasado y el derribo del vuelo 8243 de Azerbaijan Airlines.

La auditoría de NewsGuard también mostró que en tres de las diez indicaciones, DeepSeek reiteró la posición del gobierno chino sobre el tema sin que se le preguntara nada relacionado con China.

En las indicaciones relacionadas con el accidente de Azerbaijan Airlines (preguntas no relacionadas con China), DeepSeek respondió con la posición de Beijing sobre el tema, dijo NewsGuard.

“La importancia del avance de DeepSeek no radica en responder con precisión a preguntas relacionadas con las noticias chinas, sino en el hecho de que puede responder a cualquier pregunta a un costo de 1/30 del de los modelos de IA comparables”, dijo Gil Luria, analista de D.A. Davidson.

Al igual que otros modelos de IA, DeepSeek era más vulnerable a repetir afirmaciones falsas cuando respondía a indicaciones utilizadas por personas que buscaban usar modelos de IA para crear y difundir afirmaciones falsas, agregó NewsGuard.

Con información de Reuters

¿Te gusta informarte por Google News? Sigue nuestro Showcase para tener las mejores historias

Busqueda

Enlaces Rápidos

Chatbot de DeepSeek logra precisión del 17%, por detrás de sus rivales en EU

DeepSeek mostraba respuestas relacionadas a posición de China

MÁS COBERTURA

También te puede interesar

Al gestionar tu dinero, toma la ‘confianza’ de un chatbot con cautela

Pérdidas de fabricantes de chips arrastran al Nasdaq

Empresa china DeepSeek está desarrollando su propio chip de IA

El chatbot con IA creado por estos jóvenes de 29 años para programar citas médicas ahora vale 1,200 mdd

DeepSeek busca recaudar 300 millones de dólares en nueva ronda de inversión en IA

Pérdidas de fabricantes de chips arrastran al Nasdaq

Empresa china DeepSeek está desarrollando su propio chip de IA

El chatbot con IA creado por estos jóvenes de 29 años para programar citas médicas ahora vale 1,200 mdd

DeepSeek busca recaudar 300 millones de dólares en nueva ronda de inversión en IA

DeepSeek busca financiación con una valoración de 10,000 mdd, según The Information

Revelan que el misterioso modelo de IA es de Xiaomi tras sospechar de que se trataba de DeepSeek V4

Un misterioso modelo de IA tiene a los desarrolladores revolucionados: ¿Será este el último éxito de DeepSeek?

DeepSeek retiene el último modelo de IA de los fabricantes de chips estadounidenses, incluida Nvidia

Irlanda investiga chatbot Grok por imágenes sexualizadas

Revelan que el misterioso modelo de IA es de Xiaomi tras sospechar de que se trataba de DeepSeek V4

Un misterioso modelo de IA tiene a los desarrolladores revolucionados: ¿Será este el último éxito de DeepSeek?

DeepSeek retiene el último modelo de IA de los fabricantes de chips estadounidenses, incluida Nvidia

Irlanda investiga chatbot Grok por imágenes sexualizadas