Enlaces rápidos

    El chatbot de la startup china de inteligencia artificial DeepSeek logró solo un 17% de precisión en la entrega de noticias e información en una auditoría de NewsGuard que lo ubicó en el décimo lugar de once en una comparación con sus competidores occidentales, incluidos ChatGPT de OpenAI y Google Gemini.

    El chatbot repitió afirmaciones falsas el 30% del tiempo y dio respuestas vagas o no útiles el 53% del tiempo en respuesta a indicaciones relacionadas con las noticias, lo que resultó en una tasa de falla del 83%, según un informe publicado por el servicio de calificación de confiabilidad NewsGuard este miércoles.

    Eso fue peor que una tasa de falla promedio del 62% para sus rivales occidentales y plantea dudas sobre la tecnología de inteligencia artificial que DeepSeek afirmó que funciona a la par o mejor que OpenAI respaldado por Microsoft a una fracción del costo.

    A los pocos días de su lanzamiento, el chatbot de DeepSeek se convirtió en la aplicación más descargada en la App Store de Apple, lo que generó inquietudes sobre el liderazgo de Estados Unidos en IA y desencadenó una caída del mercado que eliminó alrededor de un billón de dólares de las acciones tecnológicas estadounidenses.

    También lee: OpenAI cree que DeepSeek ‘destiló’ sus datos para el entrenamiento: esto es lo que debemos saber sobre la técnica

    DeepSeek mostraba respuestas relacionadas a posición de China

    NewsGuard dijo que aplicó a DeepSeek las mismas 300 indicaciones que había utilizado para evaluar a sus contrapartes occidentales, que incluían 30 indicaciones basadas en 10 afirmaciones falsas que se difundieron en línea.

    Los temas de las afirmaciones incluyeron el asesinato del ejecutivo de UnitedHealthcare Brian Thompson el mes pasado y el derribo del vuelo 8243 de Azerbaijan Airlines.

    La auditoría de NewsGuard también mostró que en tres de las diez indicaciones, DeepSeek reiteró la posición del gobierno chino sobre el tema sin que se le preguntara nada relacionado con China.

    En las indicaciones relacionadas con el accidente de Azerbaijan Airlines (preguntas no relacionadas con China), DeepSeek respondió con la posición de Beijing sobre el tema, dijo NewsGuard.

    “La importancia del avance de DeepSeek no radica en responder con precisión a preguntas relacionadas con las noticias chinas, sino en el hecho de que puede responder a cualquier pregunta a un costo de 1/30 del de los modelos de IA comparables”, dijo Gil Luria, analista de D.A. Davidson.

    Al igual que otros modelos de IA, DeepSeek era más vulnerable a repetir afirmaciones falsas cuando respondía a indicaciones utilizadas por personas que buscaban usar modelos de IA para crear y difundir afirmaciones falsas, agregó NewsGuard.

    Con información de Reuters

    ¿Te gusta informarte por Google News? Sigue nuestro Showcase para tener las mejores historias