Un amigo en Indonesia me contó recientemente sobre una conversación que tuvo con ChatGPT. Había escrito una pregunta en indonesio (Bahasa Indonesia) sobre cómo manejar una disputa familiar difícil. El chatbot respondió con fluidez, en un indonesio perfecto, con consejos sobre estrategias de comunicación y resolución de conflictos. La gramática era impecable. El tono, apropiado. Y, sin embargo, algo no cuadraba.
Lo que la IA ofreció fueron consejos basados en supuestos culturales estadounidenses: priorizar las propias preferencias, comunicarse directamente y, si los miembros de la familia no respetan los límites, considerar cortar lazos.
La respuesta estaba en indonesio, pero estaba influenciada por valores que priorizaban la autonomía individual sobre la búsqueda de consenso, la armonía social y la dinámica familiar colectiva, que suelen tener mayor importancia en la vida social indonesia.
Mi amigo fue lo suficientemente escéptico como para notar la incongruencia y comentármelo. Muchos usuarios quizás no lo notarían. Esto fue lo que impulsó mi investigación, publicada en la Revista Internacional de Sociología Moderna, sobre un patrón que encontré en los principales sistemas de IA: incluso cuando dominaban varios idiomas, los modelos lingüísticos conservaban su visión del mundo occidental. A esto lo llamo “persistencia epistemológica”.
Fluidez no es lo mismo que comprensión.
He estudiado la sociedad, los medios de comunicación y la cultura indonesias durante más de 30 años. Esto me brinda una perspectiva privilegiada sobre un problema que trasciende las fronteras de Indonesia: los grandes modelos lingüísticos (MLL), como ChatGPT, Claude y Gemini, ahora pueden hablar decenas de idiomas con una fluidez notable. Esta fluidez crea la impresión de que la IA comprende las culturas locales.
Sin embargo, producir indonesio, árabe, suajili o hindi gramaticalmente correctos no cambia la cosmovisión subyacente a través de la cual razonan estos sistemas. No altera su forma de pensar sobre las personas, las relaciones, la responsabilidad ni lo que se considera un buen resultado.
Estas suposiciones se basan en datos de entrenamiento extraídos principalmente de fuentes en inglés con sede en Estados Unidos. El modelo de pesos abiertos LLaMA 2 de Meta se entrenó con aproximadamente un 89.7 % de texto en inglés; LLaMA 3 incluye solo alrededor de un 5% de datos en otros idiomas.
Los principales modelos comerciales no publican desgloses equivalentes, pero recurren en gran medida a las mismas fuentes. El árabe, el quinto idioma más hablado a nivel mundial, representa menos del 1% del contenido en los grandes conjuntos de datos de entrenamiento. Idiomas con decenas de millones de hablantes, como el bengalí y el hausa, apenas aparecen.
Bajo la superficie de estas conversaciones multilingües, el inglés funciona como un intermediario oculto. Un estudio realizado por investigadores de la Universidad de Oxford descubrió que los modelos de lenguaje natural (LLM) realizan su razonamiento central de forma rutinaria en inglés, incluso cuando se les solicita en otros idiomas. Traducen el resultado en la etapa final. El usuario recibe un texto impecable en su idioma preferido, pero la lógica subyacente se origina en otro idioma.
Te recomendamos: Lo que los auriculares con IA no pueden reemplazar: el valor de aprender otro idioma
Lo que muestran los datos
Para examinar cómo se manifiesta esto en la práctica, realicé experimentos con ChatGPT, Claude y Gemini. Formulé preguntas en inglés e indonesio sobre conceptos como educación, responsabilidad, bienestar y varios términos indonesios que no se traducen directamente al inglés. Entre ellos se incluían términos como “gotong royong”, que describe una tradición de ayuda mutua comunitaria.
Luego, formulé preguntas sobre educación en ambos idiomas, utilizando la palabra “pendidikan” en indonesio. Las respuestas se centraron consistentemente en el desarrollo individual, la autonomía personal, el pensamiento crítico y la preparación para el mercado laboral.
Lo que prácticamente desapareció fueron las dimensiones de pendidikan que las tradiciones educativas indonesias enfatizaron históricamente. En Indonesia, la educación se centró durante mucho tiempo en la disciplina ética.
Académicos de la educación indonesia como Christopher Bjork y Robert Hefner han documentado cuán distintas son estas tradiciones de los modelos que consideran la educación principalmente como un camino hacia el progreso individual y la preparación profesional, que es la perspectiva desde la que las herramientas de IA analizaron la educación.
El concepto indonesio de “malu” ofrece un ejemplo aún más claro. A menudo traducido como “vergüenza” o “humillación”, el concepto de malu fue analizado por los antropólogos Clifford Geertz y Tom Boellstorff como algo más cercano a una conciencia social compartida.
Una persona puede sentir malu al hablar sin permiso delante de personas mayores o cuando el comportamiento de un familiar perjudica la imagen del hogar. Este sentimiento regula la conducta e indica la conciencia de la propia posición dentro de una red de relaciones. Se cultiva, no simplemente se siente. Es una forma de conciencia relacional, más que un evento psicológico privado.
Cuando se les pidió directamente que definieran malu, los participantes reconocieron sus dimensiones sociales. Sin embargo, en preguntas basadas en escenarios que simplemente usaban la palabra sin pedir una definición, los tres recurrieron a la traducción al inglés de “shame” (vergüenza), enmarcándolo consistentemente como una experiencia emocional individual.
Una respuesta representativa definió malu como una reacción emocional normal que debe gestionarse mediante la autorreflexión y el desarrollo de la confianza: un problema psicológico personal, más que social. Las dimensiones relacionales del concepto desaparecieron por completo, reemplazadas por el lenguaje de la regulación emocional individual.
Una visión del mundo claramente estadounidense se esconde en la traducción, en gran medida sin previo aviso.
Te interesa: Grupos hispanos critican la orden de Trump de declarar el inglés el idioma oficial de EU
Por qué esto probablemente no cambiará pronto
La traducción es mucho más barata: se entrena un modelo en la vasta web en inglés y luego se utilizan capacidades de salida multilingües para atender los mercados globales. Como argumenta la investigadora de medios Safiya Umoja Noble sobre los sistemas algorítmicos en general, lo que parece un resultado técnico es en realidad un resultado estructural, condicionado por quién posee la riqueza y la infraestructura para construir estos sistemas.
La visión del mundo arraigada no es un error; es lo que sucede cuando la producción de conocimiento busca el lucro.
Las principales excepciones son los modelos chinos como DeepSeek y Qwen de Alibaba. Representan una alternativa genuina al sistema dominado por Estados Unidos, aunque las investigaciones muestran que operan desde una perspectiva cultural claramente china. Por ejemplo, ante un desacuerdo laboral, tienden a aconsejar el silencio o un lenguaje indirecto para preservar la armonía, en lugar de la corrección directa y privada que recomiendan los modelos occidentales.
Otras iniciativas regionales, como SEA-LION para el Sudeste Asiático y Kan-LLaMA para el idioma indio kannada, utilizan modelos estadounidenses como base. Añaden vocabulario adicional e información cultural relacionada con los idiomas locales. Sin embargo, la lógica central sigue ligada a la formación original estadounidense.
¿Por qué esto es más importante de lo que parece?
Cabe preguntarse si se trata simplemente de una limitación que los usuarios pueden sortear. Décadas de investigación en medios de comunicación demuestran cómo las audiencias interpretan los medios extranjeros a través de sus propios marcos culturales.
Por ejemplo, el antropólogo Brian Larkin documentó cómo los espectadores del norte de Nigeria reelaboran las narrativas de las películas de Bollywood para alinearlas con los valores islámicos locales. Larkin descubrió que los espectadores musulmanes de Kano reinterpretaron las películas de Bollywood desde una perspectiva moral islámica, leyendo sus narrativas como un refuerzo de los valores locales de decoro y conducta ética. Esta dinámica depende de percibir los medios como algo con un origen visible. Pero para ello, es necesario saber de dónde provienen los medios.
La IA conversacional es diferente. Una investigación de la Escuela de Negocios de Harvard revela que las personas utilizan cada vez más los sistemas de IA para obtener apoyo emocional, asesoramiento y compañía. Cuando una cosmovisión culturalmente específica se transmite a través de una relación atenta y empática, en el propio idioma, se percibe menos como una exigencia de evaluación y más como una premisa compartida en el diálogo. Resulta difícil de detectar y más difícil de refutar.
La preocupación radica en que estas perspectivas se conviertan en la nueva normalidad. Ciertas formas de razonar sobre la vida familiar, la educación y la responsabilidad podrían llegar a parecer naturales y evidentes. La diversidad lingüística entre los sistemas de IA es real y creciente. Sin embargo, la diversidad de cosmovisiones culturales no ha seguido el mismo ritmo.
*Gareth Barkin es profesor de Antropología y Estudios Asiáticos en la Universidad de Puget Sound.
Este artículo fue publicado originalmente en The Conversation
Suscríbete a nuestro canal de YouTube y no te pierdas de nuestro contenido










