Meta comienza a probar su primer chip de entrenamiento de IA interno

Meta, propietaria de Facebook, está probando su primer chip interno para entrenar sistemas de inteligencia artificial, un hito clave en su camino hacia el diseño de más de su propio silicio personalizado y la reducción de la dependencia de proveedores externos como Nvidia, dijeron dos fuentes.

La compañía de redes sociales más grande del mundo comenzó un pequeño despliegue del chip y planea aumentar la producción para un uso a gran escala si la prueba sale bien, dijeron las fuentes.

El impulso para desarrollar chips internos es parte de un plan a largo plazo en Meta para reducir sus enormes costos de infraestructura mientras la compañía realiza apuestas costosas en herramientas de IA para impulsar el crecimiento.

Meta, que también posee Instagram y WhatsApp, pronosticó gastos totales para 2025 de 114,000 millones a 119,000 millones de dólares, incluidos hasta 65,000 millones en gastos de capital impulsados en gran medida por el gasto en infraestructura de IA.

Una de las fuentes dijo que el nuevo chip de entrenamiento de Meta es un acelerador dedicado, lo que significa que está diseñado para manejar solo tareas específicas de IA. Esto puede hacer que sea más eficiente energéticamente que las unidades de procesamiento gráfico integradas (GPU) que se usan generalmente para cargas de trabajo de IA.

Meta está trabajando con el fabricante de chips taiwanés TSMC para producir el chip, dijo esta persona.

La implementación de prueba comenzó después de que Meta terminó su primer “tape-out” del chip, un marcador significativo de éxito en el trabajo de desarrollo de silicio que implica enviar un diseño inicial a través de una fábrica de chips, dijo la otra fuente.

Un tape-out típico cuesta decenas de millones de dólares y lleva aproximadamente de tres a seis meses para completarse, sin garantía de que la prueba tenga éxito. Una falla requeriría que Meta diagnostique el problema y repita el paso de tape-out.

El chip es el último en la serie Meta Training and Inference Accelerator (MTIA) de la compañía. El programa ha tenido un comienzo inestable durante años y en un momento descartó un chip en una fase similar de desarrollo.

Sin embargo, el año pasado Meta comenzó a utilizar un chip MTIA para realizar inferencias, o el proceso involucrado en el funcionamiento de un sistema de IA a medida que los usuarios interactúan con él, para los sistemas de recomendación que determinan qué contenido aparece en los feeds de noticias de Facebook e Instagram.

Te recomendamos: Meta utiliza reconocimiento facial de celebridades para detectar anuncios falsos

Meta espera utilizar sus propios chips en 2026

Los ejecutivos de Meta han dicho que quieren comenzar a utilizar sus propios chips para 2026 para el entrenamiento, o el proceso de computación intensiva de alimentar al sistema de IA con montones de datos para “enseñarle” cómo funcionar.

Al igual que con el chip de inferencia, el objetivo del chip de entrenamiento es comenzar con sistemas de recomendación y luego usarlo para productos de IA generativa como el chatbot Meta AI, dijeron los ejecutivos.

“Estamos trabajando en cómo haríamos el entrenamiento para los sistemas de recomendación y luego, eventualmente, cómo pensamos en el entrenamiento y la inferencia para la IA generativa”, dijo el director de productos de Meta, Chris Cox, en la conferencia de tecnología, medios y telecomunicaciones de Morgan Stanley la semana pasada.

Cox describió los esfuerzos de desarrollo de chips de Meta como “una especie de situación de caminar, gatear y correr” hasta ahora, pero dijo que los ejecutivos consideraron que el chip de inferencia de primera generación para recomendaciones fue un “gran éxito”.

Meta anteriormente desactivó un chip de inferencia personalizado interno después de que fracasara en una implementación de prueba a pequeña escala similar a la que está haciendo ahora para el chip de entrenamiento, y en su lugar revirtió el rumbo y realizó pedidos de GPU Nvidia por valor de miles de millones de dólares en 2022.

La empresa de redes sociales ha seguido siendo uno de los principales clientes de Nvidia desde entonces, acumulando un arsenal de GPU para entrenar sus modelos, incluidos los sistemas de recomendaciones y anuncios y su serie de modelos básicos Llama. Las unidades también realizan inferencias para los más de 3 mil millones de personas que usan sus aplicaciones cada día.

El valor de esas GPU se ha puesto en tela de juicio este año, ya que los investigadores de IA expresan cada vez más dudas sobre cuánto más progreso se puede lograr si se continúa “ampliando” los modelos de lenguaje grandes agregando cada vez más datos y potencia informática.

Esas dudas se reforzaron con el lanzamiento a fines de enero de nuevos modelos de bajo costo de la startup china DeepSeek, que optimizan la eficiencia computacional al depender más de la inferencia que la mayoría de los modelos existentes.

En una caída global inducida por DeepSeek en las acciones de IA, las acciones de Nvidia perdieron hasta una quinta parte de su valor en un momento dado. Posteriormente recuperaron la mayor parte de ese terreno, y los inversores apostaron a que los chips de la compañía seguirán siendo el estándar de la industria para el entrenamiento y la inferencia, aunque han vuelto a caer debido a preocupaciones comerciales más amplias.

Con información de Reuters

Suscríbete a nuestro canal de YouTube y no te pierdas de nuestro contenido