Tecnología

OpenAI y Broadcom presentan un chip a medida diseñado para la inferencia de IA a gran escala

Ars Technicahace 2 h
Primer plano de un chip de ordenador en una placa de circuito
Primer plano de un chip de ordenador en una placa de circuitoPhoto: Jakub Pabis / Pexels

OpenAI y Broadcom han anunciado un chip a medida diseñado específicamente para ejecutar grandes modelos de lenguaje a gran escala, según Ars Technica, en uno de los movimientos más significativos hasta la fecha de una empresa de IA para construir su propio silicio. La colaboración une el conocimiento de OpenAI sobre cómo se comportan sus modelos con la experiencia de Broadcom en el diseño y la fabricación de semiconductores de gama alta.

El chip apunta de lleno a la inferencia, el término que designa el trabajo que hace un modelo cuando genera una respuesta a un usuario, frente al entrenamiento, el proceso intensivo en recursos de construir el modelo en primer lugar. A medida que los servicios de IA llegan a cientos de millones de usuarios, la inferencia se ha convertido en el coste recurrente dominante, y la economía de atender cada consulta moldea ahora todo el negocio.

Esa distinción explica la estrategia. Un chip optimizado solo para inferencia puede prescindir de las funciones necesarias para el entrenamiento y concentrar los transistores en las operaciones concretas que requiere ejecutar un modelo. En principio, ese enfoque puede ofrecer más rendimiento por vatio y por dólar que un procesador de propósito general que realice la misma tarea.

El movimiento también habla de la dependencia del sector respecto a Nvidia, cuyos procesadores gráficos han impulsado la mayor parte del auge de la IA. Esa dependencia ha dejado a las grandes empresas de IA expuestas a las limitaciones de suministro y a los precios altos, y varias han respondido diseñando sus propios aceleradores para ganar margen y previsibilidad sobre su insumo más importante.

El papel de Broadcom es central. La empresa no es un nombre conocido en la tecnología de consumo, pero es una potencia en el diseño de chips a medida, que ayuda a grandes clientes a convertir sus requisitos en silicio funcional. Asociarse con Broadcom permite a OpenAI buscar hardware a medida sin construir desde cero una operación de semiconductores.

Diseñar un chip es solo parte del reto. El silicio a medida necesita una pila de software que permita a los modelos ejecutarse en él con eficiencia, y buena parte de las herramientas del sector ha crecido en torno al ecosistema de Nvidia. Hacer competitivo un chip propio implica invertir con fuerza en los compiladores y bibliotecas que traducen las cargas de IA al nuevo hardware.

La recompensa potencial es sustancial. Si OpenAI puede ejecutar sus modelos en chips ajustados a sus necesidades exactas, podría reducir el coste de cada interacción, aliviar su dependencia de un único proveedor y ganar la libertad de optimizar hardware y modelos a la vez. Esas ventajas se multiplican a la escala en que OpenAI opera hoy.

También hay riesgos. Los proyectos de chips de vanguardia son caros y lentos, y el campo avanza lo bastante rápido como para que un diseño quede superado antes de fabricarse en volumen. El silicio a medida también fija ciertas suposiciones sobre cómo funcionan los modelos, lo que podría convertirse en una limitación si la tecnología subyacente cambia.

El anuncio encaja en un patrón más amplio entre las grandes tecnológicas, varias de las cuales han construido sus propios aceleradores de IA en lugar de depender por completo de componentes estándar. La tendencia refleja el reconocimiento de que, a suficiente escala, controlar el hardware se vuelve tan estratégico como los propios modelos.

Para el mercado en general, sugiere el informe de Ars Technica, la relevancia reside menos en cualquier especificación concreta que en la dirección del rumbo. A medida que los costes de inferencia dominan la economía de la IA, las empresas que operan los mayores servicios están cada vez más decididas a diseñar los chips de los que dependen esos servicios, reconfigurando el equilibrio de poder en la industria de los semiconductores.

Este artículo es un resumen editorial asistido por IA basado en Ars Technica. La imagen es una foto de archivo de Jakub Pabis en Pexels.

Para seguir leyendo