OpenAI y Broadcom presentan un chip a medida diseñado para la inferencia de IA a gran escala

OpenAI y Broadcom han anunciado un chip a medida diseñado específicamente para ejecutar grandes modelos de lenguaje a gran escala, según Ars Technica, en uno de los movimientos más significativos hasta la fecha de una empresa de IA para construir su propio silicio. La colaboración une el conocimiento de OpenAI sobre cómo se comportan sus modelos con la experiencia de Broadcom en el diseño y la fabricación de semiconductores de gama alta.
El chip apunta de lleno a la inferencia, el término que designa el trabajo que hace un modelo cuando genera una respuesta a un usuario, frente al entrenamiento, el proceso intensivo en recursos de construir el modelo en primer lugar. A medida que los servicios de IA llegan a cientos de millones de usuarios, la inferencia se ha convertido en el coste recurrente dominante, y la economía de atender cada consulta moldea ahora todo el negocio.
Esa distinción explica la estrategia. Un chip optimizado solo para inferencia puede prescindir de las funciones necesarias para el entrenamiento y concentrar los transistores en las operaciones concretas que requiere ejecutar un modelo. En principio, ese enfoque puede ofrecer más rendimiento por vatio y por dólar que un procesador de propósito general que realice la misma tarea.
El movimiento también habla de la dependencia del sector respecto a Nvidia, cuyos procesadores gráficos han impulsado la mayor parte del auge de la IA. Esa dependencia ha dejado a las grandes empresas de IA expuestas a las limitaciones de suministro y a los precios altos, y varias han respondido diseñando sus propios aceleradores para ganar margen y previsibilidad sobre su insumo más importante.
El papel de Broadcom es central. La empresa no es un nombre conocido en la tecnología de consumo, pero es una potencia en el diseño de chips a medida, que ayuda a grandes clientes a convertir sus requisitos en silicio funcional. Asociarse con Broadcom permite a OpenAI buscar hardware a medida sin construir desde cero una operación de semiconductores.
Diseñar un chip es solo parte del reto. El silicio a medida necesita una pila de software que permita a los modelos ejecutarse en él con eficiencia, y buena parte de las herramientas del sector ha crecido en torno al ecosistema de Nvidia. Hacer competitivo un chip propio implica invertir con fuerza en los compiladores y bibliotecas que traducen las cargas de IA al nuevo hardware.
La recompensa potencial es sustancial. Si OpenAI puede ejecutar sus modelos en chips ajustados a sus necesidades exactas, podría reducir el coste de cada interacción, aliviar su dependencia de un único proveedor y ganar la libertad de optimizar hardware y modelos a la vez. Esas ventajas se multiplican a la escala en que OpenAI opera hoy.
También hay riesgos. Los proyectos de chips de vanguardia son caros y lentos, y el campo avanza lo bastante rápido como para que un diseño quede superado antes de fabricarse en volumen. El silicio a medida también fija ciertas suposiciones sobre cómo funcionan los modelos, lo que podría convertirse en una limitación si la tecnología subyacente cambia.
El anuncio encaja en un patrón más amplio entre las grandes tecnológicas, varias de las cuales han construido sus propios aceleradores de IA en lugar de depender por completo de componentes estándar. La tendencia refleja el reconocimiento de que, a suficiente escala, controlar el hardware se vuelve tan estratégico como los propios modelos.
Para el mercado en general, sugiere el informe de Ars Technica, la relevancia reside menos en cualquier especificación concreta que en la dirección del rumbo. A medida que los costes de inferencia dominan la economía de la IA, las empresas que operan los mayores servicios están cada vez más decididas a diseñar los chips de los que dependen esos servicios, reconfigurando el equilibrio de poder en la industria de los semiconductores.
Para seguir leyendo

Cómo la refrigeración líquida reduce a casi cero el consumo de agua de los centros de datos
Un nuevo diseño de refrigeración de centros de datos que funciona en caliente, en torno a los 45 grados Celsius, puede reducir el consumo de agua casi a cero manteniendo frescos los chips de IA. Este explicativo desglosa por qué los centros de datos consumen tanta agua y cómo la refrigeración líquida caliente cambia la ecuación.

¿Qué son las passkeys? El sustituto de la contraseña y quién se niega aún a ofrecerlo
Un nuevo sitio web señala a las empresas que todavía no ofrecen passkeys, la tecnología pensada para sustituir a las contraseñas. Este explicativo aborda qué son las passkeys, cómo hacen las cuentas más difíciles de hackear y por qué su adopción entre los grandes servicios sigue siendo desigual.

La IA iba a acabar con los empleos de ingeniería: por qué los nuevos datos muestran lo contrario
Las predicciones de que la IA borraría los empleos de ingeniería de software no se han cumplido, y nuevos datos sugieren que estos puestos están entre los más resilientes. Los analistas señalan un patrón en el que las herramientas de IA hacen a los ingenieros más productivos en lugar de prescindibles, aunque la naturaleza del trabajo cambie.

Google abre Play Store a pagos externos: qué cambia para las apps y los usuarios
Google permite por fin a los desarrolladores usar sistemas de pago alternativos en Play Store, un cambio impulsado por la presión antimonopolio y acuerdos judiciales. La medida podría reducir las comisiones que pagan los desarrolladores y reconfigurar las compras digitales en Android, aunque el impacto práctico para los usuarios aún se está perfilando.

Hollywood y OpenAI: cómo la inteligencia artificial está rediseñando la economía del cine
La nueva película del director italiano Luca Guadagnino, « Artificial », centrada en la inteligencia artificial, refleja un acercamiento creciente entre los grandes estudios de Hollywood y empresas de IA como OpenAI. Un reportaje de The Verge expone lo que ese acercamiento significa para la industria cinematográfica.
