Espacio publicitario

Vista previa de GTC: Dentro de la fábrica de IA: la guerra de infraestructura de un billón de dólares bajo el capó de la economía de la IA

Vista previa de GTC: Dentro de la fábrica de IA: la guerra de infraestructura de un billón de dólares bajo el capó de la economía de la IA

Cada año, la industria de la inteligencia artificial se reúne en la Conferencia de Tecnología GPU de Nvidia Corp. esperando ver unidades de procesamiento de gráficos más rápidas, modelos más grandes y la próxima ola de innovación en software de IA.

Y sí, todo eso estará ahí.

Pero si has estado observando las conversaciones que hemos tenido durante los últimos años, sabrás que la verdadera historia no sólo sucede en el escenario, sino que sucede bajo el capó.

Espacio publicitario

Lo que se está desarrollando en este momento es la mayor construcción de infraestructura que la industria tecnológica ha visto desde el nacimiento de la nube. Pero a diferencia de la era de la nube, que fue en gran medida una revolución del software, la era de la IA se está convirtiendo rápidamente en algo completamente distinto.

Se está volviendo industrial.

Las empresas que compiten por liderar esta nueva era no se limitan a escribir código. Están asegurando energía, reservando capacidad de semiconductores, asegurando el suministro de memoria e implementando clústeres masivos diseñados para producir inteligencia a escala.

A este sistema lo llamamos fábrica de IA.

Y a medida que nos adentramos en GTC, la narrativa más profunda no se trata solo de la próxima arquitectura de GPU. Se trata de una carrera de infraestructura global (una guerra de trincheras en la cadena de suministro de un billón de dólares) para construir las fábricas que fabricarán inteligencia durante la próxima década.

Lo que es aún más interesante es que esta fábrica ya no se limita a centros de datos a hiperescala. Está comenzando a extenderse hacia lo que llamamos el borde hiperconvergente, donde la IA se acerca al lugar donde se crean los datos y se toman las decisiones.

Ese cambio, de una IA centralizada a una red distribuida de fábricas de inteligencia, puede definir en última instancia la siguiente fase de la industria.

La fábrica de IA: Inteligencia de fabricación

Durante los últimos años hemos estado describiendo un cambio en cómo se diseña la infraestructura informática.

Los centros de datos tradicionales almacenaban datos y ejecutaban aplicaciones.

La infraestructura de IA hace algo fundamentalmente diferente: fabrica inteligencia. Una fábrica de IA es un sistema integrado verticalmente diseñado para convertir entradas sin procesar (energía, silicio, memoria y datos) en salidas como modelos de IA, servicios de inferencia, sistemas de automatización y razonamiento.

Las empresas que lideran esta transformación incluyen Nvidia, Amazon.com Inc., Microsoft Corp., Google LLC, Meta Platforms Inc., entre otras. En conjunto, estas empresas están invirtiendo cientos de miles de millones de dólares en infraestructura de IA. Algunas de nuestras estimaciones sugieren que la siguiente fase de este ciclo podría acercarse a 1 billón de dólares en inversión de capital.

GTC mostrará las últimas piezas de esta arquitectura, pero la historia más importante se encuentra en lo más profundo de la cadena de suministro.

La paradoja de la apreciación de la GPU

Una de las dinámicas económicas más extrañas de este ciclo es lo que yo llamo la paradoja de la apreciación de la GPU. En los mercados tecnológicos tradicionales, el hardware se deprecia rápidamente.

Pero en la era de la IA, parece estar sucediendo lo contrario. Tomemos como ejemplo la GPU Nvidia H100, ampliamente implementada. En lugar de perder valor económico con el tiempo, la productividad de estos chips aumenta a medida que los modelos a los que sirven se vuelven más potentes.

A medida que mejoran los modelos de frontera, aumenta el valor generado por la computación que sirve a esos modelos. Esta es la razón por la que algunos laboratorios de IA están asegurando contratos de GPU de varios años a aproximadamente $2,40 por hora, muy por encima de los costos de construcción estimados.

La computación de IA se ha convertido en el recurso más limitado en la economía digital.Y eso está convirtiendo a las GPU en algo más cercano a los activos de capital productivo que el hardware de tecnología de la información tradicional.

La principal restricción: memoria

Las GPU pueden aparecer en los titulares en GTC, pero el verdadero cuello de botella en la fábrica de IA podría ser la memoria.

Los sistemas de IA modernos dependen en gran medida del razonamiento de contexto largo, lo que significa que los modelos pueden procesar enormes secuencias de texto, código y datos multimodales.

HBM es físicamente caro:

  • Consume de tres a cuatro veces más área de oblea que la memoria dinámica de acceso aleatorio estándar o DRAM.
  • Requiere técnicas de empaquetado avanzadas.
  • Compite directamente con las cadenas de suministro de electrónica de consumo.

Nuestros datos sugieren que para 2026, hasta el 30% de los gastos de capital del hiperescalador podrían destinarse únicamente a la memoria (redoble de tambores: espere todos los aumentos de precios de los sistemas).

Este cambio ya está remodelando la asignación de semiconductores en toda la industria, y el suministro de memoria se prioriza cada vez más para la infraestructura de IA.

Una de las limitaciones clave que estamos observando de cerca es la capacidad de fabricación de semiconductores.

Los aceleradores de centros de datos ahora están consumiendo una proporción cada vez mayor de la capacidad de fabricación de TSMC. Proveedores como NVIDIA (GPU), Broadcom (TPU y silicio de IA personalizado) y otros se están comprometiendo a un crecimiento de volumen mucho más agresivo que los diseñadores de chips de consumo tradicionales.

A alto nivel, existen dos limitaciones importantes en el proceso de fabricación de semiconductores que son importantes para la infraestructura de IA:

1. Capacidad inicial: la etapa de fabricación de obleas, donde los nodos de proceso lógico avanzado producen el silicio y los circuitos lógicos en las obleas.

2. Capacidad de back-end: a veces denominada gama media, donde tecnologías de empaquetado avanzadas como CoWoS (Chip-on-Wafer-on-Substrate) integran los chips con memoria de alto ancho de banda (HBM), sustratos y otros componentes para crear los paquetes de aceleradores finales.

Los fabricantes como TSMC tienen que equilibrar cuidadosamente ambas etapas del proceso. El año pasado, la etapa de empaquetado final, especialmente CoWoS, fue el mayor cuello de botella. Si bien sigue siendo estricta, la restricción se está desplazando cada vez más hacia la capacidad de fabricación de obleas iniciales.

El resultado final: la demanda de IA se está disparando, pero la producción de silicio tiene dificultades para mantener el ritmo.

El techo de litografía

Para comprender el límite máximo del escalamiento de la IA, debes ir aún más lejos.

El verdadero guardián del ecosistema de semiconductores es ASML Holding NV, el fabricante holandés de máquinas de litografía ultravioleta extrema. Estas herramientas son necesarias para producir los chips más avanzados.

Cada máquina cuesta más de 350 millones de dólares, contiene cientos de miles de componentes y depende de una cadena de suministro de miles de proveedores especializados. Más importante aún, la producción es limitada. ASML puede fabricar aproximadamente entre 70 y 100 herramientas ultravioleta extrema por año hasta el final de la década.

Esa producción efectivamente limita la rapidez con la que el mundo puede expandir la producción de semiconductores avanzados. Puede innovar el software a una velocidad exponencial. Pero no es fácil escalar los sistemas de fabricación industrial que producen el silicio.

Poder: La restricción de pagar por jugar

Otro insumo clave para la fábrica de IA es la energía. Los clusters de IA de vanguardia ahora requieren enormes cantidades de electricidad, a menudo medidas en gigavatios. Sin embargo, el poder no es necesariamente un límite de escala estricto.

Es un problema de costos.Para evitar las restricciones de la red y los cronogramas de permisos de varios años, los hiperescaladores y los laboratorios de inteligencia artificial están implementando cada vez más sistemas de energía detrás del medidor.Estos incluyen turbinas de gas natural, microrredes modulares, celdas de combustible y módulos de centros de datos construidos en fábrica.

Incluso si los costos de energía aumentan, la economía aún favorece la implementación temprana porque el valor marginal de los modelos de IA de vanguardia es muy alto.

El surgimiento del borde hiperconvergente

Mientras la fábrica de IA a hiperescala acapara los titulares, se está produciendo otro cambio importante en el ámbito de la infraestructura. La fábrica de IA se está expandiendo hasta el límite.

Las empresas están implementando cada vez más sistemas de IA localizados para respaldar la toma de decisiones en tiempo real en entornos como: fábricas, hospitales, tiendas minoristas, centros logísticos y ciudades inteligentes.

Aquí es donde el borde hiperconvergente entra en escena. Las plataformas de borde hiperconvergentes colapsan las redes, la computación, el almacenamiento, la seguridad y la inferencia de IA en una infraestructura de borde unificada.

En lugar de dispositivos aislados, las organizaciones implementan mini fábricas de IA distribuidas capaces de ejecutar inferencias localizadas y sincronizarse con clústeres de IA centralizados. En esta arquitectura, las fábricas de IA a hiperescala entrenan modelos, mientras que los sistemas de borde hiperconvergentes operan esos modelos en el mundo real.

Este modelo distribuido de producción de inteligencia probablemente será un tema importante que surja de las discusiones del GTC.

La soberanía de la IA y la dimensión geopolítica

La carrera por la infraestructura de IA también se está volviendo profundamente geopolítica.

Los gobiernos de todo el mundo ven cada vez más la capacidad de IA como una cuestión de soberanía nacional. El control sobre la infraestructura de IA significa control sobre la competitividad económica, la automatización industrial, los sistemas de defensa y la capacidad de innovación nacional.

Estados Unidos actualmente lidera en varias áreas clave, incluidos los ecosistemas de software de inteligencia artificial y el acceso a la fabricación avanzada a través de socios como Taiwan Semiconductor Manufacturing Co. Pero otras regiones se están moviendo rápidamente.

China está buscando una integración vertical completa a través de empresas como Huawei, invirtiendo fuertemente en diseño de chips nacionales, producción de memoria e infraestructura soberana de IA. Las naciones de Europa y Medio Oriente también están invirtiendo en capacidad informática soberana para garantizar que no dependan de proveedores de nube extranjeros.

En muchos sentidos, las fábricas de IA se están convirtiendo en la infraestructura estratégica de la era digital, similar a las redes de energía o las redes de telecomunicaciones.

De la industria del software a la infraestructura industrial

Quizás el mayor error sobre el auge de la IA es cómo se categoriza. Muchos inversores todavía tratan a las empresas de IA como empresas de software tradicionales.

Pero las empresas que lideran la construcción de AI Factory se parecen cada vez más a operadores industriales pesados. Están implementando centros de datos a escala de gigavatios, cadenas de suministro globales de semiconductores, programas masivos de inversión de capital y pilas de infraestructura integradas verticalmente

Este no es simplemente otro ciclo de software.Es el surgimiento de la producción de inteligencia a escala industrial.

Qué ver en GTC

A medida que nos acercamos a otra Nvidia GTC, es fácil quedar atrapado en los anuncios de productos como la próxima GPU, el próximo modelo, el próximo marco de software.

Pero la historia más importante que se desarrolla bajo la superficie es sobre el poder de la infraestructura.

Las empresas que ganen en los próximos cuatro o cinco años en IA no serán simplemente las que tengan los mejores algoritmos. Ellos serán los que aseguraron la cadena de suministro desde el principio:Los que están encerrados en la capacidad de litografía. Los que reservaron las obleas de memoria. Los que construyeron las centrales eléctricas.Los que ampliaron sus fábricas de IA hasta el borde.

Porque el futuro de la IA ya no se trata solo de entrenar modelos más grandes.Se trata de construir el sistema global que los ejecuta.

La fábrica de IA se está convirtiendo rápidamente en la columna vertebral industrial de la economía digital: una red distribuida de clústeres a hiperescala e infraestructura de borde hiperconvergente que en conjunto producen y operan inteligencia.

Y si la última década perteneció a la nube, la próxima década pertenecerá a las empresas que construyen y controlan estas fábricas.

Porque la carrera para construir la fábrica de IA apenas comienza.

Imagen:

Newsletter

Recibe las noticias mas importantes directamente en tu correo.

Espacio publicitario