Magister CTO
IA

NVIDIA Blackwell lidera con un 78 % de margen en inferencia IA

NVIDIA consolida su liderazgo en inferencia de IA y rentabilidad según Morgan Stanley: AMD, Google, AWS y Huawei quedan rezagados

Un nuevo informe de Morgan Stanley Research ha arrojado luz sobre la realidad financiera tras el boom de la inteligencia artificial. En concreto, el rendimiento de la inferencia de IA convierte a NVIDIA en el líder indiscutible del sector, mientras que AMD afronta unas pérdidas preocupantes a pesar de sus notables inversiones.


La rentabilidad real de la inferencia en IA: el modelo “100MW AI Factory”

El estudio de Morgan Stanley introduce el modelo “100MW AI Factory”, un marco estándar para medir la eficiencia económica de un centro de datos dedicado a la inferencia de IA. Este modelo estandariza la evaluación sobre:

  • Consumo de 100 MW: equivalente a alrededor de 750 racks de servidores de alto rendimiento.
  • TCO (Coste Total de Propiedad): incluye hardware, infraestructura, electricidad y refrigeración.
  • Ingresos esperados: calculados a partir del procesamiento de tokens y el precio de mercado de las APIs, con una tasa de utilización del 70 % para reflejar escenarios realistas.

Este enfoque permite comparar de forma homogénea a los principales proveedores: NVIDIA, Google, AWS, Huawei y AMD.


NVIDIA Blackwell: márgenes operativos récord gracias al software

Según el informe, NVIDIA domina abrumadoramente el negocio de la inferencia gracias a su plataforma GB200 NVL72 Blackwell, que alcanza un 77,6 % de margen operativo y beneficios de hasta 3.500 millones de dólares en un escenario tipo.

Las claves del rendimiento de NVIDIA van más allá de la potencia del hardware:

  • Soporte para FP4: formato de precisión reducido especialmente eficiente en inferencia.
  • Ecosistema CUDA: maduro y ampliamente optimizado.
  • Actualizaciones periódicas (“fine wine”): que prolongan la vida útil y mejoran el rendimiento incluso en generaciones anteriores.

El dominio de NVIDIA reside, por tanto, en su ventaja de software y ecosistema, difícilmente replicable a corto plazo.


Google, AWS y Huawei: alternativas competitivas en la inferencia de IA

Aunque ninguna iguala la rentabilidad de NVIDIA, hay otros jugadores relevantes:

  • Google TPU v6e: 74,9 % de margen, apoyado por la integración hardware-cloud.
  • AWS Trn2 UltraServer: 62,5 %, confirmando la apuesta de Amazon por chips propios.
  • Huawei CloudMatrix 384: 47,9 %, destacando en el mercado asiático pese a las restricciones globales.

La tendencia indica que los proveedores capaces de integrar hardware propietario y ecosistemas cloud pueden competir en rentabilidad, aunque todavía lejos del monopolio de NVIDIA.


AMD: pérdidas sostenidas y retos estructurales

En contraste, AMD emerge como la gran decepción del informe:

  • MI355X: margen negativo del -28,2 %.
  • MI300X: aún peor, con un -64,0 %.

Pese a un TCO comparable al de NVIDIA GB200 (744 millones frente a 800 millones de dólares), AMD no consigue generar ingresos suficientes por inferencia para compensar la inversión. La falta de un ecosistema y optimizaciones competitivas lastra su rentabilidad y limita la monetización de sus aceleradoras.


La inferencia, clave para el futuro del mercado de IA

El informe de Morgan Stanley subraya que la inferencia llegará a suponer el 85 % de la demanda total de IA en los próximos años. Esta tendencia confirmará el liderazgo de NVIDIA, que ya prepara nuevas generaciones como Rubin, Rubin Ultra y Feynman, mientras que AMD intenta remontar con el futuro MI400.

Otros factores que definirán la competencia incluyen la estandarización de interconexiones entre GPUs (NVLink, UALink, Ethernet), clave para la eficiencia en grandes clústeres de cómputo.


La verdadera batalla está en los ecosistemas, no solo en el hardware

  • NVIDIA: refuerza su hegemonía gracias al control integral de su ecosistema (CUDA, actualizaciones y soporte prolongado).
  • Google y AWS: demuestran que los hiperescalares pueden ser rentables si integran hardware y servicios cloud propios.
  • Huawei: mantiene su posición en el mercado asiático pese a restricciones externas.
  • AMD: evidencia que sin una plataforma de software y optimización robusta, el negocio de inferencia no es sostenible, aunque la inversión en chips sea elevada.

El mercado se prepara para una guerra de ecosistemas en la que el software, la integración y la optimización marcan la diferencia competitiva.


Preguntas frecuentes sobre inferencia y rentabilidad en IA

¿Por qué la inferencia es más rentable que el entrenamiento?
La inferencia genera ingresos recurrentes al prestar servicio de forma continua una vez entrenado el modelo, a diferencia del entrenamiento, que es costoso y puntual.

¿Por qué es fundamental el TCO?
El Total Cost of Ownership incluye todos los costes asociados al hardware y su mantenimiento, repercutiendo directamente en la viabilidad económica del centro de datos.

¿Qué aporta FP4 en NVIDIA Blackwell?
Maximiza eficiencia y reduce costes energéticos, acelerando el proceso de inferencia y aumentando la densidad de procesamiento.

¿Hay alguna esperanza para AMD con MI400?
Sí, si logra fortalecer su entorno de software y optimizaciones, pero de momento la brecha frente a NVIDIA sigue siendo notable.

¿Por qué la interconexión es un factor clave?
Porque requiere conectar miles de GPUs para tareas masivas de IA, donde la tecnología de red y su eficiencia afectan directamente al coste y rendimiento global.

¿Puede el dominio de NVIDIA verse amenazado a corto plazo?
Es poco probable, aunque la integración vertical de hiperescalares y posibles cambios regulatorios pueden alterar el panorama a medio plazo.

Fuentes: WallStreetCN, Jukanlosreve.

Related Articles

IA híbrida: clave en la detección de delitos financieros

Diego Moreno

Optimiza LLM con datos no estructurados usando SageMaker y S3

Diego Moreno

Tenable detecta falla crítica en la seguridad de GPT-5 de OpenAI

Diego Moreno