Oracle y AMD anunciaron una expansión significativa de su colaboración tecnológica para ofrecer infraestructura de inteligencia artificial (IA) a escala masiva. A partir del tercer trimestre de 2026, Oracle se convertirá en el primer proveedor de nube pública en desplegar un supercluster de IA con 50.000 GPU AMD Instinct MI450, en una asociación que promete redefinir el rendimiento y la eficiencia energética de los centros de datos de nueva generación.
El acuerdo, presentado durante el evento Oracle AI World 2025 en Las Vegas, refuerza una cooperación que ha evolucionado durante varios años e incluye la integración de GPU AMD Instinct MI300X y MI355X en Oracle Cloud Infrastructure (OCI). La nueva fase incorpora la arquitectura “Helios”, que combina GPU AMD Instinct MI450, CPU AMD EPYC “Venice” y tecnología de red avanzada AMD Pensando “Vulcano”, con el objetivo de maximizar el rendimiento, la escalabilidad y la eficiencia energética en cargas de trabajo de IA a gran escala.

Un supercluster diseñado para la era zettascale
El supercluster impulsado por AMD ofrecerá una infraestructura totalmente optimizada para entrenamiento y ejecución de modelos de gran escala, incluyendo arquitecturas multimillonarias de parámetros. Cada GPU MI450 integrará 432 GB de memoria HBM4 y un ancho de banda de 20 TB/s, permitiendo procesar modelos un 50% más grandes que la generación anterior, completamente en memoria.
Entre sus principales innovaciones destacan:
Diseño “Helios” líquido-refrigerado, con racks de 72 GPU, interconectados mediante UALink y UALoE, estándares abiertos para comunicación directa entre aceleradores.
Conectividad Ethernet de 800 Gbps con tarjetas AMD Pensando “Vulcano”, optimizadas para reducir la latencia y mejorar la comunicación entre nodos.
Virtualización avanzada y multi-tenancy seguro, con particionamiento de GPU y pods que optimizan el uso de recursos en entornos compartidos.
Compatibilidad con el stack de software abierto AMD ROCm™, que facilita la migración de cargas de trabajo de IA y HPC, garantizando interoperabilidad con frameworks como PyTorch y TensorFlow.
El supercluster formará parte del OCI Zettascale, una infraestructura que puede escalar hasta 131.072 GPU y que busca posicionar a Oracle como uno de los principales habilitadores globales de cómputo de alto rendimiento y AI-as-a-Service.
Fuente: Oracle

