AWS lanza los Trainium3 UltraServers: más rendimiento y menor costo para entrenar IA

Amazon Web Services anunció la disponibilidad general de los Amazon EC2 Trn3 UltraServers, su nueva infraestructura para entrenamiento e inferencia de inteligencia artificial, impulsada por el chip Trainium3 fabricado en proceso de 3 nm. La propuesta busca acelerar el desarrollo de modelos de gran escala y reducir significativamente los costos operativos.

Los Trainium3 UltraServers ofrecen hasta 4,4 veces más rendimiento de cómputo, 4 veces mayor eficiencia energética y casi 4 veces más ancho de banda de memoria frente a la generación anterior. Cada sistema puede integrar hasta 144 chips Trainium3, alcanzando 362 FP8 PFLOPs, con una latencia hasta 4 veces menor, lo que permite entrenar modelos más grandes en menos tiempo y servir inferencia a escala con mayor eficiencia.

Para eliminar los cuellos de botella de comunicación, AWS diseñó una arquitectura de red específica que incluye NeuronSwitch-v1, con el doble de ancho de banda interno, y una Neuron Fabric mejorada que reduce la latencia entre chips a menos de 10 microsegundos. Esta integración resulta clave para cargas de trabajo avanzadas como modelos de mezcla de expertos, sistemas agénticos y aplicaciones de IA en tiempo real.

Los primeros resultados ya son visibles. Clientes como Anthropic, Karakuri, Metagenomics, Neto.ai, Ricoh y Splashmusic reportan reducciones de hasta 50% en costos de entrenamiento e inferencia, mientras que Decart logra video generativo en tiempo real con una inferencia 4 veces más rápida a la mitad del costo de las GPU. Además, Amazon Bedrock ya ejecuta cargas de trabajo de producción sobre Trainium3.

Con los EC2 UltraClusters 3.0, AWS puede escalar a miles de UltraServers con hasta 1 millón de chips Trainium, habilitando el entrenamiento de modelos fundacionales y la inferencia para millones de usuarios concurrentes. AWS también confirmó que ya trabaja en Trainium4, que promete un salto adicional en rendimiento y eficiencia.

Review AMD Ryzen 7 7700X3D: el eslabón que…

Review Intel Core Ultra 7 270K PLUS y…

Review | TeamGroup NV5000 1TB: un SSD PCIe…

Review Sonos Play: el equilibrio perfecto entre sonido,…

Review Noctua NH-D15 G2 chromax.black [Air-Cooling]

Lenovo fortalece la supercomputación del NLHPC para impulsar…

Xbox lleva la retrocompatibilidad a PC con cuatro…

OpenAI y Hugging Face investigan un inédito incidente…

AMD y Anthropic sellan alianza estratégica para desplegar…

Cómo elegir una barra de sonido para mejorar…

La infraestructura invisible de la IA: el desafío…

48 años del Intel 8086: el procesador que…

Chile quiere liderar la revolución de la IA,…

IA agéntica: cinco formas en que las empresas…

Kingston KCP432SD8/16: cómo un segundo módulo DDR4 transformó…

AWS lanza los Trainium3 UltraServers: más rendimiento y menor costo para entrenar IA

Lenovo fortalece la supercomputación del NLHPC para impulsar la investigación científica en...

Xbox lleva la retrocompatibilidad a PC con cuatro clásicos de la Xbox...

OpenAI y Hugging Face investigan un inédito incidente de ciberseguridad durante pruebas...

AWS lanza los Trainium3 UltraServers: más rendimiento y menor costo para entrenar IA

Posts relacionados