Image default
AIEmpresasNoticiasTecnología

AWS lanza los Trainium3 UltraServers: más rendimiento y menor costo para entrenar IA

Amazon Web Services anunció la disponibilidad general de los Amazon EC2 Trn3 UltraServers, su nueva infraestructura para entrenamiento e inferencia de inteligencia artificial, impulsada por el chip Trainium3 fabricado en proceso de 3 nm. La propuesta busca acelerar el desarrollo de modelos de gran escala y reducir significativamente los costos operativos.

Los Trainium3 UltraServers ofrecen hasta 4,4 veces más rendimiento de cómputo, 4 veces mayor eficiencia energética y casi 4 veces más ancho de banda de memoria frente a la generación anterior. Cada sistema puede integrar hasta 144 chips Trainium3, alcanzando 362 FP8 PFLOPs, con una latencia hasta 4 veces menor, lo que permite entrenar modelos más grandes en menos tiempo y servir inferencia a escala con mayor eficiencia.

Para eliminar los cuellos de botella de comunicación, AWS diseñó una arquitectura de red específica que incluye NeuronSwitch-v1, con el doble de ancho de banda interno, y una Neuron Fabric mejorada que reduce la latencia entre chips a menos de 10 microsegundos. Esta integración resulta clave para cargas de trabajo avanzadas como modelos de mezcla de expertos, sistemas agénticos y aplicaciones de IA en tiempo real.

Los primeros resultados ya son visibles. Clientes como Anthropic, Karakuri, Metagenomics, Neto.ai, Ricoh y Splashmusic reportan reducciones de hasta 50% en costos de entrenamiento e inferencia, mientras que Decart logra video generativo en tiempo real con una inferencia 4 veces más rápida a la mitad del costo de las GPU. Además, Amazon Bedrock ya ejecuta cargas de trabajo de producción sobre Trainium3.

Con los EC2 UltraClusters 3.0, AWS puede escalar a miles de UltraServers con hasta 1 millón de chips Trainium, habilitando el entrenamiento de modelos fundacionales y la inferencia para millones de usuarios concurrentes. AWS también confirmó que ya trabaja en Trainium4, que promete un salto adicional en rendimiento y eficiencia.

Posts relacionados

Google acuerda millonario contrato con SpaceX para asegurar capacidad de IA: pagará US$920 millones mensuales

Mario Rübke

IA agéntica: cinco formas en que las empresas chilenas ya están transformando sus operaciones

Mario Rübke

Lenovo impulsará la Copa Mundial de la FIFA 2026 con inteligencia artificial y retransmisiones de baja latencia

Mario Rübke
Cargando.....