Image default
LanzamientosReviewsTarjetas de Video

Review GIGABYTE RTX 4070 Ti AERO 12GB OC [GV-N407TAERO OC-12GD]

Hoy es el día que NVIDIA da a conocer la GPU dirigida a la gama media alta, la GeForce RTX 4070 Ti, una tarjeta que casi ve la luz con otro nombre, pero que NVIDIA decidió hacer un stop y renombrar a lo que conocemos ahora.

Basada en la GPU AD104, esta posee una cantidad de CUDA cores significativamente menor que la RTX 4090 (53%), además posee un 21% menos CUDA cores que la RTX 4080, por lo que podemos intuir donde se posicionaría este producto.

Finalmente NVIDIA decidió no solamente renombrar esta tarjeta, sino que además le puso presión a su contrincante AMD, al rebajar el precio MSRP original de $899 USD a $799 USD, situándola en el papel como una mejor opción ante la Radeon RX 7900 XT ($899 USD MSRP).

Al igual que en otra ocasiones, NVIDIA decidió no lanzar un modelo Founders Edition, y dejarle el trabajo a sus partners, en esta oportunidad, tenemos en nuestro poder, gracias a los amigos de Gigabyte, la GeForce RTX 4070 Ti AERO 12GB OC.

Arquitectura.

La arquitectura de gráficos de Ada anuncia la tercera generación de la tecnología NVIDIA RTX, un esfuerzo por aumentar el realismo en las imágenes de los juegos al aprovechar el trazado de rayos en tiempo real, sin la enorme cantidad de potencia informática necesaria para dibujar gráficos 3D con trazado de rayos puro. Esto se logra mediante la combinación de gráficos de trama convencionales con elementos de trazado de rayos, como reflejos, iluminación e iluminación global, por nombrar algunos.

La tercera generación de RTX anuncia el nuevo núcleo CUDA «Ada» de IPC más alto, el núcleo RT de tercera generación, el núcleo Tensor de cuarta generación y el nuevo procesador de flujo óptico, un componente que juega un papel clave en la generación de nuevos marcos sin involucrar los gráficos principales de la GPU. canalización de representación.

La arquitectura NVIDIA Ada es un gran salto en rendimiento. Se ha invertido mucho en convertirla en la arquitectura de GPU más rápida y avanzada del mundo jamás construida. La RTX 4070 Ti está fabricada en el proceso personalizado 4N de TSMC y contiene 35.800 millones de transistores y más de 7680 núcleos CUDA, la arquitectura NVIDIA Ada cuenta con un multiprocesador (SM) de transmisión mejorado, memoria GDDR6X súper rápida, núcleos Ray Tracing de tercera generación para un tazado de rayos mejorado.

Aceleración de hardware de seguimiento, Tensor Cores de cuarta generación para un mayor rendimiento de inferencia de IA, codificadores de octava generación compatibles con AV1 y mejoras de DLSS que permiten una alta velocidad de fotogramas, juegos de alta resolución en configuraciones ultra con trazado de rayos habilitado en el juego más reciente

La jerarquía de componentes esenciales es similar a las generaciones anteriores de GPU NVIDIA. El silicio AD104 presenta la increíble cantidad de 5 clústeres de procesamiento de gráficos (GPC), cada uno de ellos tiene toda la maquinaria de representación de gráficos y SIMD, y es una GPU pequeña por derecho propio. Cada GPC comparte un motor ráster (componentes de procesamiento de geometría) y dos particiones ROP (cada una con ocho unidades ROP).

El GPC del AD104 contiene seis clústeres de procesamiento de texturas (TPC), la principal maquinaria de procesamiento de números. Cada uno de estos tiene dos Streaming Multiprocessors (SM) y una unidad Polymorph. Cada SM contiene 128 núcleos CUDA en cuatro particiones. La mitad de estos núcleos CUDA son puros FP32; mientras que la otra mitad es capaz de FP32 o INT32.

El SM retiene la capacidad de procesamiento matemático FP32+INT32 concurrente. El SM también contiene un núcleo RT de tercera generación, cuatro núcleos Tensor de cuarta generación, algo de memoria caché y cuatro TMU. Hay 12 SM por GPC, por lo que 1536 núcleos CUDA, 48 núcleos Tensor y 12 núcleos RT; por GPC. Por lo tanto, 5 GPC suman 7680 núcleos CUDA, 240 núcleos Tensor y 60 núcleos RT. Cada GPC contribuye con 16 ROP, por lo que hay 80 ROP gigantes en el silicio. Un caché L2 de 48 MB sirve como plaza central para los diversos GPC, controladores de memoria y la interfaz de host PCIe, para intercambiar datos.

El núcleo RT de tercera generación acelera los aspectos más intensivos en matemáticas del trazado de rayos en tiempo real, incluido el recorrido BVH. El motor de micromalla desplazada es una función revolucionaria introducida con el nuevo núcleo RT de tercera generación, que acelera la función de micromalla desplazada. Así como los sombreadores de malla y el teselado han tenido un profundo impacto en la mejora del rendimiento con geometría ráster compleja, lo que permite a los desarrolladores de juegos aumentar significativamente la complejidad geométrica; Los DMM son un método para reducir la complejidad de la estructura de datos de la jerarquía de volumen límite (BVH), que se utiliza para determinar dónde un rayo golpea la geometría.

Anteriormente, el BVH tenía que capturar hasta los detalles más pequeños para determinar correctamente el punto de intersección. La arquitectura de trazado de rayos de Ada recibe una gran mejora en el rendimiento gracias a Shader Execution Reordering (SER), una característica definida por software que requiere el conocimiento de los motores de juego para ayudar a la GPU a reorganizar y optimizar los subprocesos de trabajo asociados con el trazado de rayos.

El BVH ahora no necesita tener datos para cada triángulo en un objeto, pero puede representar objetos con geometría compleja como una malla gruesa de triángulos base, lo que simplifica enormemente la estructura de datos de BVH. Un BVH más simple significa menos memoria consumida y ayuda a reducir en gran medida la carga de la CPU de trazado de rayos, porque la CPU solo tiene que generar una estructura más pequeña. Con los núcleos RT «Amperio» y «Turing» más antiguos, cada triángulo en un objeto tenía que ser muestreado a gran altura, por lo que el núcleo RT podía calcular con precisión la intersección del rayo para cada triángulo. Con Ada, el BVH más simple, además de los mapas de desplazamiento, se pueden enviar al núcleo RT, que ahora puede determinar el punto de impacto exacto por sí mismo. NVIDIA ha visto una compresión de 11: 1 a 28: 1 en el recuento total de triángulos. Esto reduce los tiempos de compilación de BVH en 7,6x a más de 15x, en comparación con el núcleo RT más antiguo; y reduciendo su huella de almacenamiento entre 6,5 y 20 veces. Los DMM podrían reducir la utilización del ancho de banda del disco y la memoria, la utilización del bus PCIe, así como también reducir la utilización de la CPU. NVIDIA trabajó con Simplygon y Adobe para agregar compatibilidad con DMM para sus cadenas de herramientas.

Opacity Micro Meshes (OMM) es una nueva característica introducida con Ada para mejorar el rendimiento de la rasterización, particularmente con objetos que tienen alfa (datos de transparencia). La mayoría de los objetos de baja prioridad en una escena 3D, como las hojas de un árbol, son esencialmente rectángulos con texturas en las hojas donde la transparencia (alfa) crea la forma de la hoja. Los núcleos RT tienen dificultades para cruzar los rayos con tales objetos, porque en realidad no tienen la forma que parecen (en realidad son solo rectángulos con texturas que le dan la ilusión de forma. Los núcleos RT de la generación anterior tenían que tener múltiples interacciones con la etapa de renderizado para descubrir la forma de un objeto transparente, porque no pudieron probar alfa por sí mismos.

Esto se ha resuelto mediante el uso de OMM. Así como los DMM simplifican la geometría al crear mallas de microtriángulos; Los OMM crean mallas de texturas rectangulares que se alinean con partes de la textura que no son alfa, por lo que el núcleo RT tiene una mejor comprensión de la geometría del objeto y puede calcular correctamente las intersecciones de los rayos. Esto también tiene un impacto significativo en el rendimiento del sombreado en aplicaciones que no son RT. Las aplicaciones prácticas de los OMM no son solo objetos de baja prioridad como la vegetación, sino también duendes de humo y niebla localizada.

Tradicionalmente, había mucho sobredibujado para tales efectos, porque superponían múltiples texturas una encima de la otra, que los sombreadores tenían que procesar por completo. Ahora solo se ejecutan los píxeles no opacos: los OMM proporcionan un 30 % de aceleración con las tasas de llenado del búfer de gráficos y un 10 % de impacto en las tasas de fotogramas.

DLSS 3 presenta una nueva característica revolucionaria que promete duplicar la velocidad de cuadros con una calidad comparable, se llama generación de cuadros AI. Si bien tiene todas las funciones de DLSS 2 y su superresolución de IA (ampliación de un cuadro de menor resolución a resolución nativa con una pérdida de calidad mínima); DLSS 3 puede generar cuadros completos simplemente usando IA, sin involucrar la canalización de representación de gráficos.

Por lo tanto, cada cuadro alterno con DLSS 3 es generado por IA, sin ser una réplica del cuadro renderizado anterior. Esto solo es posible en la arquitectura de gráficos Ada, debido a un componente de hardware llamado acelerador de flujo óptico (OFA), que ayuda a predecir cómo podría verse el próximo cuadro, creando lo que NVIDIA llama un campo de flujo óptico.

OFA garantiza que el algoritmo DLSS 3 no se confunda con objetos estáticos en una escena 3D que cambia rápidamente (como un simulador de carrera). El proceso depende en gran medida de la mejora del rendimiento introducida por el formato matemático FP8 del núcleo Tensor de cuarta generación. Un tercer ingrediente clave de DLSS 3 es Reflex. Al reducir la cola de renderizado a cero, Reflex juega un papel vital para garantizar que los tiempos de cuadro con DLSS 3 estén en un nivel aceptable, y que la cola de renderizado no confunda al escalador. Una combinación de OFA y el núcleo Tensor de 4.ª generación es la razón por la que se requiere la arquitectura Ada para usar DLSS 3 y por la que no funcionará en arquitecturas más antiguas.

Especificaciones.

EspecificacionesNVIDIA RTX 4090 Founders EditionNVIDIA RTX 4080 Founders EditionNVIDIA RTX 4070TiGIGABYTE RTX 4070Ti AERO OCAMD Radeon RX 7900XTXAMD Radeon RX 7900XTNVIDIA RTX 3090 Ti
Proceso de Fabricación4 nm4 nm4 nm4 nm5 nm5 nm8 nm
GPUAD102-300-A1AD103-300-A1 AD104-400-A1AD104-400-A1Navi 31 XTXNavi 31 XTGA102-350-A1
Shaders163849728 768076806144537610752
ROPs1761128080192192112
Texture Units512 304240240384336336
Tensor Cores512304240240--336
RT Cores /
Ray Accelerators
128766060968484
Core Clock2235 MHz2205 MHz2310 MHz2310 MHz1900 MHz1500 MHz1560 MHz
Boost Clock2520 MHz2505 MHz2610 MHz2640 MHz2499 MHz2394 MHz1860 MHz
Frecuencia de Memoria1313 MHz1400 MHz 1313 MHz1313 MHz2500 MHz2500 MHz1313 MHz
Memoria24 GB, GDDR6X, 384-bit16 GB, GDDR6X, 256 bit 12 GB, GDDR6X, 192 bit12 GB, GDDR6X, 192 bit24 GB, GDDR6, 384 bit20 GB, GDDR6, 320 bit24 GB, GDDR6X, 384 bit
Conectores1x 16-pin1x 16-pin1x 16-pin1x 16-pin2x 8-pin2x 8-pin1x 16-pin
TDP450 W320 W285 W285 W355 W315 W450 W
Precio$1600 MSRP$1200 MSRP$799 MSRP$999 MSRP$899 MSRP$1999 MSRP

Revisemos lo que nos indica GPU-Z

 

Primera Mirada.

 

Como buen modelo AERO nos encontramos con un empaque blanco, destacando la presencia de DLSS 3 y Ray Tracing, principalmente como parte de las tecnologías que entrega la RTX 4070 Ti.

Como características que integra GIGABYTE en este modelo AERO encontramos un sistema de refrigeración WindForce, RGB FUSION y protector de metal posteRior.

El empaque interno nos muestra un sobre donde estan la garantia, etc.

Pasando al empaque interno nos encontramos con la espuma protectora y en esta la tarjeta de video muy bien acomodada, junto a esta algunos accesorios.

Acomopañada de algunos bracket para sostener la tarjeta de video en el gabinete, también encontramos los manuales y tu conector de energía de 16 pines a 2×8 Pines PCIe.

La tarjeta Gigabyte AERO RTX 4070 Ti OC, la evolución de la familia VISION, con diseño y colores blancos.

En el borde externo justo en su centro podemos encontrar el conector de 16 pines, quizás un sector algo complicado para quienes no gustan de tener cables a la vista.

El disipador de este ejemplar de RXT 4070 Ti es lo suficientemente grande y eficiente para un PCB tan pequeño.

Por posterior la tarjeta de video posee un protector de metal, dejando un gran espacio en este para la zona que no tiene presente el PCB, de esta forma genera un flujo de aire grande y permite mantener la temperatura a rayas.

Las salidas de video consisten en 3x Display Port y 1x HDMI. Se logra apreciar que esta tarjeta utiliza 2.5 slots de nuestro gabinete.

El PCB tal como adelantamos antes posee dimensiones mucho más reducidas a las del sistema de refrigeración, dejando claro que al igual que los modelos superiores, gran parte del diseño y espacio utilizado es para tener un gran sistema de refrigeración.

Las memorias están fabricadas por Micron con su modelo 2HU47D8BZC de 2GB cada una.

Un controlador holtek HT32F52352 también se encuentra presente, este es un micro controlador basado en un SoC ARM Cortex M0+ de 32bits.

Sin el protector posterior podemos ver que este no entrega refrigeración y que se limita a proteger la tarjeta de video.

El largo del PCB es de aenas 17.3cms

La solución de refrigeración cuenta con una zona de cobre directo al GPU, la cual posee una cámara de vapor, de la cual traspasan 6 heatpipes de cobre, que llegan hasta el extremo del disipador.

Montada en una placa madre ATX podemos ver como la longitud de la tarjeta de video sobre pasa el ancho de la placa madre, por lo que podemos entender que es una tarjeta de video que necesitará de un gabinete de gran espacio.

Utilizando el adaptador de 2x 8-pines a 16pines que viene integrado, energizamos la placa de video, y comenzamos nuestras pruebas.

Plataforma de Pruebas y Metodología.

Plataforma de Pruebas
Procesador- AMD Ryzen 9 7950X

Placa Madre- ASUS ROG CROSSHAIR X670E HERO
Memoria Corsair Dominator Platinum RGB 6000 2x16GB EXPO
Refrigeración- Thermaltake Water 3.0 Riing RGB 360
Tarjeta de Video- GIGABYTE RTX 4070Ti AERO 12GB OC
Fuente de Poder- ASUS ROG THOR II 1000W
Almacenamiento- Corsair MP600 PRO 1TB M.2 PCIe 4.0
Monitor- ASUS MG28UQ
  • Sistema operativo Windows 10 Pro x64 [22H2].
  • Las pruebas fueron realizadas en un ambiente con temperatura de 25ºC aproximadamente.
  • La plataforma fue utilizada sin gabinete.
  • Driver de Video utilizado: AMD Adrenalin Edition 22.40.00.57 Beta5, NVIDIA Game Ready 527.62 WQHL
  • Las resoluciones de las pruebas sintéticas son las predeterminadas por cada uno de los benchmarks.
  • Configuraciones ultra o más alta para cada título de juego.

Pruebas Rasterizado

Estas pruebas son para ver la potencia bruta de la GPU. Por su precio y especificaciones, podemos situar a esta Gigabyte AERO RTX 4070 Ti OC contra la Radeon RX 7900 XT.

Unos juegos y pruebas arriba, otros abajo, otros similares. Pero las veces que la Radeon RX 7900 XT supera a la RTX 4070 Ti son mas, por lo que podemos darle este apartado de Rasterizado a la tarjeta de AMD.

Pruebas Ray Tracing.

En esta sección, esperamos que la RTX 4070 Ti tenga un mejor desempeño que las AMD, y por mucho.

Sin utilizar ayuda de DLSS o FSR, se apreció que la RTX 4070 Ti de Gigabyte tuvo un desempeño mejor que su contraparte de AMD, quizás no por un márgen muy superior, pero a fin de cuentas, fueron mas FPS en Raytracing que la otra.

Pruebas Reescalado (DLSS / FSR).

Ahora si que utilizamos las herramientas de reescalado tanto para NVIDIA como para AMD.

Se aprecia un buen incremento en los FPS a la hora de activar la herramienta DLSS.

Overclocking.

Es hora de ver hasta donde podemos sacarle rendimiento extra a esta Gigabyte GeForce RTX 4070 Ti AERO OC.

Moviendo un poco las frecuencias, conseguimos subir 80MHz en el GPU, y casi 40MHz en las memorias. Con este leve incremento, veamos en cuanto rendimiento se traduce en la realidad.

A pesar de ser un leve aumento en frecuencias, este se notó a la hora del rendimiento final en las aplicaciones o juegos. Pero al haber un aumento de frecuencias, este por lo general va de la mano con el consumo de energía, y/o con un aumento de la temperatura.

Consumo y Temperatura.

La arquitectura Ada Lovelace de NVIDIA ha demostrado ser una excelente gestionadora de energía, a la hora de estar en modo «IDLE», dejando de lado la todopoderosa RTX 4090 que llega a consumir casi 450W, esta RTX 4070 Ti no sobrepasó su propio TGP y consumió un máximo de 255W con overclock, lo cual la sitúa en una buenísima posición dentro del Rendimiento/Watt.

El sistema de refrigeración de esta Gigabyte AERO mantiene las temperaturas muy bien controladas, inclusive bajo full carga. Hay que mencionar, que el bajo consumo de la tarjeta ayuda mucho en este sentido.

Ruido.

Podemos tener un sistema de refrigeración muy robusto y potente, pero si se basa en tener los ventiladores sonando como turbina de avión, tampoco es algo muy placentero. Para ello utilizamos nuestro sonómetro y registramos el nivel de dBA que se sienten a 50cms de distancia.

Con una velocidad que rondaba los 65% a 72% en modo AUTO y generando con ello menos de 60 dBA podemos ver que los ventiladores mantienen una generación de ruido moderada, sin intervenir en gran medida el ruido habitual de una plataforma, si bien esto es posible configurar a través de la suite de Gigabyte, es una generación de ruido más que aceptable y desde una experiencia global de la plataforma el ruido generado en automático tiende a mezclarse con otros ruidos, como los ventiladores del radiador del AIO.

Incluso configurando los ventiladores al 100%, estos generan un ruido mucho menor a la mayoría de las tarjetas que hemos revisado previamente con modelos referenciales.

Conclusión.

La presencia de la NVIDIA RTX 4070 Ti en sus filas, pone a NVIDIA con un modelo muy atractivo en lo que se refiere a costo/rendimiento, con un precio de lanzamiento de $799 es el modelo más economico de última generación.

Si bien desde este punto NVIDIA comienza a dar los primeros pasos dentro de lo que es la gama media/alta, es posible ver desde aquí que el contenido en 4K o 2160p es totalmente jugable, contenido que en la generación pasada era algo más propio de los modelos altos que de gamas más bajas sin utilizar tecnicas de reescalado.

Esta opción de NVIDIA también se posiciona muy bien en lo que se refiere a rendimiento por watts, y que con los 249W que desarrollar a maxima carga la deja como uno de los modelos de nueva generación más eficiente. El rendimiento en general de este modelo la sitúa muy cerca a la Radeon RX 7900 XT en rasterizado y en lo que es Ray Tracing por sobre lo que actualmente ofrece AMD y más aún utilizando tecnologías de reescalado como DLSS.

Lamentablemente, y decimos lamentablemente, NVIDIA decidió dotar a la RTX 4070 Ti con un ancho de banda para las memorias de 192-bits, por lo cual le limita en varios casos, dejandola por debajo de la oferta de AMD en estas situaciones. Esto se puede compensar realizando overclocking a las memorias, pero es algo que de todas formas se pudo haber adoptado mejor por parte de NVIDIA.

Desde el lado de GIGABYTE logramos ver una excelente respuesta de este partner, un sistema de refrigeración muy silencioso y con un nivel de temperatura muy bajo gracias a la combinación del robusto disipador y sus 3 ventiladores muy eficientes, el tono blanco además acompaña con una excelente estetica como parte de la línea AERO que apunta a un segmento como diseñadores por ejemplo, los cuales buscan sienten necesidad por estas características.

De las características que sigue llevando esta serie de NVIDIA RTX 40 existen 2 que en cierto modo son algo molestas, por un lado el gran tamaño de los sistema de refrigeración y los conectores de 12 pines para este modelo. Al ver cada modelo de esta serie es posible encontrar un PCB de dimensiones muy acotadas, y una solución de refrigeración que excede los estandares, esto claramente limitará a los usuarios que posee un gabinete mid tower por ejemplo, lo que los obligará a ir por gabinete de tamaños full tower priorizando la profundidad de este. Por otro lado el conector sigue siendo algo poco estetico y que complica el orden de los cables.

Terminando podemos decir que este modelo de NVIDIA viene dejar el panorama más complicado para el lado rojo, si bien no es una opción que le saque ventaja por completo de las opciones de Radeon RX 7000  hoy en día, si podemos ver que es capaz de posicionarse muy bien en lo que es costo/rendimiento, relación que los usuarios hoy en día buscan más que cualquier otro.

Posts relacionados

‘Black Myth: Wukong’ y ‘NARAKA: BLADEPOINT’ se lanzan con trazado completo de rayos y DLSS 3.5

Mario Rübke

Regresa a clases con lo mejor de la tecnología de NVIDIA

Mario Rübke

Review Asus ROG Strix Scar 18 (2023): Back to School

Mario Rübke