Image default
ReviewsTarjetas de Video

Review Gigabyte GeForce RTX 4090 Gaming OC 24G

La esperada serie de NVIDIA RTX 40 llegó con grande cambios y saltos de rendimiento impresionante, adicionalmente a esto también las dimensiones de estas tarjetas graficas y consumo han sido uno de los cambios más comentados entre los usuarios.

Estas características en la NVIDIA RTX 4090 poco usuales en tarjetas de video comienzan desde su modelo de referencia, por lo que desde los modelos personalizados de los ensambladores podríamos encontrar modelos sorprendetes, uno de estos es la propuesta que nos trae en esta ocasión GIGABYTE con su modelo RTX 4090 GAMING OC, una versión con 3 grandes ventiladores muy llamativos y un disipador robusto que contratará todas las miradas en la plataforma. Veamos como se comporta este monstruo de GIGABYTE.

Este modelo de GIGABYTE si bien no pertenece a su línea de gama alta AORUS, es una modelo que sin duda llama mucho la atención, y que entrega muchas tecnologías que la gama alta de GIGABYTE trae como parte de AORUS. Veamos algunas de las tecnologías que GIGABYTE suma abordo de esta RTX 4090.

Con un sistema de ventilación activo alternado, o sea que tenemos a los 2 ventiladores externos con una dirección y el ventilador central con dirección opuesta evitaría turbulencias en el aire que circula entre las laminas del disipador, de esta forma el aire fresco extraído del exterior viajaría a la zonas de alta temperatura en un modo más eficiente.

Complementando la acción de los ventiladores, el sistema de refrigeración pasivo contaría con una cámara de vapor para potenciar la extracción de la temperatura del GPU al resto de sistema de refrigeración. La cámara de vapor provee de una transferencia de la temperatura mucho más eficiente que un bloque macizo de cobre, lo que uniéndose con los heatpipe que posee la solución mantendrían la temperatura en niveles muy bajos.

Al estar frente a una tarjeta de video con dimensiones en su sistema de refrigeración muy amplio, los permite darnos cuenta de inmediato que el peso de esta tarjeta de video es mucho mayor al de otros modelos que conocemos por lo que un bracket de refuerzo para el GPU es más que necesario, de esta forma podríamos proveer de una resistencia suficiente para no dañar la ranura PCIe de la placa madre.

Arquitectura.

La arquitectura de gráficos de Ada anuncia la tercera generación de la tecnología NVIDIA RTX, un esfuerzo por aumentar el realismo en las imágenes de los juegos al aprovechar el trazado de rayos en tiempo real, sin la enorme cantidad de potencia informática necesaria para dibujar gráficos 3D con trazado de rayos puro. Esto se logra mediante la combinación de gráficos de trama convencionales con elementos de trazado de rayos, como reflejos, iluminación e iluminación global, por nombrar algunos.

La tercera generación de RTX anuncia el nuevo núcleo CUDA «Ada» de IPC más alto, el núcleo RT de tercera generación, el núcleo Tensor de cuarta generación y el nuevo procesador de flujo óptico, un componente que juega un papel clave en la generación de nuevos marcos sin involucrar los gráficos principales de la GPU. canalización de representación.

La arquitectura de gráficos GeForce Ada que impulsa el RTX 4090 aprovecha el proceso de fundición EUV de 4 nm de TSMC para aumentar la cantidad de transistores a 76.300 millones de transistores, casi tres veces más que la generación anterior; mientras que el tamaño del troquel es en realidad más pequeño, de 608 mm², en comparación con los 628 mm² del GA102 de la generación anterior. La GPU cuenta con una interfaz de host PCI-Express 4.0 x16 y un bus de memoria GDDR6X de 384 bits de ancho, que en el RTX 4090 se conecta a 24 GB de memoria. El Acelerador de Flujo Óptico (OFA) es un componente independiente de alto nivel. El chip cuenta con dos unidades NVENC y una NVDEC en la serie GeForce RTX 40; mientras que las futuras tarjetas gráficas de visualización profesional tendrán habilitados los seis componentes NVENC y NVDEC.

La jerarquía de componentes esenciales es similar a las generaciones anteriores de GPU NVIDIA. El silicio AD102 presenta la increíble cantidad de 12 clústeres de procesamiento de gráficos (GPC), cada uno de ellos tiene toda la maquinaria de representación de gráficos y SIMD, y es una GPU pequeña por derecho propio. Cada GPC comparte un motor ráster (componentes de procesamiento de geometría) y dos particiones ROP (cada una con ocho unidades ROP).

El GPC del AD102 contiene seis clústeres de procesamiento de texturas (TPC), la principal maquinaria de procesamiento de números. Cada uno de estos tiene dos Streaming Multiprocessors (SM) y una unidad Polymorph. Cada SM contiene 128 núcleos CUDA en cuatro particiones. La mitad de estos núcleos CUDA son puros FP32; mientras que la otra mitad es capaz de FP32 o INT32.

El SM retiene la capacidad de procesamiento matemático FP32+INT32 concurrente. El SM también contiene un núcleo RT de tercera generación, cuatro núcleos Tensor de cuarta generación, algo de memoria caché y cuatro TMU. Hay 12 SM por GPC, por lo que 1536 núcleos CUDA, 48 núcleos Tensor y 12 núcleos RT; por GPC. Por lo tanto, doce GPC suman 18,432 núcleos CUDA, 576 núcleos Tensor y 144 núcleos RT. Cada GPC contribuye con 16 ROP, por lo que hay 192 ROP gigantes en el silicio. Un caché L2 de 96 MB sirve como plaza central para los diversos GPC, controladores de memoria y la interfaz de host PCIe, para intercambiar datos. NVIDIA extrajo el RTX 4090 del AD102 al deshabilitar uno de los doce GPC y otros dos TPC de dos de los otros GPC, como se muestra en las partes sombreadas en rojo del diagrama de bloques anterior. La GeForce RTX 4090 tiene 72 MB de caché L2 habilitados (de los 96 MB presentes físicamente en el silicio).

El núcleo RT de tercera generación acelera los aspectos más intensivos en matemáticas del trazado de rayos en tiempo real, incluido el recorrido BVH. El motor de micromalla desplazada es una función revolucionaria introducida con el nuevo núcleo RT de tercera generación, que acelera la función de micromalla desplazada. Así como los sombreadores de malla y el teselado han tenido un profundo impacto en la mejora del rendimiento con geometría ráster compleja, lo que permite a los desarrolladores de juegos aumentar significativamente la complejidad geométrica; Los DMM son un método para reducir la complejidad de la estructura de datos de la jerarquía de volumen límite (BVH), que se utiliza para determinar dónde un rayo golpea la geometría.

Anteriormente, el BVH tenía que capturar hasta los detalles más pequeños para determinar correctamente el punto de intersección. La arquitectura de trazado de rayos de Ada recibe una gran mejora en el rendimiento gracias a Shader Execution Reordering (SER), una característica definida por software que requiere el conocimiento de los motores de juego para ayudar a la GPU a reorganizar y optimizar los subprocesos de trabajo asociados con el trazado de rayos.

El BVH ahora no necesita tener datos para cada triángulo en un objeto, pero puede representar objetos con geometría compleja como una malla gruesa de triángulos base, lo que simplifica enormemente la estructura de datos de BVH. Un BVH más simple significa menos memoria consumida y ayuda a reducir en gran medida la carga de la CPU de trazado de rayos, porque la CPU solo tiene que generar una estructura más pequeña. Con los núcleos RT «Amperio» y «Turing» más antiguos, cada triángulo en un objeto tenía que ser muestreado a gran altura, por lo que el núcleo RT podía calcular con precisión la intersección del rayo para cada triángulo. Con Ada, el BVH más simple, además de los mapas de desplazamiento, se pueden enviar al núcleo RT, que ahora puede determinar el punto de impacto exacto por sí mismo. NVIDIA ha visto una compresión de 11: 1 a 28: 1 en el recuento total de triángulos. Esto reduce los tiempos de compilación de BVH en 7,6x a más de 15x, en comparación con el núcleo RT más antiguo; y reduciendo su huella de almacenamiento entre 6,5 y 20 veces. Los DMM podrían reducir la utilización del ancho de banda del disco y la memoria, la utilización del bus PCIe, así como también reducir la utilización de la CPU. NVIDIA trabajó con Simplygon y Adobe para agregar compatibilidad con DMM para sus cadenas de herramientas.

Opacity Micro Meshes (OMM) es una nueva característica introducida con Ada para mejorar el rendimiento de la rasterización, particularmente con objetos que tienen alfa (datos de transparencia). La mayoría de los objetos de baja prioridad en una escena 3D, como las hojas de un árbol, son esencialmente rectángulos con texturas en las hojas donde la transparencia (alfa) crea la forma de la hoja. Los núcleos RT tienen dificultades para cruzar los rayos con tales objetos, porque en realidad no tienen la forma que parecen (en realidad son solo rectángulos con texturas que le dan la ilusión de forma. Los núcleos RT de la generación anterior tenían que tener múltiples interacciones con la etapa de renderizado para descubrir la forma de un objeto transparente, porque no pudieron probar alfa por sí mismos.

Esto se ha resuelto mediante el uso de OMM. Así como los DMM simplifican la geometría al crear mallas de microtriángulos; Los OMM crean mallas de texturas rectangulares que se alinean con partes de la textura que no son alfa, por lo que el núcleo RT tiene una mejor comprensión de la geometría del objeto y puede calcular correctamente las intersecciones de los rayos. Esto también tiene un impacto significativo en el rendimiento del sombreado en aplicaciones que no son RT. Las aplicaciones prácticas de los OMM no son solo objetos de baja prioridad como la vegetación, sino también duendes de humo y niebla localizada.

Tradicionalmente, había mucho sobredibujado para tales efectos, porque superponían múltiples texturas una encima de la otra, que los sombreadores tenían que procesar por completo. Ahora solo se ejecutan los píxeles no opacos: los OMM proporcionan un 30 % de aceleración con las tasas de llenado del búfer de gráficos y un 10 % de impacto en las tasas de fotogramas.

DLSS 3 presenta una nueva característica revolucionaria que promete duplicar la velocidad de cuadros con una calidad comparable, se llama generación de cuadros AI. Si bien tiene todas las funciones de DLSS 2 y su superresolución de IA (ampliación de un cuadro de menor resolución a resolución nativa con una pérdida de calidad mínima); DLSS 3 puede generar cuadros completos simplemente usando IA, sin involucrar la canalización de representación de gráficos.

Por lo tanto, cada cuadro alterno con DLSS 3 es generado por IA, sin ser una réplica del cuadro renderizado anterior. Esto solo es posible en la arquitectura de gráficos Ada, debido a un componente de hardware llamado acelerador de flujo óptico (OFA), que ayuda a predecir cómo podría verse el próximo cuadro, creando lo que NVIDIA llama un campo de flujo óptico.

OFA garantiza que el algoritmo DLSS 3 no se confunda con objetos estáticos en una escena 3D que cambia rápidamente (como un simulador de carrera). El proceso depende en gran medida de la mejora del rendimiento introducida por el formato matemático FP8 del núcleo Tensor de cuarta generación. Un tercer ingrediente clave de DLSS 3 es Reflex. Al reducir la cola de renderizado a cero, Reflex juega un papel vital para garantizar que los tiempos de cuadro con DLSS 3 estén en un nivel aceptable, y que la cola de renderizado no confunda al escalador. Una combinación de OFA y el núcleo Tensor de 4.ª generación es la razón por la que se requiere la arquitectura Ada para usar DLSS 3 y por la que no funcionará en arquitecturas más antiguas.

Especificaciones

EspecificacionesGIGABYTE RTX 4090 GAMING OCNVIDIA RTX 4090 Founders EditionAMD Radeon RX 7900XTXNVIDIA RTX 4080 Founders EditionAMD Radeon RX 7900XTNVIDIA RTX 3090 Ti
Proceso de Fabricación4 nm4 nm5 nm4 nm5 nm8 nm
GPUAD102-300-A1AD102-300-A1Navi 31 XTXAD103-300-A1 Navi 31 XTGA102-350-A1
Shaders163841638461449728 537610752
ROPs176176192112192112
Texture Units512 512 384304336336
Tensor Cores512512-304-336
RT Cores /
Ray Accelerators
12812896768484
Core Clock2235 MHz2235 MHz1900 MHz2205 MHz1500 MHz1560 MHz
Boost Clock2535 MHz2520 MHz2499 MHz2505 MHz2394 MHz1860 MHz
Frecuencia de Memoria1313 MHz1313 MHz2500 MHz1400 MHz 2500 MHz1313 MHz
Memoria24 GB, GDDR6X, 384-bit24 GB, GDDR6X, 384-bit24 GB, GDDR6, 384 bit16 GB, GDDR6X, 256 bit 20 GB, GDDR6, 320 bit24 GB, GDDR6X, 384 bit
Conectores1x 16-pin1x 16-pin2x 8-pin1x 16-pin2x 8-pin1x 16-pin
TDP450 W450 W355 W320 W315 W450 W
Precio$2486 (AMAZON)$1600 MSRP$999 MSRP$1200 MSRP$899 MSRP$1999 MSRP

Démosle una mirada a esta tremenda tarjeta de Gigabyte.

Primera Mirada

La GIGABYTE RTX 4090 GAMING OC nos muestra la posibilidad de contar con las tecnologías propias de NVIDIA como el DLSS, Ray Tracing, Reflex y NVIDIA Studio. Además de contar con 4 años de garantía y ser un modelo con OC de fabrica.

Además este modelo provee de RGB Fusion, protección de metal posterior y un robusto sistema de refrigeración WINDFORCE de GIGABYTE.

En el empaque podemos encontrar algunos manuales de instalación, los brackets de soporte junto a sus tornillos y el adaptador de energía.

Con tres grandes ventiladores como sistema activo de refrigeración, la GIGABYTE RTX 4090 GAMING OC se presente como una tarjeta de video robusta y sobria hasta el momento.

Contar con un backplate protector es esencial para tarjetas de video de esta gama, claramente estos modelos poseen un sistema eléctrico denso que necesita ser protegido. El diseño de este mantiene un tono gris más claro con un estilo sobrio y una abertura amplia para movilizar el aire residual hacia arriba del gabinete.

Por el borde externo, vemos el sistema de refrigeración con algunos heatpipe que se asoman, además de encontrarnos con el sistema de energía de 16 pines PCIe 5.0.

Las salidas de video con las que cuenta este modelode GIGABYTE, son 1x HDMI 2.0 y 3x Display Port 1.4.

En un espacio entre el disipador y el backplate, en un pequeño corte del PCB podremos encontrar un switch que permite seleccionar entre las dos BIOS con las que cuenta este modelo, por un lado la BIOS OC con los parámetros máximos y la otra opción SILENT con frecuencia levemente reducidas y un perfil de activación de ventiladores menos agresivo pero silencioso.

El tamaño del PCB es mucho más reducido de como se ve externamente la tarjeta de video. Bajo el gran disipador encontramos un sistema eléctrico muy concentrado, con 24 fases de poder (20+4).

Micron es el fabricante de los chips de memoria GDDR6X para este modelo, con 12 chips de 2GB cada uno para dar los 24GB totales. El modelo estos chips son Micro 2MU47 D8BZC.

Un chip basado en ARM modelo Holtek HT32F52352 podremos encontrar a bordo de esta tarjeta de video de GIGABYTE.

Por el lado posterior vemos algunos mosfet con pads térmicos adosados al backplate que ayudará en la refrigeración de la tarjeta de video.

El largo de la tarjeta de video en su PCB es de unos 232mm.

El largo de la tarjeta completa apunta a los 342mm, unos 110mm más larga que el PCB interno.

El sistema pasivo de refrigeración es completo, conectando a través de pads térmicos muchos elemento y generando diferentes niveles de disipación comenzando con el GPU directo a la cámara de vapor, y las memorias a través de un bloque de aluminio, otras zonas como los VRM y fases de poder también conectan al bloque de aluminio.

 

En cada ventiladores podemos ver iluminación RGB formando 3 aros. La iluminación se activa cada vez que los ventiladores estén girando.

 

 

 

Plataforma de Pruebas y Metodología

Plataforma de Pruebas
Procesador – AMD Ryzen 9 7950X
Placa Madre – ASUS CROSSHAIR X670E HERO
Memorias – Corsair Dominator Platinum RGB 2x16GB 6000MT/s EXPO DDR5
Refrigeración – Thermaltake Water 3.0 Riing 360
Tarjeta de Video – NVIDIA GeForce RTX 4090 FE 24GB
Gigabyte GeForce RTX 4090 GAMING OC 24G
– AMD Radeon RX 7900XTX 24GB
– AMD Radeon RX 7900XT 20GB
Fuente de Poder – ASUS THOR II 1000W
Almacenamiento – Corsair MP600 PRO 1TB SSD M.2 PCIe 4.0
Monitor – ASUS MG28UQ 4K
  • Sistema operativo Windows 10 Pro x64 [22H2].
  • Las pruebas fueron realizadas en un ambiente con temperatura de 25ºC aproximadamente.
  • La plataforma fue utilizada sin gabinete.
  • Driver de Video utilizado: AMD Adrenalin Edition 22.40.00.57 Beta5, NVIDIA Game Ready v527.56
  • Las resoluciones de las pruebas sintéticas son las predeterminadas por cada uno de los benchmarks.
  • Configuraciones ultra o más alta para cada título de juego.

Veamos ahora su rendimiento, comenzando con la fuerza bruta del Rasterizado.

Pruebas Rasterizado

Teniendo velocidades de reloj similares a la Founders Edition de NVIDIA, era esperable que tuviesen un rendimiento similar.

Pruebas Ray Tracing

Observemos su comportamiento cuando aplicamos Raytracing.

Algo similar a cuando estamos con rasterizado, rendimiento similar a la FE, dentro del margen de error.

Pruebas Ray Tracing + DLSS

último set de pruebas, donde tenemos Raytracing, pero también utilizamos la tecnología de DLSS.

Misma situación que antes, vemos que todo se mantiene igual a la hora del rendimiento de esta tarjeta.

Overclocking

Aplicando algo de overclock a la tarjeta fue bastante simple, solo que en esta oportunidad NVIDIA limita el máximo de overclock que puedes alcanzar.

Con estas velocidades de relojs, corrimos algunas pruebas y veremos la ganancia de rendimiento que tuvimos.

Al lograr frecuencias superiores con esto se pudo romper la igualdad con la Founders Edition,

Temperatura y Consumo

Mas frecuencias y voltaje conllevan un mayor consumo, es por ello que analizaremos el consumo de esta tarjeta en cada uno de las condiciones, stock, y OC.

Con un peak de 447W en máxima carga esta tarjeta sobrepasa a la anterior tarjeta máxima consumidora, que era la RTX 4090 Founders Edition. Aunque hay que mencionar que la diferencia entre «stock» y «OC» fue de solo 1W.

En este apartado se logra apreciar el gran trabajo de Gigabyte en el sistema de refrigeración de esta tarjeta.

Sonido

Un buen sistema de refrigeración muchas veces conlleva que no sea silencioso, sino que se enfoca en que los ventiladores muevan mucho aire no importando el ruido que generen.

Cuando la velocidad de los ventiladores se deja en modo AUTO, se tiene que la curva configurada en la VBIOS de la RTX 4090 FE es mas controlada versus esta Gigabyte. Sin embargo, al configurarlo de forma manual al 50% o 100%, el trabajo que hizo Gigabyte es notable al mantener el ruido controlado, sin ser muy ruidoso.

Conclusión

La Gigabyte RTX 4090 Gaming OC aumenta el dial de overclocking hasta 15, como en 15 MHz. Dado que el reloj Boost de referencia es de 2520 MHz y el Gaming Clock del mundo real suelen superar los 2,7 GHz, eso representa un aumento de rendimiento teórico de aproximadamente el 0,6 %. En la práctica, a veces ni siquiera puede superar a la Founders Edition.

Mientras tanto, el precio favorece la tarjeta de referencia de Nvidia, a $1,599 USD en comparación con los $1,699 USD para esta Gigabyte Gaming OC. Excepto que encontrar cualquiera de las tarjetas al precio sugerido requerirá más que un poco de suerte.

Volviendo a esta Gigabyte GeForce RTX 4090 Gaming OC 24G, es efectivamente tan rápido como cualquier otra tarjeta RTX 4090, más o menos.

Suponiendo que todo estuviera disponible a su precio MSRP, la Founders Edition de NVIDIA aún se aleja con una victoria fácil. Está bien construida, funciona ligeramente mejor que algunos de los modelos básicos de otros proveedores de tarjetas complementarias y tiene un precio más bajo que la mayoría de los modelos de partners. Pero dado que no se puede encontrar Founders Edition en stock, Gigabyte ofrece una alternativa razonable que podría ser justo lo que necesita para su próxima compilación de PC extrema.

Posts relacionados

GTC2024: Las tecnologías humanas digitales de NVIDIA dan vida a los personajes de IA

Mario Rübke

Dell ofrece soluciones completas con tecnología NVIDIA para ayudar a las empresas globales a acelerar la adopción de la IA

Mario Rübke

Review Asus ROG Zephyrus G16 (2024) [GU605MI]

Mario Rübke