Image default
BenchmarksComputadoresEntusiastasGamersLanzamientosReviewsTarjetas de VideoTecnología

Review GIGABYTE RTX 4060 AERO OC 8G

Con el lanzamiento de la NVIDIA RTX 4060Ti comenzamos a entrar de lleno en la gama media, ya hacia el usuario que busca contenido en 1080p, adicionalmente con este lanzamiento se mostraba la futura RTX 4060, la cual hoy se lanza oficialmente y les compartiremos todos los detalles de este nuevo ejemplar de enviado bajo la mano de GIGABYTE con su GIGABYTE RTX 4060 AERO OC 8G.

Basándonos en otro modelo de la serie AERO de GIGABYTE, podemos tener una apreciación directa de lo que la serie RTX 4060 logra conseguir bajo un diseño con características funcionales por sobre las estéticas, y es que esta serie apunta a reforzar su potencial de refrigeración y baja emisión de ruido que otras cosas, una combinación muy atractiva para creadores de contenido sobre todo.

La NVIDIA RTX 4060 es una respuesta al mercado que debería responder bien al mercado medio bajo 1080p, e incluso con tecnologías DLSS debería darnos un rendimiento satisfactorio incluso con Ray Tracing, aunque claramente y lo visto con la versión Ti junto a lo que AMD propone con la RX 7600, la memoria será un punto a discutir en esta nueva generación de tarjetas de video.

Arquitectura.

La arquitectura de gráficos de Ada anuncia la tercera generación de la tecnología NVIDIA RTX, un esfuerzo por aumentar el realismo en las imágenes de los juegos al aprovechar el trazado de rayos en tiempo real, sin la enorme cantidad de potencia informática necesaria para dibujar gráficos 3D con trazado de rayos puro. Esto se logra mediante la combinación de gráficos de trama convencionales con elementos de trazado de rayos, como reflejos, iluminación e iluminación global, por nombrar algunos.

La tercera generación de RTX anuncia el nuevo núcleo CUDA «Ada» de IPC más alto, el núcleo RT de tercera generación, el núcleo Tensor de cuarta generación y el nuevo procesador de flujo óptico, un componente que juega un papel clave en la generación de nuevos marcos sin involucrar los gráficos principales de la GPU. canalización de representación.

La arquitectura NVIDIA Ada es un gran salto en rendimiento. Se ha invertido mucho en convertirla en la arquitectura de GPU más rápida y avanzada del mundo jamás construida. La RTX 4070 Ti está fabricada en el proceso personalizado 4N de TSMC y contiene 35.800 millones de transistores y más de 7680 núcleos CUDA, la arquitectura NVIDIA Ada cuenta con un multiprocesador (SM) de transmisión mejorado, memoria GDDR6X súper rápida, núcleos Ray Tracing de tercera generación para un tazado de rayos mejorado.

Aceleración de hardware de seguimiento, Tensor Cores de cuarta generación para un mayor rendimiento de inferencia de IA, codificadores de octava generación compatibles con AV1 y mejoras de DLSS que permiten una alta velocidad de fotogramas, juegos de alta resolución en configuraciones ultra con trazado de rayos habilitado en el juego más reciente

La jerarquía de componentes esenciales es similar a las generaciones anteriores de GPU NVIDIA. El silicio AD104 presenta la increíble cantidad de 5 clústeres de procesamiento de gráficos (GPC), cada uno de ellos tiene toda la maquinaria de representación de gráficos y SIMD, y es una GPU pequeña por derecho propio. Cada GPC comparte un motor ráster (componentes de procesamiento de geometría) y dos particiones ROP (cada una con ocho unidades ROP).

El GPC del AD104 contiene seis clústeres de procesamiento de texturas (TPC), la principal maquinaria de procesamiento de números. Cada uno de estos tiene dos Streaming Multiprocessors (SM) y una unidad Polymorph. Cada SM contiene 128 núcleos CUDA en cuatro particiones. La mitad de estos núcleos CUDA son puros FP32; mientras que la otra mitad es capaz de FP32 o INT32.

El SM retiene la capacidad de procesamiento matemático FP32+INT32 concurrente. El SM también contiene un núcleo RT de tercera generación, cuatro núcleos Tensor de cuarta generación, algo de memoria caché y cuatro TMU. Hay 12 SM por GPC, por lo que 1536 núcleos CUDA, 48 núcleos Tensor y 12 núcleos RT; por GPC. Por lo tanto, 5 GPC suman 7680 núcleos CUDA, 240 núcleos Tensor y 60 núcleos RT. Cada GPC contribuye con 16 ROP, por lo que hay 80 ROP gigantes en el silicio. Un caché L2 de 48 MB sirve como plaza central para los diversos GPC, controladores de memoria y la interfaz de host PCIe, para intercambiar datos.

El núcleo RT de tercera generación acelera los aspectos más intensivos en matemáticas del trazado de rayos en tiempo real, incluido el recorrido BVH. El motor de micromalla desplazada es una función revolucionaria introducida con el nuevo núcleo RT de tercera generación, que acelera la función de micromalla desplazada. Así como los sombreadores de malla y el teselado han tenido un profundo impacto en la mejora del rendimiento con geometría ráster compleja, lo que permite a los desarrolladores de juegos aumentar significativamente la complejidad geométrica; Los DMM son un método para reducir la complejidad de la estructura de datos de la jerarquía de volumen límite (BVH), que se utiliza para determinar dónde un rayo golpea la geometría.

La GeForce RTX 3060 Ti de la generación anterior presentaba una interfaz de memoria GDDR6 de 256 bits de ancho que impulsaba sus 8 GB de memoria GDDR6 con velocidad de 14 Gbps (ancho de banda de memoria de 448 GB/s), lo que generó cierta controversia con la nueva RTX 4060 Ti que usa un interfaz de memoria más estrecha de 128 bits para controlar los mismos 8 GB de memoria de 18 Gbps (ancho de banda de 288 GB/s). Con la nueva arquitectura de gráficos Ada Lovelace, NVIDIA ha intentado reequilibrar el subsistema de memoria de modo que dependa de cachés integrados más grandes, lo que permite a NVIDIA reducir la interfaz de memoria GDDR6 de la GPU. El beneficio obvio de esto para NVIDIA es la reducción de costos, no nos equivoquemos al respecto, pero NVIDIA sostiene que esto no es un gran problema para la GPU.

El caché de último nivel, o caché L2, de las GPU NVIDIA Ada es entre 8 y 10 veces más grande que el de las GPU Ampere de la generación anterior. El silicio AD106 que alimenta la RTX 4060 Ti tiene una memoria caché L2 de 32 MB, en comparación con los 4 MB del silicio GA104 que alimenta la RTX 3060 Ti. NVIDIA ilustró un ejemplo de cómo una LLC integrada más grande reduce la presión de la memoria de video (viajes a GDDR6) entre un 40 % y un 60 % en la misma GPU, al absorber una mayor cantidad de solicitudes de acceso a la memoria por parte de los sombreadores.

El caché L2 es un caché de víctima unificado para los diversos GPC de la GPU y sus TPC locales. Los datos que no son lo suficientemente calientes (a los que se accede con la frecuencia suficiente) para residir en las pequeñas cachés L1 del SM, se expulsan a la caché L2 y, dependiendo de su calor, se envían a la memoria de video GDDR6. La memoria caché L2 es un orden de magnitud más rápida que la memoria de video en términos de latencia, por lo que tener datos a los que se accede con frecuencia reside allí ofrece un beneficio considerable.

Anteriormente, el BVH tenía que capturar hasta los detalles más pequeños para determinar correctamente el punto de intersección. La arquitectura de trazado de rayos de Ada recibe una gran mejora en el rendimiento gracias a Shader Execution Reordering (SER), una característica definida por software que requiere el conocimiento de los motores de juego para ayudar a la GPU a reorganizar y optimizar los subprocesos de trabajo asociados con el trazado de rayos.

El BVH ahora no necesita tener datos para cada triángulo en un objeto, pero puede representar objetos con geometría compleja como una malla gruesa de triángulos base, lo que simplifica enormemente la estructura de datos de BVH. Un BVH más simple significa menos memoria consumida y ayuda a reducir en gran medida la carga de la CPU de trazado de rayos, porque la CPU solo tiene que generar una estructura más pequeña. Con los núcleos RT «Amperio» y «Turing» más antiguos, cada triángulo en un objeto tenía que ser muestreado a gran altura, por lo que el núcleo RT podía calcular con precisión la intersección del rayo para cada triángulo. Con Ada, el BVH más simple, además de los mapas de desplazamiento, se pueden enviar al núcleo RT, que ahora puede determinar el punto de impacto exacto por sí mismo. NVIDIA ha visto una compresión de 11: 1 a 28: 1 en el recuento total de triángulos. Esto reduce los tiempos de compilación de BVH en 7,6x a más de 15x, en comparación con el núcleo RT más antiguo; y reduciendo su huella de almacenamiento entre 6,5 y 20 veces. Los DMM podrían reducir la utilización del ancho de banda del disco y la memoria, la utilización del bus PCIe, así como también reducir la utilización de la CPU. NVIDIA trabajó con Simplygon y Adobe para agregar compatibilidad con DMM para sus cadenas de herramientas.

Opacity Micro Meshes (OMM) es una nueva característica introducida con Ada para mejorar el rendimiento de la rasterización, particularmente con objetos que tienen alfa (datos de transparencia). La mayoría de los objetos de baja prioridad en una escena 3D, como las hojas de un árbol, son esencialmente rectángulos con texturas en las hojas donde la transparencia (alfa) crea la forma de la hoja. Los núcleos RT tienen dificultades para cruzar los rayos con tales objetos, porque en realidad no tienen la forma que parecen (en realidad son solo rectángulos con texturas que le dan la ilusión de forma. Los núcleos RT de la generación anterior tenían que tener múltiples interacciones con la etapa de renderizado para descubrir la forma de un objeto transparente, porque no pudieron probar alfa por sí mismos.

Esto se ha resuelto mediante el uso de OMM. Así como los DMM simplifican la geometría al crear mallas de microtriángulos; Los OMM crean mallas de texturas rectangulares que se alinean con partes de la textura que no son alfa, por lo que el núcleo RT tiene una mejor comprensión de la geometría del objeto y puede calcular correctamente las intersecciones de los rayos. Esto también tiene un impacto significativo en el rendimiento del sombreado en aplicaciones que no son RT. Las aplicaciones prácticas de los OMM no son solo objetos de baja prioridad como la vegetación, sino también duendes de humo y niebla localizada.

Tradicionalmente, había mucho sobredibujado para tales efectos, porque superponían múltiples texturas una encima de la otra, que los sombreadores tenían que procesar por completo. Ahora solo se ejecutan los píxeles no opacos: los OMM proporcionan un 30 % de aceleración con las tasas de llenado del búfer de gráficos y un 10 % de impacto en las tasas de fotogramas.

DLSS 3 presenta una nueva característica revolucionaria que promete duplicar la velocidad de cuadros con una calidad comparable, se llama generación de cuadros AI. Si bien tiene todas las funciones de DLSS 2 y su superresolución de IA (ampliación de un cuadro de menor resolución a resolución nativa con una pérdida de calidad mínima); DLSS 3 puede generar cuadros completos simplemente usando IA, sin involucrar la canalización de representación de gráficos.

Por lo tanto, cada cuadro alterno con DLSS 3 es generado por IA, sin ser una réplica del cuadro renderizado anterior. Esto solo es posible en la arquitectura de gráficos Ada, debido a un componente de hardware llamado acelerador de flujo óptico (OFA), que ayuda a predecir cómo podría verse el próximo cuadro, creando lo que NVIDIA llama un campo de flujo óptico.

OFA garantiza que el algoritmo DLSS 3 no se confunda con objetos estáticos en una escena 3D que cambia rápidamente (como un simulador de carrera). El proceso depende en gran medida de la mejora del rendimiento introducida por el formato matemático FP8 del núcleo Tensor de cuarta generación. Un tercer ingrediente clave de DLSS 3 es Reflex. Al reducir la cola de renderizado a cero, Reflex juega un papel vital para garantizar que los tiempos de cuadro con DLSS 3 estén en un nivel aceptable, y que la cola de renderizado no confunda al escalador. Una combinación de OFA y el núcleo Tensor de 4.ª generación es la razón por la que se requiere la arquitectura Ada para usar DLSS 3 y por la que no funcionará en arquitecturas más antiguas.

Especificaciones.

EspecificacionesNVIDIA RTX 4070NVIDIA RTX 4060 TIRadeon RX 6700XTNVIDIA RTX 3060TiGIGABYTE RTX 4060 AERO OC 8GNVIDIA RTX 4060 AMD Radeon RX 7600NVIDIA RTX 3060
Proceso de Fabricación5 nm5 nm7 nm8 nm5 nm5 nm5 nm8 nm
GPUAD104-250-A1AD106-350-A1Navi 22 XTGA104-200-A1AD106AD106Navi 33 XLGA106-302-A1
Shaders58884352256048643840384020483584
ROPs6448648048486448
Texture Units184136160152120120128112
Tensor Cores184136-152120120-112
RT Cores /
Ray Accelerators
4634403830303228
Core Clock1920 MHz2310 MHz2321 MHz1410 MHz1830 MHz1830 MHz1720 MHz1320 MHz
Boost Clock2475 MHz2535 MHz2581 MHz1665 MHz2550 MHz2535 MHz2625 MHz1777 MHz
Frecuencia de Memoria1313 MHz2250 MHz2000 MHz1750 MHz2125 MHz2250 MHz2250 MHz1875 MHz
Memoria12 GB, GDDR6X, 192 bit8GB, GDDR6, 128 bit12 GB, GDDR6, 192 bit8GB, GDDR6, 256 bit8GB, GDDR6, 128 bit8GB, GDDR6, 128 bit8GB, GDDR6, 128 bit 8GB, GDDR6, 128 bit
Conectores1x 16-pin1x 16-pin1x 6-pin + 1x 8-pin1x 12-pin1x 8-pin1x 12-pin1x 8-pin1x 12-pin
TDP200 W160 W230 W200 W115 W115 W165 W170 W
Precio$599$399$479$399$299$269$330

Pasemos a revisar la tarjeta.

Primera Mirada.

Con un empaque con gran predominancia del blanco, es como GIGABYTE presenta su serie AERO, un modelo que apunta a ser un complemento de usuario que buscan crear.

El empaque por posterior nos enseña las cualidades que podremos encontrar en este modelo, sistema de refrigeración Windforce, RGB Fusion y blackplate protector son algunas de las características que nos puede brindar GIGABYTE en esta versión.

Una vez abierto el empaque vemos la tarjeta envuelta en su bolsa anti-estática y acolchado, cabe mencionar que a nivel de accesorios solo se encuentra un manual de instalación.

En su frente la tarjeta de video muestra sus 3 ventiladores de 80mm, estas con el diseño Windforce de GIGABYTE.

En una vista posterior podemos ver un backplate que cubre toda la tarjeta, dejando un espacio para el flujo de aire.

Las salidas de video constan de 2x HDMI y 2x Display Port. En esta vista podemos ver también el grosor de la tarjeta, la cual es inferior a 2 slot de estapacio.

La propuesta de GIGABYTE provee más refrigeración en su largo que ancho, esto para mantenerse por debajo de los 2 slot y entregar una GPU fresca.

El conector que provee GIGABYTE en esta RTX 4060 es de 80 pines, suficiente para entregar los 115W que se menciona, e incluso más.

En la esquina cercano al bracket de la salida de video, podemos encontrar un switch para activar modo BIOS OC o Silent. Aunque es probable que la mayoría mantengan el lado OC al no tener configurado una frecuencia muy alta, y además que AERO de GIGABYTE son modelos bien silenciosos.

Bajo el sistema de refrigeración encontramos un PCB que cubre un poco más de la mitad de la tarjeta total, este se puede ver mucho más sencillo que el modelo RTX 4060Ti, y que por sorpresa no comparten la misma configuración base del PCB.

Por posterior tampoco vemos una gran cantidad de componentes eléctricos, por lo que no hay necesidad de que el backplate entregue refrigeración por esta zona, sino solo protección.

La disipación pasiva de esta tarjeta consta de 2 heatpipe en contacto directo con el GPU, las memorias a su alrededor refrigeradas por un bloque de aluminio, y los puntos eléctricos claves como VRMs y algunos controladores en pequeños sectores de aluminio.

La memoria modelo SK Hynix H56G42AS6D, de 2GB cada una.

La iluminación en la tarjeta está limitada a su logo AERO en el borde, el cual posee conexión vía RGB Fusion de GIGABYTE.

Plataforma de Pruebas y Metodología.

Plataforma de Pruebas
Procesador- AMD Ryzen 9 7950X
Placa Madre- ASUS ROG CROSSHAIR X670E HERO
Memoria- Corsair Dominator Platinum RGB 6000 2x16GB EXPO
Refrigeración- Thermaltake Water 3.0 Riing RGB 360
Tarjeta de Video- GIGABYTE RTX 4060 AERO OC 8G
Fuente de Poder- ASUS ROG THOR II 1000W
Almacenamiento- Corsair MP600 PRO 1TB M.2 PCIe 4.0
Monitor- ASUS MG28UQ
  • Sistema operativo Windows 10 Pro x64 [22H2].
  • Las pruebas fueron realizadas en un ambiente con temperatura de 23ºC aproximadamente.
  • La plataforma fue utilizada sin gabinete.
  • Driver de Video utilizado: NVIDIA Driver Game Ready 536.20
  • Las resoluciones de las pruebas sintéticas son las predeterminadas por cada uno de los benchmarks.

Luego de esta fotografía de rigor, les dejamos con los resultados de las pruebas.

Pruebas Rasterizado.

Pruebas Ray Tracing.

Pruebas Reescalado (DLSS/FSR – Alto Rendimiento).

Cuando analizamos los resultamos con tecnologías de reescalado encontramos una serie de particularidades sobre todo en Cyberpunk, y es que la adopción de estas tecnologías suelen generar ciertos resultados que no se asocian a la lógica que experimentamos en resultados puros de ray tracing o rasterizado, donde vemos modelos que por características de mayor fuerza bruta quedan muy por atrás, y claro ejemplo de como las nuevas generaciones de GPUs buscan eficiencia bajo un ecosistema donde el software entrega muchos esteroides.

Overclocking.

Con bajos valores tanto de consumo como de temperatura podemos insinuar que estamos frente a un modelo que podría entregarnos frecuencias altas  con respecto a las de fabrica bajo overclocking, igualmente aquí dependerá mucho de que tan acabado esté el controlador.

En esta oportunidad hemos puesto los valores en 2700 MHz para el Boost, 1980 MHz en el GPU base y 2225 MHz en las memorias, esto se traduce en + 5,8%, +8% y +4,7% respectivamente, incluso cuando hemos puesto estos valores la tarjeta de video parecía seguir subiendo en frecuencia por lo que es probable pueda subir sin problema, sin embargo estos valores son altos para un a tarjeta de video para una serie que no suele entregar cualidades en overclocking más allá del que trae de fabrica.

Cada porcentaje de rendimiento adicional que podamos adquirir es un gran valor agregado, los usuarios que se sitúan en esta gama de productos buscan un modelo equilibrado tanto en su costo como en rendimiento, si con overclocking podemos sumar mayor potencial entonces será un modelo más atractivo, dicho esto y revisando los resultados obtenidos en nuestro overclocking podemos ver una tarjeta que tiene potencial para seguir escalando, igual la versión AERO de GIGABYTE no se caracteriza por tener gran potencial de overclocking por lo que quizás en algún modelo GAMING este puedo tener una capacidad mayor de overclocking. En prueba rasterizada en 1080p se pueden ver hasta 5 FPS más, lo que no está mal.

Consumo y Temperatura.

A nivel de consumo estamos frente al modelo de serie RTX 40 para desktop que menos consume, sus valores basales no bajaban de los 50W en reposo probablemente se pueda asociar a algo relacionado al controlador, pero en carga máxima no logró superar los 130W incluso bajo overclocking, mostrando alrededor de 25W menos con respecto al modelo que hace un mes aproximadamente AMD había introducido al mercado.

En lo que respecta a temperaturas, estamos frente a valores más que atractivos, igual esta una tarjeta que posee un sistema de refrigeración de gran potencial para el consumo que posee el GPU, sin embargo logra mantener bajo los 60°C en maxima carga con

Ruido.

Para un gamer el ruido quizás no sea tanta molestia, un headset y problema resuelto, sin embargo para alguien que busca una tarjeta que además de jugar busca sacarle provecho en su trabajo podría ser un punto a considerar, es aquí donde tarjetas como la propuesta que nos trae GIGABYTE con su serie AERO sea una opción, pero veamos que valores nos entre GIGABYTE en este modelo.

La serie AERO de GIGABYTE como hemos mencionado saca sus mayores atributos en escenario donde la baja emisión de ruido se pone en juego, el sistema abordo de esta RTX 4060 logra un máximo de 68 dBA en su 100%, un valor muy por sobre lo que la tarjeta de video experimenta cuando es cargada al 100% con valores de sus ventiladores en automático llegando a tan solo 42 dBA, un valor moderado en lo que es una escala o sea seria inferior a una conversación normal y más parecido al ruido en una biblioteca.

Conclusión.

Esta apuesta de NVIDIA no parecer estar fuera de foco si se trata de responder ante contenido 1080p, hemos visto un gran esfuerzo en este sector del mercado para proveer de una tarjeta eficiente que además de dar un buen rendimiento full hd también pueda entregar bajo consumo, si bien respeta estos puntos, genera algo de dudas en cuanto a comprarlas con lo que ya NVIDIA tiene puesto en el mercado en este segmento y junto a lo que AMD ha entregado (siguiendo el concepto precio/rendimiento), podría ser un modelo que no generé un gran impacto. Con un precio de salida de $299 usd queda $20 usd por sobre lo que AMD propone con la RX 7600, ahora si comparamos con algunos modelos de 3060 Ti que rondan los $337 a $350 aprox, con una ventaja de rendimiento para esta ultima, una diferencias muy corta.

Para lo que es temperatura y consumo lo propuesto por NVIDIA logra un buen desempeño, con una entrega de rendimiento completo para 1080p bajo un consumo de 130W sin superar los 60°C nos demuestra un gran trabajo de parte de NVIDIA y su arquitectura Ada Lovelace, si bien gran parte de esto se le debe a un trabajo muy coordinado entre el potencial de hardware y como el software se comunica con el resto de la cadena se ve un trabajo muy alineado, de lo cual debemos admitir que el resultado responde completamente a lo que se requiere, aunque algunos buscar más fuerza bruta en la GPU que una que se apoyé mucho del software, a esto ultimo nos referimos a como DLSS 3 le entrega un empuje sorprendente en el reescalado y como su ultima generación de núcleos RT logran mantener la supremacía en lo que a Ray Tracing se refiere.

Como GIGABYTE para este modelo AERO a logrado dotar de características que el usuario creador de contenido valora, una de estas es la baja emisión de ruido, una tarjeta de video que a nivel de ventiladores lograr mantener muy bajo ruido y que sumado a la estética con mínima iluminación (característica que en un mundo más profesional no es muy bienvenido), da en el clavo con esta serie AERO, que mantiene este concepto de una tarjeta de video seria.

Posts relacionados

DLSS 3 se actualiza con nuevos y refrescantes títulos

Mario Rübke

Black Myth: Wukong GeForce RTX 40 Series Bundle ya disponible junto con otras actualizaciones DLSS

Mario Rübke

ASUS anuncia sus nuvos ExpertBook B5 con procesadores Intel Core Ultra, listos para la IA

Mario Rübke