NVIDIA con su nueva familia de tarjetas graficas GeForce 280/260 series, ha introducido una nueva y renovada arquitectura que debuta con su Segunda Generación de gráficos unificados y su nueva arquitectura de computo “Parallel Computing Architecture” o Arquitectura de Computo Paralelo, además de una mejorada arquitectura de proceso grafico o “Graphics Processing Architecture”. Ambas traen varios secretos técnicos que pasaremos a revelar en el siguiente análisis, en donde resumiremos y explicaremos los puntos más destacables para poder comprender la arquitectura de las nuevas tarjetas de NVIDIA.
La arquitectura de las nuevas tarjetas de NVIDIA podríamos definirla como una Arquitectura Transversal, puesto que no solo se centra en la aceleración de juegos 3D como ha sido tradicional a través de las distintas generaciones de tarjetas, sino que también se centra en cálculos de propósito general, “invadiendo” -entre comillas- un campo dedicados hasta hace poco sólo a los procesadores (CPU). Las GeForce GTX 200s de partida se basan en un núcleo (GTX200) fabricado a 65nm (TSMC) con nada menos que 1400 millones de transistores y 240 núcleos de proceso, el doble en cuanto a transistores de los que posee la tarjeta no-dual-GPU más poderosa de NVIDIA hasta la fecha (GeForce 9800GTX) cuyo conteo de transistores llega a los 754millones y 128 núcleos de proceso. Estas características le dan al núcleo GTX200 un poder de cálculo de 933 GigaFlops (Giga Floating Point per Second o Giga Operaciones de punto flotante por segundo), siendo el núcleo más grande, complejo y poderoso jamás creado por la compañía de Santa Clara.
-
-
Las GeForce GTX 280/260 se basan como ya mencionamos en una nueva y mejorada arquitectura, ésta tiene dos modos de trabajo, “Paralell Computing Architecutre” (el que vemos en la imagen) que proporciona calculo paralelo para tareas que no son netamente acelerar juegos, sino que aplicaciones de computo intensivo como lo pueden ser aceleración de video HD, calculo de físicas, computación distribuida (fonding@home), aceleración de procesos científicos, computación visual (animación, render 3D, modelado) etc y el otros modo es “Graphics Processing Architecture” que es el sistema tradicional de rendereo y aceleración grafica para los juegos.
Para ambos casos (paralelo y grafico) el diseño interno es el mismo y se denomina SPA (Scalable Processor Array), una especie de “Framework” o estructura en la cual tenemos 10 bloques denominados “Texture Processing Clusters” (TPCs) en el modo grafico y “Thread Processing Clusters” en modo de computación paralela. En la parte inferior tenemos el sistema de memoria principal, que en el caso de la GeForce GTX 280 son 8 bloques que totalizan 1024MB de memoria grafica.
Entre el sistema de memoria y el SPA tenemos también las unidades de cache de texturas (Text L2) estas son usadas para que el acceso a memoria sea más eficiente en operaciones de lectura y escritura, también tenemos unas unidades especiales denominadas “atomic”, que son unidades de acceso especial a la memoria para tareas de lectura-modificación-escritura. En la parte superior esta el “Thread Scheduler”, encargado de administrar los hilos de ejecución de cada núcleo, todos estos elementos forman parte del modo de computación paralela o “Paralell Computing Architecture”.
-
-
Si hacemos un Zoom en la estructura veremos lo siguiente: un cluster o unidad TPC (Texture Processing Clusters), dentro de esta unidad tenemos tres bloques denominados Streaming Multiprocessors (SMs) y cada uno de ellos contiene ocho núcleos (cores), 24 en total, los que conocemos con el nombre de Streaming Processors (SPs) o Thread Processors, dependiendo del modo de trabajo (grafico o paralelo), por lo tanto, si aplicamos matemáticas básicas tenemos que multiplicando estos 24 SPs por el número de TPC (10), tenemos en total los 240 Streaming Processors de la GeForce GTX 280.
Dentro del TCP tenemos también ocho unidades de textura denominadas “Texture Filtering” (TF) usados en el modo grafico, pero que también sirven en el modo de computación paralela, el bloque lo completan una memoria local compartida (Local Memory) de 16K dentro de los SMs y que tiene la función de servir como un enlace entre cada core para poder compartir datos entre cada uno, sin la necesidad de tener que leer o escribir en un subsistema de memoria externo, lo que mejora la latencia y tiempos en las micro-transferencias de cada core. Finalmente tenemos el respectivo bloque de memoria L1 que esta presente en cada TCP.
-
-
Tal como comentamos al inicio la arquitectura de las nuevas tarjetas de NVIDIA consta de dos modos de trabajo, “Parallel Computing Architecture” y “Graphics Processing Architecture”, la estructura es la misma, solo que en el modo grafico debemos agregar las unidades ROPs (Raster Operations Processors o Procesadores de operaciones de barrido que se componen de 8 clusters con 16 unidades cada uno, danto un total de 128 ROPs. Mas abajo tenemos el sistema de memoria ya descrito anteriormente que tiene una interfaz de comunicación de 512-bit. En tanto las unidades de vertex y píxel shader mas la unidad de geometría de sombras (Geometry Shader) se encuentra en la parte superior, lo que conforma la ya conocida arquitectura de shader unificados. Otro elemento que se mantiene en el modo grafico es el cache de texturas (Text L2).
La GeForce GTX 280, hace uso de memorias GDDR3, en su arquitectura interna se conforma en total por 16 bloques (8×8) de memoria, que en su arquitectura de diseño externo, se representa por 8 chips de memorias por cada lado de la tarjeta (16 en total), están ubicados en pares y cada par posee una interfaz de comunicación de 64-bit, así que si multiplicamos estos 64-bit por el numero de bloques de memoria (8) tendremos en total una interfaz de memoria de 512-Bit, una mejora respecto a la generación previa que utilizaba 384-bit de interfaz de memoria.
Por otra parte estos 16 chips de memoria de 64MB cada unos conforman un Framebuffer de 1024MB (1GB), una cantidad muy necesaria si pensamos en los altos requerimientos gráficos, visuales y de efecto que pueden exigir actualmente los videojuegos, sobre todo con tecnologías demandantes como DirectX 10, PhysX, contenidos HD, grandes filtros de video, Altas resoluciones, es por esto que en términos de balancear la arquitectura respecto a la generación previa de tarjetas se ha mejorado el ancho de banda de la interfaz a 512-Bit para proveer un camino mas expedito de las texturas al Framebuffer (TEX:FB), por otra parte también ayuda en esta tarea el sistema de compresión por hardware que utilizan las tarjetas NVIDIA que ayuda a ocupar mas eficientemente la interfaz. En términos numéricos tenemos que el ancho de banda efectivo del sistema de memorias en la GeForce GTX 280 alcanza 141.7GB/s con memorias a una frecuencia de 2,214 MHz.
Los modos de proceso descritos anteriormente “Paralelo y Grafico” también usan dos modelo de procesamiento, para las ejecuciones a través del TPCs (Texture Processing Clusters) el modo utilizado es MIMD (multiple instruction, multiple data) y mas internamente para ejecuciones a través de cada SM (Streaming Multiprocessors) el modo utilizado SIMT (single instruction, multiple data), una mejora tanto en rendimiento como en a nivel de programación sobre el modo SIMD (single instruction, multiple data). SIMT a su vez asegura que todos los núcleos de proceso estén 100% siendo utilizados todo el tiempo y que los thread puedan tomar su propio camino, puesto que los desvíos (branching) son manejados por el Hardware y no necesitan branching manual.
La nueva Generación de tarjetas como ya vimos anteriormente, incrementa el numero de SP (Streaming Processors), respecto a los nucleos G80 Y G92, pero ¿Cómo se llega a esta cifra?, en primer lugar incrementando el numero de TCP de 8 a 10 y en segundo lugar incrementando los SMs por TCP de 2 a 3, pero manteniendo el numero de SP por SM en 8. De esta forma sólo hay que multiplicar para obtener los 240 Streaming Processors de la GeForce GTX 280.
Todas estas mejoras en la arquitectura y numero nucleos han tenido tambien un impacto en el tamaño fisico del GTX200, puesto que una superficie de 576 mm² lo hacen un chips bastante grande en dimensiones, comparado con el núcleo de la Geforce 9800 GTX (G92-420) que también esta fabricado a 65nm pero con un área mucho inferior de sólo 330 mm², incluso el área es más grande que el G80 (90nm) de la 8800 Ultra que solo mide 484 mm², a pesar de utilizar un proceso de manufactura de mayor tamaño a nivel de transistores y respecto a esto ultimo, el tamaño del GT200 también se debe al numero de transistores que incorpora (1400 millones) que son mas de el doble del G92 (754 millones) y G80 (681 millones). Es por esto que segun se ha informado anteriomente, NVIDIA estaria preparando una version de 55nm del GT200 que deberia venir mas adelante.
Como ya vimos en los diagramas precedentes el núcleo de las GeForce GTX 280, consta de 240 cores o núcleos de proceso, estos a su vez pueden administrar en total miles de hilos de ejecución o threads de distinto tipo (pixel, vertex, geometría y computo), estos hilos de ejecución son administrados por el Threads Scheluder que se encarga de mantener todos los núcleos casi al 100%, además la arquitectura de la GPU posee tolerancia a la latencia, por ejemplo, si un thread queda esperando por acceso a memoria, el GPU puede cambiar a otro thread para procesar, de esta forma se mantiene una actividad constante sin sacrificar un núcleo por una tarea o thread en espera. Ahora bien cada unidad SIMT (single instruction, multiple thread)., dentro del SM (Streaming Multiprocessors), crea, administra, programa y ejecuta thread en grupos de 32 hilos paralelos “Paralell Threads” llamados “Warps”, es decir, hasta 32 warps por SM son soportados en las nuevas GeForce GTX 200 GPUs, comparado con los 24 warps por SM en las GeForce 8 y 9 Series. ¿Que quiere decir esto? básicamente una mejora 34% en las capacidades multi-hilo por cada SM de la GeForce GTX 280. En total la GeForce GTX 280 puede administrar hasta 1024 Thread por SM y si consideramos que en total la arquitectura tiene 30 SM (Streaming Multiprocessors), esto nos da un total de 30.720 Thread que puede administrar el GPU de las GeForce GTX 280.
Este es otro asunto muy importante en la nueva generación de tarjetas graficas, esta tecnología de computo exacto y preciso utilizada por ejemplo para aplicaciones científicas, de ingeniería y financieras es soportada por CUDA y hace uso de lo que se denomina Double-Precision o Precision-doble de 64-bit, a pesar de que el núcleo G80 soporta este tipo de cálculos, el soporte solo llega single-precision de 32-bit de computación de punto flotante (FP-32), las generaciones previas al G80, soportaban FP-16, en cambio con el GTX200 este soporte llega a los 64-bit pero con doble precisión. De esta forma cada uno de los 30 Streaming Multiprocessors (SMs) incorpora una unidad matemática de 64-bit Floating Point o FP-64.
Bueno quedamos hasta aquí con el análisis de la arquitectura, estos son los puntos mas destacables de la nueva generación, de todos modos esperamos que a pesar que puede resultar difícil de entender, hayas comprendido en parte como funciona por dentro el núcleo de las GeForce GTX 280.
Páginas: [1] 2 3 » Mostrar todos
última leída ahora activado. Si les gustó el review voten por el y compártanlo
A decir verdad es tremendo monstruo de tarjeta, no sólo por el tamaño sino que por su rendimiento, y eso que cuando estuve jugando con ella fue con drivers aún bastante inmaduros, distintos a los usados finalmente en el review.
Coméntenlo, compartanlo y distribuyando, porque pucha que costó hacerlo (un equipo de más de 5 personas trabajando juntos).
La verdad es que si es por rendimiento no convence. Esperar que el asunto de GP-GPU que cocina nVidia sea aun mas convincente como para que la gente se cambie a esta nueva arquitectura. Y a esperar que depara el modelo 260.
menuda tarjeta, de todas formas creo que es bueno esperar a ver lo que AMD tiene entre manos.
asimismo ver que ofrece la GTX 260.
TREMENDO REVIEW!! pero me ha dejado un poco Plof! Su rendimiento… esperaba más la verdad.
Impresionante el review.. como se nota que tenemos el tremendo equipo de reviewERS…
Independiente de que se haya esperado más o menos de esta tarjeta, yo creo que este será recordado como el salto a la computación multipropósito. Todo un Hito
No creo que “rinda poco”, pero sí que estamos acercándonos al punto donde cualquier VGA de gama media-alta rendirá IGUAL a bajas resoluciones. Aplicando filtros la cosa cambia a favor de la 280, pero lo que no me convence es el rendimiento. Ahora a esperar que bajen nada mas.
Aun quiero verla con drivers bien hechos y contra las 48xx
_________
Excelente review!
wena… me ubiese gustado estar en el momento de las pruebas… (como espectador) la tarjeta es genial, pero me esperaba mas rendimiento…
como se porta la 8800 ultra al lado de la 280???
se la come viva
eso te lo aseguro!
___________
Pregunta: Cuando saquen nuevos drivers, haran otro review?
excelente review cabros :P… pero hablando de la GTX280… me dejo con un fuerte gusto a poco… yo esperaba harto mas de esta tarjeta… pero bueno… ahora toca esperar a ver q’ tal son las HD48×0… a esas yo les tengo harta fe ![]()
quede un poco con gusto a poco, si bien rinde mucho, el consumo es como para ponerle una central nuclear al pc y alimentarla solo para esta vga, y ni hablar de un sli… estamos frente a una vga que tiene gran futuro pero que aun asi no es el salto que han significado otros lansamientos anteriores de Nvidia como lo fueron la 8800ultra con respecto a la 7900xx… o el espectacular rendimiento de la 8800gt con respecto al precio. solo queda ver como le va a la gtx260 ya que sera como el mejor ejemplo precio/rendimiento que pondra Nvidia con este lansamiento.
ahora solo queda ver como rinden las HD48xx de Ati para juntar para adquirir la mas conveniente.
gran review!!!!!
felicitaciones
Jajaja, bueno el review, me hubiera gustado ser el tester de algún juego ![]()
Esperaba más, pero QUIZAS la ram pudo haber cambiado: a 1066 para asegurarla.
Bueno, falta ver cómo se comportan 3 BESTIAS DE ESTAS!!!
Páginas: [1] 2 3 » Mostrar todos