NVIDIA GeForce GTX 750 Ti / GTX 750 “Maxwell” (GM107) hace su debut

Maxwell_arquitectura_08

Tal como estaba programado, hoy 18 de febrero NVIDIA lanza oficialmente sus tarjetas gráficas GeForce GTX 750 Ti y GeForce GTX 750, las primeras tarjetas basadas en la nueva arquitectura “Maxwell”, de la cual analizamos sus principales cambios y mejoras en este artículo, además de dejarles como de costumbre las especificaciones oficiales de las tarjetas y el respectivo listado de reviews y galería. [Actualizado]

Introducción a la Arquitectura Maxwell de primera generación.

Antes de seguir con la presentación de las tarjetas haremos una introducción a “Maxwell”. Esta es la arquitectura con la cual NVIDIA potenciará sus próximos lanzamientos, una arquitectura transversal en la cual viene trabajando desde hace bastante tiempo y que ha logrado dar una primera puesta a punto de cara a su debut en el mercado con las GeForce GTX 750 Ti / GTX 750, la primera generación de productos basados en Maxwell y que apuntan a satisfacer las necesidades de las tendencias actuales de videojuegos a full HD y entretenimiento en el hogar.

Maxwell_arquitectura_13

Maxwell en su primera iteración se presenta como una arquitectura altamente eficiente, enfocada en el bajo consumo y en un gran rendimiento comparado con las generaciones actuales, su objetivo de momento es cubrir la gama media-baja con la GTX 750 Ti y la GTX 750, pero posteriormente cuando TSMC haya refinado o comenzado la producción de nodos a 20nm, potenciará a la gama alta de tarjetas de NVIDIA, por lo tanto, de momento Maxwell sigue usando un proceso de manufactura de 28nm (TSMC).

Por tal razón y por no poder beneficiarse de un proceso de manufactura más eficiente, NVIDIA ha tenido que modificar y reorganizar la arquitectura en Maxwell, para hacerla internamente más eficiente en cuanto a consumo y disipación, al mismo tiempo que optimiza el rendimiento por núcleo para ofrecer ventajas comparativas respecto a los modelos basados en Kepler a los cuales reemplazara (GTX 650 Ti).

El primer GPU basado en Maxwell es -como ya les mencionamos en las notas respectivas- el “GM107” que es el núcleo principal de las nuevas GTX 750 Ti  / GTX 750. Productos en enfocados inicialmente en equipos compactos y de bajo consumo, como SFF PC (como las Steam Machines por ejemplo) enfocados en videojuegos y entretenimiento en el hogar, posteriormente también deberíamos ver derivados para notebook de este núcleo.

Según los indica la propia NVIDIA, la compañía ha aprendido bastante en el último tiempo/años acerca de la eficiencia energética y luego del desarrollo de “Fermi”, donde la eficiencia en consumo y disipación no era precisamente su principal virtud, NVDIA lanzo su arquitectura “Kepler” mucho más eficiente que Fermi, pero con el enfoque del mercado en los dispositivos móviles, NVIDIA debió aprender a desarrollar chips aún más eficientes por una clara tendencia del mercado.

Maxwell_arquitectura_10

Es así como “Maxwell” representa un poco estos años de aprendizaje y desarrollo de NVIDIA, donde ha aprendido a no sólo reducir el consumo promedio de energía de la GPU, sino que también a nivel de ingeniería, han podido extraer mucho más rendimiento de la arquitectura sin elevar el consumo de energía (eficiencia).

Maxwell será por lo tanto, la arquitectura con la cual NVIDIA afrontará sus futuros lanzamientos, como ya mencionamos una arquitectura transversal que no sólo dará forma a productos para el mercado de escritorio, también irá al mercado de supercomputadores, servidores, mercado profesional,  mercado de equipos portátiles (notebooks) y también servirá para futuros productos destinados al segmento de dispositivos móviles, que es donde actualmente apunta con más fuerza el mercado y las arquitecturas de NVIDIA desde Kepler convergen en esta tendencia.

Maxwell_arquitectura_15

 

Streaming Multiprocessors (SM) reorganizados.

Para lo que explicamos en los párrafos anteriores, NVIDIA ha tenido que realizar algunos cambios en la arquitectura de compontes internos de la GPU, y lo primero que hizo fue rediseñar y reorganizar las unidades Streaming Multiprocessors (SM) que hemos conocido desde la arquitectura de Fermi y la arquitectura de Kepler. En efecto, ahora cada SM ha sido dividido o particionado en cuatro bloques, cada uno de estos cuatro bloques con su respectiva lógica de control o “Control Logic” (Intruction Buffer, Warp Scheluder, Dispatch Unit, Register etc).

Cada uno de estos 4 bloques o SMX ahora poseen sólo 32 CUDA Cores para un total de 128 CUDA Cores por SMX (4 SM  x 32 CC = 128  CUDA Cores). En Kepler por ejemplo, cada SMX se dividía en 2 bloques de 96 CUDA Cores (192 CUDA Cores en total), pero eran administrados por una sola lógica de control o control logic.

Maxwell_arquitectura_01

Para que quede aun más claro, una sola lógica de control para 192 CUDA Cores, no era precisamente algo eficiente para el rendimiento y consumo en Kepler, por tal motivo, ahora con Maxwell el SMX se división en 4 particiones de 32 CUDA Cores y cada una con su propia lógica de control. De esta forma, en Maxwell ahora cada lógica de control, administra sólo 32 CUDA Cores y no 192 CUDA Cores de una vez como se hace en Kepler, como resultado NVIDIA ha incrementado el rendimiento punta por núcleo en un 35% comparado con Kepler, al mismo tiempo que permite reducir el consumo.

Maxwell_arquitectura_09clic para ampliar

Ahora bien en términos más generales, y tomando en consideración lo mencionado en los párrafos previos. El GM107 tiene en total 5 Streaming Multiprocessors (SM) con 128 CUDA Cores, por lo tanto, posee en total 640 CUDA Cores (5 SM x 128 CUDA Cores) y no 960/768 CUDA cores como se había comentado previamente. Este error fue debido a que la utilidad GPU-Z (que ya fue actualizada) leía a cada SMX como un solo bloque de 192 CUDA Cores, lo que multiplicado por 5 daba los 960 CUDA Cores.

Por lo tanto, la GeForce GTX 750 Ti utiliza un núcleo GM107 con todas sus unidades habilitadas y tiene en total 640 CUDA Cores (5 SMX), mientras que la GeForce GTX 750 posee 4 SMX o SMM para totalizar 512 CUDA Cores.

El resto del diseño de la arquitectura a nivel más periférico es igual a la de Kepler, organizando los SMX dentro de un GPC (Graphics Processing Cluster), con su respectivo Polymorph Engine 2.0 que incluye las unidades de Vertex Fetch, Tessellator, etc, las unidades de texturas, Raster Engine, controlador de memoria etc etc. Respecto a este ultimo componente, el GM107 posee solo 2 controladores de memoria de 64-bit (128-bit en total). Si desean leer mas detalles de estos elementos pueden revisar los artículos sobre la arquitectura de Fermi y la arquitectura de Kepler que hemos ya publicado en su momento, de todos modos dejamos una imagen de referencia (Kepler).

GeForce_GTX_680_PolyMorph_and_RasterEngine

 

Más memoria Cache L2 compartida.

Otro de las mejoras que nos indica NVIDIA en sus documentos es el incremento en la memoria cache L2. Maxwell incrementa dramáticamente la cantidad de memoria L2 de sólo 256KB en el GK107 (Kepler) a 2048 KB en el núcleo GM107.  Según NVIDIA con más memoria cache L2 en el chip, se requieren menos peticiones de acceso a la memoria gráfica de la tarjeta, esto reduce el consumo promedio de energía y mejora el rendimiento. Adicionalmente los ingenieros de NVIDIA ham hecho cambios más finos a nivel de transistores, para maximizar le eficiencia energética que como resultado implica que Maxwell entregue hasta 2 veces el rendimiento/watt que entrega Kepler y usando el mismo proceso de manufactura de 28nm.

Maxwell_arquitectura_06

Otros cambios a nivel interno de Maxwell son por ejemplo balancear los flujos de carga, mejorar el número de instrucciones por ciclo de reloj, mejorar el scheduling, mejorar el clock-gating granularity para reducir dinámicamente el consumo y disipación etc.

 

NVIDIA GM107, un chip de sólo 60W.

Ya les hemos reiterado varias veces en este informe que la principal virtud de Maxwell es la eficiencia, y de hecho el GM107 es un chip de sólo 60W, es decir, incluso requiere menos energía de lo que entrega el puerto PCI Express (75W) siempre y cuando trabaje en sus frecuencias por defecto, por tal razón, los modelos de la GeForce GTX 750 Ti (60W) y GeForce GTX 750 (55W) basados en el diseño de referencia no incorporan conector de alimentación PCIe de 6-pines, pero queda a criterio de cada fabricante poder incorporar este conector auxiliar de energía para ofrecer modelos personalizados con overclock de fábrica o dejarle esta tarea a cada uno.

Otro aspecto a destacar es que, segun nos indica NVIDIA sólo se requiere una fuente de 300W para que estas tarjetas puedan operar, aunque no especifica el voltaje requerido en la linea de los +12v. Otra cosa el chip GM107 se presenta en dos variantes, el GM107-400-A2 (GeForce GTX 750 Ti) de 60W y GM107-300-A2  (GeForce GTX 750) de 55W.

Maxwell_arquitectura_02

 

Mejorado Encoder de Video NVENC.

Este es el nombre del nuevo encoder de video que NVIDIA utiliza en todas sus tarjetas de video basadas en Kepler. Este motor basado en hardware ha sido mejorado y potenciado en Maxwell para codificar video H.264 en tiempo real con una velocidad de entre 6 a 8 veces comparado con la mejora de 4 veces que ofrecía en Kepler (respecto a encodeo mediante software) para videos de alta definición. Antes de Kepler y Maxwell, el encoding de video en las tarjetas GeForce era administrada por un software de encoding que hacía uso del array de CUDA Cores y mientras estas unidades son capaces de entregar un tremendo rendimiento en velocidad  comprado a una CPU realizando tareas de encoding, tenían la desventaja que incrementaba notablemente el consumo de energía. Mejoras en el cache de decodificación, una alta eficiencia de memoria, hacen la tarea de codificación más eficiente en términos energéticos en Maxwell.

GeForce_GTX_680_NVENC

Nuevo estado GC5.

Siguiendo con las mejoras en la eficiencia energética, NVIDIA se ha preocupado de mejorar el consumo hasta en las menos demandantes tareas, es así que Maxwell posee un nuevo estado de energía GC5 (Power State), el cual ha sido destinado a reducir el consumo de energía de la GPU, especialmente en casos de cargas de trabajo livianas como reproducción de video, lo cual según NVIDIA provee considerable ahorro de energía en los mismos escenarios respecto a GPU anteriores (Fermi, Kepler).

 

Kepler (GK107) versus Maxwell (GM107).

NVIDIA nos proporciona una útil comparación de las principales diferencias entre el núcleo GK107 (Kepler), versus el núcleo GM107 (Maxwell), las diferencias están a  la vista, pero podemos destacar por ejemplo el incremento en la potencia de cómputo, el número de unidades de textura, la tasa de relleno, la memoria cache L2 (que ya detallamos más arriba) y sobretodo el número de transistores, todo esto –y esta es la parte destacable- reduciendo incluso el TDP nominal del núcleo respecto a la variante basada en Kepler.

Maxwell_arquitectura_07

Lo anterior nos indica un fino trabajo hecho por NVIDIA con la primera generacion de la arquitectura Maxwell, con un chip mucho más completo, potente y eficiente, esto utilizando el mismo proceso de manufactura de 28nm e incluso reduciendo los requerimientos energéticos.

Maxwell_arquitectura_14

GeForce GTX 750 Ti y GeForce GTX 750

Maxwell_arquitectura_11

Luego de revisar los principales aspectos y mejoras de la arquitectura Maxwell de primera generación pasamos a revisar las características y especificaciones de las primeras tarjetas en beneficiarse de las bondades de Maxwell. Estas son las GeForce GTX 750 Ti que debuta a un precio de US$ 149 y GeForce GTX 750 que debuta a un precio de US$ 125, las cuales pretenden reemplazar a la actual GeForce GTX 650 Ti, de esta forma según indica NVIDIA la GeForce GTX 650 seguirá comercializándose y no será reemplazada por la GeForce GTX 750 como se había pensado previamente, tampoco será reemplazada la GeForce GTX 660 que también seguirá comercializándose.

Maxwell_arquitectura_05

 Especificaciones GeForce GTX 750 Ti y GeForce GTX 750.

Maxwell_arquitectura_03}

Maxwell_arquitectura_04

Especificaciones y precios respecto a la competencia.

Maxwell_arquitectura_12

 

Galería ensambladores.

A continuacion una galeria con los respectivos ensambladores, como ven hay una gran variedad de modelos, puesto que NVIDIA no exigio ceñirse estrictamente al modelo de referencia y los fabricantes pudieron optar por sus propias soluciones.

Reviews.

Luego del extenso y necesario artículo sobre la arquitectura Maxwell de primera generación, les dejamos como es tradicional con el listado de review de rendimiento.

Review GeForce GTX 750 Ti @ Anantech
Review GeForce GTX 750 Ti @ TechPowerUp!
Review GeForce GTX 750 Ti @ Guru3D
Review GeForce GTX 750 Ti @ PC Perspective
Review GeForce GTX 750 Ti @ Hexus

Actualizando…

Review GeForce GTX 750 Ti @ Tom’s Hardware
Review GeForce GTX 750 Ti @ OverClockers.com
Review GeForce GTX 750 Ti @ Hardware.info
Review GeForce GTX 750 Ti @ Hardware Canucks
Review GeForce GTX 750 Ti @ TechSpot
Review GeForce GTX 750 Ti @ Vortez
Review GeForce GTX 750 Ti @ Extremetech
Review GeForce GTX 750 Ti @ LanOC

Review GeForce GTX 750 Ti @ Hot Hardware
Review GeForce GTX 750 Ti @ Benchmark Reviews

Avance NVIDIA GTX 750 Ti
Cierra Irrational Games, los estudios detrás de la aclamada saga BioShock
  • Pingback: NVIDIA GeForce GTX 980 y GTX 970 “Maxwell” GM204 en profundidad! | MadBoxpc.com()

  • Ivan

    Oigan, se que hay algunos modelos de la 750Ti con un conector de 6-pin, aunque no haga overclock ni nada de eso es recomendable tener la targeta conectada al cable de 6-pin? Mejorara la estabilidad o perjudicara el consumo de energia?

     
  • Tino

    60W??? Saquen un modelo Low Profile por favor, y es mi proxima tarjeta! (aunque sea de la 750 común)
    ¿Como andará frente a una 7750? (que es lo mas potente que se consigue en Low Profile, y aun asi son muy dificiles de conseguir)

     
  • Ar.

    Creo que lo que apunta NVIDIA ahora mas que al rendimiento es al consumo y la verdad que sorprendió. Si bien la placa no tiene un gran rendimiento, el mismo es importante en relación a lo que consume.

    Una plaquita simple, chica, fresca, silenciosa y que puede usarse con cualquier PC ya que consume muy poco y no requiere conector auxiliar. Interesante!

     
  • O_o!

    2gb de cache L2?? mierda; q mi dios ateo me ampare!! q pasada.