Ciao Mondo 3!

PNY GeForce GTX 480 - Architettura Fermi GF100

Indice articoli


Architettura Fermi “GF100”:

Il PCB della GeForce GTX 480 è lungo 26,6 cm, risultando pertanto leggermente più corta di una GTX 285.

Foto_PNY_GeForce_GTX_480__007

La Geforce GTX 480 ha una potenza di calcolo di circa 2,0 TeraFLOPS. Il TDP della scheda è di 250 Watt rientrando di poco nel limite dei 300 watt dettato dal PCI-SIG (il consorzio che stabilisce i parametri da seguire per lo sviluppo). Richiede un connettore di alimentazione ausiliario a otto pin e uno a sei pin.

Foto_PNY_GeForce_GTX_480__008

A questo proposito, si raccomanda l'uso di un alimentatore da almeno 600 watt per non incappare in spiacevoli sorprese. In caso di SLI di due GTX 480 raccomandiamo almeno un alimentatore di buona fattura da 800 watt.

I CUDA Core hanno preso il posto degli Streaming Processor (SPs), ma le funzionalità di base rimangono le stesse. Praticamente è solo cambiata la terminologia da parte di Nvidia.

Foto_PNY_GeForce_GTX_480__009

Osserviamo come  le unità Streaming Multiprocessor (SMs) prendono il posto delle unità Texture Processing Cluster (TPCs); anche questa è una nuova denominazione a livello di marketing. Nei documenti rilasciati da NVIDIA si fa riferimento al modello di GF100 che contempla 512 CUDA Core. Sappiamo che la GTX480 ha solo 480 CUDA Core attivi. Questo perché le rese produttive per i 512 CUDA Core sono allo stato attuale molto basse e costose per Nvidia.  Nel progetto originale GF100 è dotato di 512 CUDA core, derivati da quattro Graphics Processing Cluster (GPC), ognuno con quattro Streaming Multiprocessor (SM) equipaggiati di 32 core CUDA ciascuno. La GeForce GTX 480 invece incorpora 480 core CUDA. Pertanto dal progetto originale sono stati tolti 32 core. Nvidia ha raggiunto questa situazione disabilitando una SM sulla GTX 480.

Ogni SM è composto da 30 CUDA Core, quattro texture unit, 16 unità di Load/Store, quattro unità speciali (SFU), 64 KB di memoria e un PolyMorph Engine. Le unità SFU possono eseguire istruzioni come seno, coseno e radice quadrata, inoltre sono adibite anche all’interpolazione grafica.

Foto_PNY_GeForce_GTX_480__010

Ogni unità Streaming Multiprocessor (SM) ha al suo interno 30 CUDA Core, quattro unità di texturing, un PolyMorph engine e della cache dedicata.

Foto_PNY_GeForce_GTX_480__011

Il PolyMorph Engine è responsabile delle operazioni di Vertex Fetch, Tessellation, Viewport Transform, Attribute Setup, e Stream Output; in questo blocco logico possiamo trovare il Tessellator, probabilmente il più grande cambiamento richiesto a livello hardware e introdotto dalle DirectX 11 per le GPU di nuova generazione. Il PolyMorph Engine è distribuito in numero di quattro per ogni GPC per un totale di 16 unità.

Ogni singolo CUDA Core integra al proprio interno un Dispatch Port, una unità per la raccolta degli operanti, una unità in floating point e una per i calcoli interni oltre ad una result queue. Le elaborazioni interne ad ognuno di questi core sono eseguite con precisione IEEE-754 2008 per le operazioni in virgola mobile e a 32bit per quelle con interi: la risultante sono unità di elaborazione indipendenti per le due tipologie che sono pienamente compatibili con gli standard di mercato, caratteristica particolarmente utile non tanto in ambito gaming quanto in quello delle applicazioni GPU Computing.

In Fermi la capacità di elaborazione in double precision in virgola mobile è stata incrementata. Il valore di picco nell'esecuzione di codice a doppia precisione in virgola mobile è ora pari alla metà di quanto ottenibile in singola precisione.

Il sottosistema della memoria è costituito da sei memory controller a 64 bit (6 x 64 = 384 bit in totale), da una cache L2 e da 48 ROP; le ROP sono organizzate in sei gruppi da otto e sono rappresentate nello schema a blocchi dai rettangoli blu scuri adiacenti alla cache L2. Ogni gruppo di ROP è accompagnato da un Memory controller per un totale di sei.

Foto_PNY_GeForce_GTX_480__012

Per ogni streaming microprocessor troviamo una cache dedicata da 64 Kbytes di capacità, partizionabile come memoria condivisa e come cache L1: i rapporti sono 1:3 oppure 3:1. Il rapporto è funzione del tipo di applicazione che viene eseguita

Riassumiamo nella tabella sottostante le caratteristiche principali del chip GF100:

tabella3-GTX480

Le frequenze operative standard della GTX 480 sono pari a 700 MHz per il core e 924 MHz (3.96GHz reali) per i 1536 MB di ram. Il programma Gpu-z rileva correttamente tutte le caratteristiche della scheda.

Foto_PNY_GeForce_GTX_480__013

Pubblicità


Corsair

Articoli Correlati - Sponsored Ads