Tags: processorecpunvidiaoverclockamdIntelreviewrecensioneAsusi7LN2i5bulldozerfxpiledriverphase changeTrinityvishera81503770k835083203570k

die fx piledriverEra il mese di ottobre del 2011 quando AMD si accingeva a far debuttare la sua nuova architettura, meglio nota come Bulldozer, dove tantissime erano state le attese e le speranze di tanti appassionati del settore per avere un microprocessore in grado di competere ad armi pari con la rivale di sempre Intel. Ma la realtà dei fatti si contrappose con le aspettative e i core Bulldozer presenti in Zambesi non riuscirono a competere ad armi pari nei risultati che i vari benchmark restituivano, anche se il progetto Zambesi costò ad AMD un notevole sforzo nella realizzazione in quanto l’intera architettura non aveva più le precedenti basi che erano intrinseche nel progetto Phenom.

 

 

Benché il numero dei Core fisici sul modello di punta AMD FX-8150 fosse maggiore rispetto al processore di riferimento i7-2600K della controparte Intel, il prodotto AMD non riusciva a essere pienamente competitivo nei suoi confronti. Questo perché la CPU Intel pur avendo soltanto la metà dei core fisici, è equipaggiata con l’ormai collaudata tecnologia HyperTrading, che le consente di elaborare 8 threads contemporaneamente. Anche la politica di crescita TICK-TOCK ha permesso a Intel di mantenere un distacco in termini temporali e usufruire di un processo litografico più avanzato. Il progetto AMD Vishera è stato presentato qualche mese fa, ma in questa recensione andremo ad analizzare il modello immediatamente sotto quello di punta, ossia la CPU FX-8320 che AMD propone a un prezzo più competitivo.

 

AMD FX-8320 Prodotto recensito da Valter d'Attoma in data . Voto: 4

 


Un po’ di Bulldozer

 

AMD ha mantenuto anche per Vishera la sigla FX, ma naturalmente l’architettura ha subito un miglioramento che ha permesso di mantenere sui modelli di punta sempre gli 8 core fisici totali e allo stesso tempo d’incrementare la frequenza di lavoro, il tutto agendo sempre sullo stesso processo produttivo a 32nm SOI delle industrie GlobalFoundries grazie ad un affinamento dello stesso. Come è facile intuire AMD è stata in grado, pur mantenendo lo stesso TDP, di aumentare le frequenze operative; merito di un’architettura estremamente efficiente. Possiamo fare una prima distinzione nella tabella seguente tra il core Bulldozer (Zambesi) precedente e Piledriver (Vishera).

Tabella Confronto

AMD con il debutto della proprio progetto Bulldozer ha proposto per la prima volta un’architettura orientata a sistemi High-End, mentre dall’altra parte contrappone il progetto Bobcat che verrà adottato nelle proprie APU Brazos dove l’obiettivo principale è l’abbattimento dei consumi pur con un livello prestazionale di tutto rispetto. La nuova architettura Bulldozer in versione mobile in realtà non ha mai visto la luce se non con l’introduzione della APU della famiglia Trinity. L’architettura Bulldozer ha avuto il suo approccio nei sistemi Desktop, Server e Workstation.

Per capire meglio cosa c’è di diverso in Piledriver vediamo di richiamare l’architettura Bulldozer:

2 3

L’architettura del chip comprende quattro moduli, ognuno composto da due core e 2MB di cache L2 condivisa, un North Bridge che gestisce l’interconnessione tra tutti gli elementi del chip, una cache L3 condivisa da 8MB, un controller di memoria DDR3 dual channel e quattro controller HyperTransport, di cui uno solo attivo nelle CPU di classe desktop.

Lo scopo ultimo dei progettisti AMD era di massimizzare il rapporto performance per Watt, tenendo conto anche della superficie occupata. Questo è stato ottenuto in vari modi. Dall’analisi della letteratura è emerso che esiste una complessità ottimale della pipeline di un processore per avere il miglior rapporto performance per Watt.

Pipeline semplici e con un numero elevato di stadi consentono di avere clock alti, ma IPC (istruzioni per clock) bassi. Il consumo sale notevolmente all’aumentare del clock e quindi non si può innalzare troppo tale parametro, arrivando a un limite invalicabile sulle prestazioni.

Pipeline complesse e con pochi stadi sono più lente, ma hanno IPC elevati, bilanciando il clock più basso. Avendo un numero elevato di transistor, occupano più area del chip e consumano una parte superiore di energia in leakage (correnti di dispersione), dovuto al numero elevato di transistor. Questo si traduce anche in un’ulteriore limitazione per il clock massimo ottenibile.

La condizione ottimale è a metà strada tra questi due estremi ed è stato stabilito da vari studi teorici in letteratura. Un indice della complessità di una pipeline è il FO4, che indica quanto è il ritardo normalizzato di uno stadio di pipeline. Maggiore è questo numero, più complesso (e lento) è lo stadio della pipeline, e auspicabilmente meno stadi di pipeline sono necessari per implementare una data architettura.

Determinata la complessità ottimale della pipeline ora il problema è implementare la CPU con il minimo numero di transistor. Una delle cose che è stata fatta è la condivisione di tutte le unità sottoutilizzate. Questo è il motivo della nascita del modulo.

4 5

Nella figura di sinistra è visibile la classica implementazione di una CPU dual core, con la duplicazione della maggior parte delle componenti. Nella figura di destra è visibile uno schema a blocchi di un modulo Bulldozer.

Le unità che non sono utilizzate in pieno per la maggior parte del tempo sono state condivise tra i due core, potendo così anche renderle più potenti rispetto al caso di unità separate, poiché ora il budget di transistor si divide tra due core e quindi è possibile utilizzarne di più per una singola unità. Come visibile in figura, le unità condivise sono l’unità di fetch, l’unità di decodifica, l’unità Floating Point e la cache L2. Le cache L1 dati e le unità intere sono rimaste separate poiché si è stabilito che esse sono le unità più utilizzate di un core. Questo approccio consente di eseguire due thread con una velocità media pari all’80% rispetto al caso di core separati, in un’area di solo il 12% in più rispetto a quella di un singolo core (escludendo dal computo la cache L3, il North bridge e il controller RAM).

Abbassare il numero di transistor, abbassa il leakage e quindi consente clock più alti a parità di TDP. Ma per avere clock ancora più alti è necessario avere un risparmio energetico molto efficace. Le strategie implementate in Bulldozer sono le seguenti: clock gating estensivo delle reti logiche su tutto il die, ossia spegnimento del clock per le unità non utilizzate in un dato istante, power gating estensivo dei circuiti logici, ossia spegnimento anche dell’alimentazione elettrica per le unità non utilizzate in un dato istante, implementazione dello stato C6 di spegnimento dei moduli o dell’intero package, tramite anelli di transistor attorno alle unità, P-state di risparmio energetico o di turbo core, per avere in ogni istante il consumo ottimale in funzione del carico, caratteristica permessa dal modulo APM (advanced power management) che misura istante per istante il consumo del chip e determina il P-state ottimale, risparmio energetico dei moduli RAM ed infine stato di risparmio energetico C1E, in cui un core in idle consuma il meno possibile senza essere spento completamente.

Ultima caratteristica implementata in Bulldozer è il Turbo Core.

6

Il Turbo core si serve della unità APM per determinare quanto tempo la CPU può stare nel massimo stato di turbo possibile senza oltrepassare il consumo massimo stabilito. Quando sono utilizzati tutti i core, c’è quasi sempre qualche unità non utilizzata nel chip. L’unità APM calcola il budget di TDP e l’unità del turbo core, tramite un algoritmo di dithering, calcola quanto tempo la CPU può stare in stato di turbo senza oltrepassare il TDP. Se poi sono utilizzati la metà o meno dei core, lo stato di turbo utilizzabile prevede un clock ancor più elevato.


Piledriver: Architettura

 

Le nuove CPU Piledriver non vanno a rivoluzionare ciò che era stato fatto con l’architettura Bulldozer, ma è stata seguita la strada dell’evoluzione mantenendo tutto ciò che c’era di buono e migliorando per quanto possibile l’architettura. La rivoluzione dell’architettura avverrà più avanti con Streamroller, attesa nel corso del 2013.

die fx piledriver

All’interno del die troviamo un design del tutto simile a quanto avvenuto con la precedente architettura FX; abbiamo nuovamente la struttura a moduli già vista in Bulldozer. All’interno di ogni modulo vi sono due unità di calcolo Integer affiancate da una in Floating Point condivisa con precisione a 128bit. Ogni modulo include una memoria cache L2 dedicata, che è pari a 2 MB; troviamo altresì un’altra memoria cache L3 condivisa tra tutti i moduli che è pari a 8 Mbytes. Questo approccio consente di avere a disposizione 8 core Integer nei modelli FX-8300 series ed un numero di unità di calcolo Float Point pari a 4.

Come abbiamo avuto modo di appurare con Bulldozer l’ingegnerizzazione di questo tipo a moduli, dal punto di vista prestazionale può essere controproducente in alcuni scenari; tali casi possono essere realizzarsi nelle applicazioni che sono particolarmente dipendenti da particolari elaborazioni in virgola mobile. Gli ingegneri AMD hanno però ritenuto che elaborazioni come queste siano piuttosto rare in ambito consumer e desktop, privilegiando la parallelizzazione dei dati ma peggiorando gli scenari in cui si prevedono anche l’uso massiccio di istruzioni che richiedono la potenza di calcolo di un singolo core. I risultati anche da noi evidenziati nella recensione di Bulldozer ha messo in rilievo proprio questo fattore in contrapposizione alla grande potenza di elaborazione vista sulle CPU Intel che con la propria architettura hanno evidenziato un IPC molto elevato per singolo core. Le elevate frequenze di funzionamento, adesso ancora più evidenti con la CPU FX-8350, e il numero elevato di core fisici ha permesso comunque di bilanciare questo aspetto carente della CPU FX di AMD.

miglioramenti piledriver

AMD ben consapevole di questo limite appena esposto nella propria architettura, ha cercato di migliorare con Piledriver di incrementare l'IPC della propria CPU con una serie di ottimizzazioni architetturali interne; figurano tra queste un miglioramento della logica di hardware prefetcher, un incremento della L1 Translation Look-aside Buffer, miglioramenti vari nel branch prediction e nella  load queue.

Questi miglioramenti hanno reso Vishera più efficiente sia in termini di potenza elaborativa  sia in termini di assorbimento di corrente TDP; purtroppo il maggior freno per AMD è dovuto a GlobalFoundries e a un processo produttivo che a oggi è in ritardo di 18 / 24 mesi sulla tabella di marcia. Intel dal canto suo grazie alle molte fabbriche che possiede, nonché al know-out ed a notevoli investimenti nel campo della ricerca, riesce ad oggi a sfornare sul mercato processori molto più efficienti dal punti di vista della forza bruta di calcolo ma che come vedremo più avanti ben più costosi e quindi con un rapporto prestazioni/prezzo più alto e meno conveniente.

Tabella Confronto 2

Come si evince dalla tabella di confronto con i processori Intel un processo produttivo più avanzato permette di produrre un Die più compatto e nello stesso tempo a farci stare un numero maggiore di transistor e poiché sono più piccoli la produzione di calore sarà inferiore come anche la quantità di corrente richiesta sarà inferiore. 




 

Sistema di prova e metologia di test 

I processori di classe Vishera necessitano di schede madri con socket AM3+ ed all’occorrenza un semplice aggiornamento del Bios. AMD in questo è sempre stata più parca nei costi riuscendo  a limitare nel tempo il cambio di schede madri rispetto alla concorrente Intel. Come piattaforma hardware e per gentile concessione della Asus Italia, abbiamo usufruito della scheda madre Asus M5A99FX PRO 2.0. Di seguito l’elenco completo dei componenti utilizzato per i test.

Motherboard Feature 000

 

Questa scheda madre è dotata delle tecnologie più recentiCome il Dual Intelligent Power Control 3 (New Digi+). E’ un sistema che usufruisce di 2 processori per controllare digitalmente la potenza erogata

Feature 001 

Feature 002

Sono garantite ottime doti di overclock grazie ad un’erogazione digitale e controllata della potenza anche sul reparto delle memorie.

Feature 003

Oppure il sistema Remote GO! con il quale è possibile controllare con l’ausilio di un telecomando tutte le periferiche connesse al PC e quindi alla scheda madre potendo realizzare all’occorrenza un perfetto sistema Home Theater.

Feature 004

 

Feature 005 Feature 006

E grazie al nuovo standard UEFI è possibile impostare nel Bios in modo rapido e semplice tutte quelle voci ad oggi sconosciute ai più. Ed usufruire allo stesso tempo della veloce connessione USB 3.0.

 

Di seguito i componenti utilizzati come piattaforma di Test

Piattaforma Test

 
Abbiamo comparato la CPU AMD FX-8320 alle precedenti generazioni di CPU Intel ed AMD. Di seguito potete leggere i test che sono stati utilizzati per misurare le prestazioni della CPU AMD FX-8320
 

SINTETICI

 

  • 3DMark Vantage
  • AIDA64

 

COMPRESSIONE DATI E MULTIMEDIA

 

  • 7zip 9.20:
  • Winrar 4.01
  • Cinebench 11.5 e 10
  • X264 Benchmark HD 3.0
  • HandBrake 0.9.5
  • Fritz Chess
  • Blender
  • POV-Ray
  • Euler 3D
  • Sisoftware Sandra
 

Inoltre sono stati svolti alcuni test specifici di scaling sia per quanto riguarda l'uso di tipologie di memorie diverse.

 

L'impianto a liquido che abbiamo usato per i test è composto dai seguenti componenti:

Componenti Liquid Cooling






 

3DMARK VANTAGE


Il penultimo nato della serie 3DMark (della software-house Futuremark) mette in risalto le prestazioni dei processori soprattutto in ambito gaming, in questo caso abbiamo però esclusivamente effettuato i test relativi alla CPU (2 test), per i quali possiamo vedere che per quanto concerne i test effettuati alla frequenza default, le nuovissime CPU Sandy Bridge-E risultano essere le migliori.
3d mark vantage
La nuova CPU prodotta da AMD come evidenziato dal grafico soprastante, fa registrare il medesimo punteggio della nota CPU con architettura Bulldozer FX-8150. La CPU Intel i5-3570K rimane indietro mentre la CPU i7-3770K è avanti come punteggio globale.

 3d mark vantage

Interessante il test clock to clock dove si vede il miglioramento dell'architettura nuova rispetto alla precedente. In questo caso anche se il divario non è netto, indubbiamente la nuova architettura riesce ad avere la meglio sulla vecchia.


 

AIDA64 EXTREME ENGINEER

 

 

AIDA64 è l’ultima release dello strumento di test e controllo prodotto dalla FinalWire, il test effettuato in questo caso concerne il Memory Controller, le Memorie RAM e la cache della CPU.

aida64 read 

aida64 write

aida64 copy

aida64 latency

 Passando ai test effettuati sulla memoria, si può vedere come in questo caso la differenza rispetto al modello FX-8150 è pressochè nulla. Anche in questo caso rispetto alla precedente generazione non abbiamo avuto un passo avanti, nemmeno come latenze.


aida64 read 
aida64 write
aida64 latency
aida64 copy
 Stesso discorso fatto nel precedente test a default può valere anche nel confronto a 4 GHz. La nuova architettura Piledriver non riesce ad avvantaggiarsi rispetto alla vecchia architettura Bulldozer nello sfruttare la memoria. Notiamo come le latenze della L2 e L3 cache siano ancora più elevate rispetto alle soluzioni Intel di nuova generazione.

 


 

7zip 9.20


7zip è un ottimo tool che consente la compressione e la decompressione di files.

7zip 
Il test effettuato con 7zip mostra un lievissimo margine di miglioramento rispetto al modello FX-8150, in particolare nella fase di decompressione e riesce ad essere competitiva con le CPU Sandy Bridge. Si nota come invece le nuove architettura Ivy Bridge, dotate di Hyper Threading, siano ancora avvantaggiate in questo test.
 
7zip
Nel clock to clock notiamo che la nuova CPU FX-8320 riesce a migliorare i risultati fatti segnare dal modello FX-8150 di AMD, in particolare nella fase di compressione dati. Le nuove CPU AMD si difendono anche bene sia da Ivy Bridge sia da Sandy Bridge.

 

 


 

WINRAR 4.01  e 4.20

 
Classico tool anch’esso dedicato alla compressione e decompressione dei files nella sua versione stabile
winrar 4.01

winrar 4.20
 
La versione di WinRar 4.01 fa registrare degli ottimi risultati con il core parking ON, mentre disattivandolo non si notano miglioramenti degni di nota, al contrario delle CPU Intel dotate di 8 Thread. Molto interessante invece i risultati effettuati con la versione 4.20 dove vie è un sostanziale pareggio con le CPU Intel


winrar 4.01 

Situazione che ha ulteriore conferma anche nel caso impostando una frequenza fissa per questa CPU, la flessione non è ampia ma comunque evidente.


 

Cinebench 11.5



Grazie al software Maxton dedicato alla produzione di filmati Cinema 4D possiamo rilevare tutta la potenza computazionale del processore in esame.
cinebench 11
 
I risultati parlano da soli, sostanzialmente vi è un pareggio tra FX-8320 e FX-8150. Ottimo l'MP Ratio, ma rimane anche debole il punteggio su singolo core.

cinebench 11 

Nel clocl to clock si vede ancora meglio quanto detto in precedenza. Il punteggio su singolo core è decisamente sotto le CPU Intel e non differisce molto rispetto alla CPU FX-8150.

 


 

Cinebench 10

 

 Versione più vecchia del sopra citato Cinebench, in questo test possiamo notare il risultato concernente il ‘Processor Speed-up’,
cinebench 10
 
Stesso identico discorso si può benissimo applicare anche con la versione 10 di Cinebench, il risultato su singolo core appare un pò debole rispetto alle CPU avversarie.

cinebench 10 

 

Anche nel confronto clock to clock la sostanza rimane invariata rispetto a questo esposto in precedenza.


 

X264 Benchmark HD

 

Strumento che misura quanto rapidamente il nostro sistema riesce a codificare un piccolo filmato in qualità HD, questo benchmark ci riporta quanto accurato ed efficiente (in Frames Per Second) può essere la codifica.
x264 
Buono il risultato effettuato nel 2nd Run, ma nel complesso non abbiamo un margine elevato rispetto alla CPU FX-8150. Le CPU Intel però rimangono nettamente avanti in questo benchmark.
x264 hd

Nel clocl to clock qualcosa si muove e finalmente abbiamo il sorpasso con la gloriosa CPU AMD Phenom II X6 1100T, dove la CPU con architettura Bulldozer FX-8150 era perfino sotto.

 


HANDBRAKE

Software di transcodifica video multithread con il quale trasformeremo un file (un film) in MP4; il processo comprende codifica video x264, codifica audio FAAC e mux finale in contenitore MP4. Verrà preso in considerazione il tempo impiegato dalla CPU per svolgere questo compito.

handbrake

Ottimo il risultato fatto segnare dalla nuova CPU di AMD, che conferma quanto si era già visto con Bulldozer. La nuova architettura migliorata ha fatto segnare un punto a favore per questa CPU.

 

handbrake
Come è possibile evincere dai secondi effettuati, la nuova CPU di AMD a parità di frequenza con Bulldozer riesce ad avere un buon margine di miglioramento andando di fatto a competere con le CPU Intel Sandy Bridge. Le nuove CPU Ivy-Bridge appaiono invece ancora un pò distanziate, ma non in misura marcata. 


 

Fritz Chess

 
Fritz Chess è il più forte motore di scacchi ed è l’evoluzione di quello che ha affrontato il campione del mondo Vladimir Kramnik nel Bahrain nell’ottobre del 2002. Milioni di appassionati di scacchi hanno guardato le partite in diretta in Internet. Fritz è stato capace di pareggiare il match (4:4), e Kramnik ha mostrato tutto il suo rispetto per la performance di Fritz quando ha detto: “DeepFritz è più forte di DeepBlue!” Il nuovo motore del Fritz8 si basa appunto su quella versione “Bahrain” ed è stato ulteriormente migliorato nel gioco posizionale.

 
fritz chess
Prestazioni del tutto allineate alla precedente generazione FX, dove il risultato è praticamente il medesimo. Le CPU Intel Sandy Bridge sprovviste di tecnologia Hyper Threading sono dietro le nuove AMD FX ma non quelle che sono equipaggiate con questa collaudata tecnologia.

 
frtiz chess


Ancora una volta abbiamo la medesima conferma anche ad una frequenza di 4 GHz, dove i risultati sono del tutto simili alla situazione di default.


 

Blender 2.60

 
Blender è un programma open source di modellazione, rigging, animazione, compositing e rendering di immagini tridimensionali. Dispone inoltre di funzionalità per mappature UV, simulazioni di fluidi, di rivestimenti, di particelle, altre simulazioni non lineari e creazione di applicazioni/giochi 3D. È disponibile per vari sistemi operativi: Microsoft Windows, Mac OS X, Linux, FreeBSD, assieme a porting non ufficiali per BeOS, SkyOS, AmigaOS, MorphOS e Pocket PC. Blender è dotato di un robusto insieme di funzionalità paragonabili, per caratteristiche e complessità, ad altri noti programmi per la modellazione 3D.

 blender

Rispetto alla passata generazione di CPU Bulldozer abbiamo un miglioramento del single core test, però nel complesso vediamo che rimane ancora lontana rispetto anche da Ivy Bridge i5-3570K.

blender
Questo test ci mostra che il margine di miglioramento rispetto alla precedente generazione è stato effettuato, anche se nel complesso non in misura elevata, ma questo però garantisce performance di buon livello anche nel multi core.

 


 

POV-Ray 3.7

 
POV-Ray è un programma di ray tracing disponibile per una gran varietà di piattaforme. Era originariamente basato su DKBTrace, un programma sviluppato da David Kirk Buck and Aaron A. Collins. È stato anche influenzato pesantemente dal programma di ray tracing Polyray con il beneplacito del suo autore, Alexander Enzmann. Nelle versioni più recenti il motore di rendering è stato aggiornato profondamente per consentire il calcolo della illuminazione globale, delle caustiche, ed di elementi particellari per generare nubi, fuoco, vapore. Fa ora uso del multithreading, quindi si avvantaggia della presenza sul computer di processori multicore o più processori.

pov ray 

Piccolo miglioramento anche con questo test, dove il buon risultato fatto segnare dalla CPU Bulldozer è ulteriormente rinforzato da questa nuova architettura. Sarà interessante osservare la sfida nel clock to clock nel test che segue.

pov ray 
Come già anticipato, la nuova CPU FX-8320 fa segnare davvero un ottimo risultato distanziando di un buon margine la CPU FX-8150 ed avendo prestazioni pari alle più moderne CPU Intel Ivy Bridge. Sandy Bridge rimane nettamente indietro.


 

Euler 3D

 
È un software che può trattare numeri reali, complessi, intervalli di numeri, matrici ed array. Traccia diagrammi 2D/3D ed include un moderno linguaggio di programmazione. Tutte le versioni di EULER sono freeware con licenza GNU. EULER è molto simile a Matlab, ma l’autore tiene a precisare che non si tratta di un suo clone. Euler 3D è utilizzato per analisi di fluidodinamica, dotato di una modalità di benchmarking integrata liberamente utilizzabile che sfrutta tutti i core e thread a disposizione del processore.

 euler 3d
Il miglioramento rispetto a Bulldozer è abbastanza netto, però non tale da far guadagnare molte posizioni nella nostra classifica. La FX-8320 ha prestazioni equivalenti rispetto ad una CPU Intel i7-860 o i5-2400.


euler 3d 
Nel confronto clock to clock appare evidente come il miglioramento ci sia stato nei confronti della vecchia generazione, facendole guadagnare un pò di posizione, ma sullo stesso livello di Sandy Bridge ma ancora non ai livelli di Ivy Bridge.

 


 

Sisoft Sandra: Crittografia Dati

 

SiSoftware Sandra (System Analyser, diagnostica e Reporting Assistant) è uno strumento di diagnostica che permette di fornire informazioni dettagliate sulla configurazione hardware e software del computer. Un anno fa, SiSoftware rilasciò Sandra 2010 offrendo pieno supporto a Windows 7; a 18 mesi dal lancio di Windows 7, abbiamo assistito ad una vera e propria incoronazione del PC ad hub multimediale. Pochi mesi fa è stato rilasciato un benchmark dedicato alle unità Blu-Ray, ora gli autori si sono focalizzati sulla realizzazione di un nuovo benchmark: il Media Transcoding basato sulle Media Foundation di Windows 7. A tutto è stato affiancato un nuovo benchmark (Crittografia GPGPU) che permette un confronto diretto tra le prestazioni registrate dalla CPU (utilizzando i set di crittografia disponibili) e quelle della GPGPU.

sisoft sandra 

La differenza con le CPU prive di codifica hardware è netta, ma rispetto alla vecchia architettura Bulldozer non abbiamo quel surplus che si poteva aspettare. Nella codifica SHA sia rispetto a Sandy Bridge sia rispetto ad Ivy Bridge. Abbiamo solo un pareggio con codifica AES 256 ma solo per le CPU i5.
 
sisoft sandra

Situazione analoga vista nel caso precedente, un leggero miglioramento rispetto all'architettura Bulldozer nella codifica AES 256 ed un sostanziale pareggio con le CPU Intel i5.

 

 


 

Scaling variando frequenza delle Memorie

  

In questa pagina abbiamo deciso di approfondire un argomento che spesso lascia molta confusione nei lettori, ossia come cambiano le prestazioni al variare del tipologia di memoria installata. In questo caso per tipologia si intende moduli che differiscono tra loro per la frequenza operativa. Per tutte le piattaforme abbiamo deciso di effettuare test computazionali con memorie impostate alle seguenti frequenze e relativi timings:


1333 MHz CL. 7-7-7-20 1T
1600 MHz CL. 8-8-8-22 1T
1866 MHz CL. 9-9-9-24 1T

 

I software di riferimento che abbiamo utilizzato vedono in primis AIDA64, dove abbiamo analizzato la banda passante (Bandwidth) per lettura, scrittura, copia e i tempi di accesso alla memoria. Il secondo software è WinRar 4.01 (versione stabile), che notoriamente riesce a ottenere buoni incrementi prestazionali con memorie più veloci. L’ultimo software che abbiamo usato è Cinebench R 11.5 dove abbiamo verificato il punteggio in multi core.

Potete osservare di seguito i grafici relativi ad AIDA 64 dove viene analizzata la banda passante e gli access time:

aida64 read

aida64 read

aida64 copy

aida64 latency

 In linea generale notiamo come i valori fatti registrare da questa CPU siano leggermente superiori rispetto al modello FX Bulldozer. Si nota anche come riesce a sfruttare un po' meglio le memorie a bassa frequenza e latenza rispetto alla vecchia architettura.

 

Il secondo software di riferimento è il noto programma di compressione/decompressione WinRAR, dove in effetti per tutte le architetture si sono evidenziati degli aumenti prestazioni al salire della frequenza della memoria di sistema. Potete osservare di seguito il grafico che abbiamo realizzato:

winrar 

 

 

Dal grafico è possibile evincere che per tutte le piattaforme i risultati migliori si ottengono usando memorie più spinte, questo perché WinRAR è uno dei software dove le prestazioni migliorano quando si vanno ad utilizzare memorie dalla frequenza elevata, che garantiscono quindi una bandwidth maggiore. La nuova CPU di casa AMD fa segnare risultati in linea con la precedente architettura; notiamo solo una leggera flessione con memorie a 1333 MHz.

 

Infine il software Cinebench in versione 11.5 realizzato da Maxon che utilizza un motore di rendering Cinema 4D. Il benckmark, liberamente scaricabile dal sito del produttore, ci permette di effettuare un confronto, in questo caso sul multicore, sulle varie CPU provate. Possiamo osservare i risultati che ci ha fornito tale software:

cinebench 

  

Con Cinebench si vede chiaramente che le memorie non hanno alcun effetto sul risultato finale, infatti per le piattaforme non abbiamo differenze sostanziali tra l’usare memorie da 1333 MHz ed usare memorie alla frequenza di 1866 MHz. E' emblematica la situazione delle due CPU FX, che fanno segnare risultati perfettamente combacianti.

 


Overclock

Come test di overclock estremo ci siamo avvalsi dell’azoto liquido per ovviare al problema temperatura e portare il processore di parecchi gradi sotto lo zero. Ricordiamo che Vishera, come anche il suo predecessore Bulldozer, non soffrono del noto problema di Cooldboot su cui molti incappano mettendo sotto azoto i processori Intel. Per questo le uniche limitazioni per salire di frequenza sono dettate dalla bontà della CPU o per essere più precisi dalla purezza del processo di drogaggio effettuato sul singolo chip.

Spi 1M14781

 

Pifast2305

Con l’aiuto dell’azoto liquido quale mezzo estremo di dissipazione del calore, con un’opportuna coibentazione, abbiamo dapprima impostato la frequenza del processore sulla soglia dei 5 GHz e con un voltaggio di 1,55V in piena stabilità siamo entrati in Windows. Verificato con qualche test come Wprime32 la capacità del processore a salire di frequenza, abbiamo effettuato più tentativi avvalendoci del comodo tool dell’ASUS TurboV Evo per “capire” i giusti bilanciamenti tra frequenza e voltaggi vari della CPU tenendo comunque d’occhio la RAM. Purtroppo non siamo riusciti a superare la soglia di frequenza di oltre 6100 MHz di cui abbiamo pubblicato 2 screen dei noti tool di benchmark utilizzati nelle gare di Overclock sul noto sito Hwbot.org. Quando si raggiungono tali frequenze, fattori molto importanti sono la qualità non solo del processore e del grado di purezza della fase di “drogaggio”, ma anche i componenti che partecipano attivamente al risultato finale. In questo caso possiamo dire che se avessimo avuto una scheda madre della serie ROG, grazie ad una sezione di alimentazione più performante in quanto vengono progettate e costruite per operare a regimi estremi, sicuramente avremmo ottenuto risultati molto più interessanti.

Ricordiamo che chi effettua i test di overclock lo fa a proprio rischio e pericolo ed invalida chiaramente la garanzia sui componenti e le rotture degli stessi vanno messe in conto.

 

 


 

Conclusioni




argento




 

Prestazioni 4 stelle
Efficienza 4,5 stelle
Overclock 4 stelle - copia
Prezzo 4 stelle - copia
Complessivo 4 stelle - copia

 


Riteniamo che AMD abbia fatto un ottimo lavoro di ingegnerizzazione su questa architettura, merito anche del buon progetto di partenza, quale Bulldozer, realizzato completamente da zero. Purtroppo il ritardo temporale che ha AMD su Intel circa i processi di produzione che sono fermi a 32nm nonché la produzione che è effettuata all’esterno da GlobalFoundries, non agevola di certo AMD nel proporre processori che palesemente non possono competere dal punto di vista della forza bruta, ossia nella potenza elaborativa. Sicuramente possiamo dire e confermare che lo step Vishera recensito in questo articolo ha tutte le carte in regola per aggraziarsi un buon numero di utenti che cercano una piattaforma affidabile, economica e con un ottimo rapporto qualità/prezzo, campo su cui al momento AMD non ha grandi problemi. La CPU AMD FX-8320 si è comportata bene nei test che riescono a sfruttare la presenza degli otto core presenti ed è bene che l'acquirente consideri se le applicazioni e software utilizzati godono o meno della presenza di un elevato numero di core. Il salto prestazionale generale dall'architettura Bulldozer non è netto, anzi, è solo marginale, ed è consigliabile orientarsi verso questo nuovo processore solo se si proviene da una CPU non di fascia alta della passata generazione, o anche Phenom / Athlon quad-core o dual-core. Da non dimenticare inoltre che questi processori possono dare grandi soddisfazioni agli overclockers più estremi, dove si possono raggiungere e superare frequenze di oltre 8 GHz!! Tenendo in conto quanto detto, l'FX-8320 a circa 160/170 euro può essere un acquisto sicuramente da tenere in considerazione in virtù del fatto che la concorrenza offre si CPU più performanti, ma con un rapporto prezzo prestazioni peggiore.

 


PRO

  • Prezzo
  • Propensione all’overclock


CONTRO

  • Performance non ancora a livello dei processori Intel

 

 

 

Un ringraziamento va ad AMD per il sample offertoci.

Valter d’Attoma