Caratteristiche delle CPU
Le soluzioni server AMD sono flessibili, con la tecnologia Turbo core, Core select per selezionare da BIOS il numero di core visibili (per esempio per ridurre i costi di licenza software), svariate modalità di funzionamento di FLEX FP, partizionamento della Cache e nuove istruzioni HPC (FMA4 e XOP, esclusive di AMD, e AVX e di accelerazione crittografica, condivise con INTEL), TDP power CAP, per limitare la potenza dissipata dalle CPU con granularità di 1W, stato C6, per un minor consumo in IDLE, 6 classi di TDP per poter scegliere la CPU più adatta alle proprie esigenze, supporto per DIMM a basso e bassissimo voltaggio, supporto da 4 a 64 core per rack con stesso chipset (e quindi driver) per tutti i sistemi da 1 a 4 socket.
La tecnologia Turbo core si attiva sia con tutti i core attivi, nel qual caso consente un aumento da 300 a 500MHz a seconda dei modelli e con al massimo metà dei core attivi può arrivare fino a 1.2GHz (per il modello top di gamma a 16 core).
Come abbiamo visto nella presentazione dell’architettura Bulldozer, ogni modulo è dotato di una FPU condivisa, capace di eseguire istruzioni a 128 e 256 bit di due thread.
I set di istruzioni supportati dalla FPU sono:
- x87, MMX, SSE1, SSE2, SSE3, che è il set di istruzioni FPU e intero legacy, sia scalare che SIMD, supportato sia da AMD che INTEL;
- SSSE3, SSE4.1, SSE4.2, che è il set FPU e intero SIMD, supportato sia da AMD che INTEL, che consente di accelerare gli algoritmi video, biometrici e di elaborazione intensiva del testo;
- AESNI, PCLMULQDQ, che è il set di istruzioni, comune sia ad AMD che INTEL, per accelerare gli algoritmi criptografici, ed in particolare quelli AES;
- AVX, che è il nuovo set di istruzioni, condiviso sia da AMD che INTEL, con una nuova codifica estensibile, che consente di avere istruzioni FPU e intere SIMD sia a 128 che 256 bit, e che serve per accelerare le applicazioni di calcolo intensivo, come quelle HPC;
- FMA4, set di istruzioni esclusivo di AMD, che consente di effettuare operazioni di moltiplicazione e accumulo a 4 vie in una sola istruzione, accelerando di molto gli algoritmi che li richiedono, come la moltiplicazione di matrice e molti calcoli scientifici;
- XOP, set di istruzioni esclusivo di AMD, che contiene istruzioni per accelerare applicazioni multimediali, come sommatoria di vettori, estrazione di frazione e conversione per numeri FP a 16 bit, usati nelle schede video.
Questi ultimi insiemi di istruzioni sono stati progettati per aumentare la densità di calcolo per istruzione, per ridurre la necessità di copiare registri (solo FMA4) e per consentire la vettorizzazione automatica da parte dei compilatori.