L’utilizzo delle GPU per applicazioni che non sono quelle tradizionali della grafica 3D è un fenomeno ben noto tanto agli appassionati come a chi è impegnato nel settore del calcolo parallelo.
Nel confronto con le tradizionali architetture di CPU le GPU si sono dimostrate essere unità di elaborazione molto specifiche, in grado di assicurare un netto incremento delle prestazioni velocistiche per quegli scenari di utilizzo che sfruttano al meglio l’elevato parallelismo proprio delle GPU. Molte delle funzionalità implementate tanto da NVIDIA come da AMD nelle proprie più recenti architetture GPU puntano proprio nella direzione di fornire superiori prestazioni in ambito di elaborazione parallela non grafica.
Negli ultimi anni è inoltre emerso con grande enfasi il tema del cosiddetto machine learning, cioè quel filone del supercalcolo che vede i sistemi di elaborazione impegnati ad analizzare una mole elevatissima di dati e da questi derivare comportamenti pratici. Un esempio popolare nel mondo consumer è il lavoro legato alla guida autonoma, nel quale dispositivi di calcolo integrati nelle automobili apprendono costantemente come potersi muovere nel traffico automobilistico così che l’autista possa diventare un passeggero a tutti gli effetti. La mole di calcoli e di informazioni che questo tipo di approccio richiede è elevatissima, e da questo deriva l’utilizzo delle GPU quale acceleratore che permetta di andare oltre i limiti propri delle tradizionali CPU in questo tipo di compiti.
L’intelligenza artificiale è tema che spinge in modo netto verso l’evoluzione tecnologica e richiede sistemi di calcolo sempre più complessi. Per questo motivo AMD annuncia quest’oggi l’iniziativa Radeon Instinct, con la quale vuole offrire un proprio approccio completo legato all’intelligenza artificiale nel complesso. Il primo blocco di questa struttura è ovviamente legato alle soluzioni hardware: AMD annuncia 3 nuove schede di questa famiglia, caratterizzate da una costruzione particolare adatta per l’utilizzo in datacenter e basate su 3 GPU AMD molto particolari.
Radeon Instinct MI6 è la prima scheda della famiglia, modello per il quale l’azienda dichiara una capacità di elaborazione di 5,7 TFLOPs di picco a FP16 con bandwidth della memoria video di 224 GB/s e un TDP pari a meno di 150 Watt. Queste specifiche tecniche lasciano immediatamente capire come sotto la scocca vi sia una GPU Polaris 10, cioè lo stesso modello utilizzato nelle schede Radeon RX 470 e Radeon RX 480 in abbinamento a memoria video GDDR5 con clock effettivo di 7 GHz. AMD non lo specifica ma è probabile che questa scheda sia dotata di 8 Gbytes di memoria video, anche se non è da escludere che tale quantitativo possa essere pari a 16 Gbytes.
La seconda scheda è Radeon Instinct MI8, modello di tipo small form factor molto compatta: per questa scheda la potenza dichiarata è pari a 8,2 TFLOPs di picco a FP16, con memoria video capace di 512 Gbytes al secondo di bandwidth e un TDP dichiarato entro 175 Watt. Facile ritrovare in queste specifiche tecniche la scheda Radeon R9 Nano, modello basato su GPU Fury in abbinamento a memoria HBM in quantitativo di 4 Gbytes.
Raja Koduri, CTO di AMD per il Radeon Technologies Group, mostra un prototipo di scheda Radeon Instinct MI25
La terza scheda è probabilmente la più interessante: si tratta della soluzione Radeon Instinct MI25 Vega with NCU, così la identifica AMD nel proprio materiale di presentazione, ed è questa la prima scheda basata su GPU Vega che viene ufficialmente annunciata da AMD. Le specifiche tecniche indicate sono poche: la scheda è raffreddata passivamente e viene indicato un TDP inferiore a 300 Watt; è presente una memoria cache di tipo High Bandwidth assieme ad un controller specifico, mentre dal versante prestazionale è riportato un raddoppio delle prestazioni nell’elaborazione di packed math anche se manca un riferimento diretto a quale sia la scheda con la quale questa proposta viene confrontata.
Queste schede verranno costruite unicamente da AMD, senza quindi il coinvolgimento diretto dei partner: si tratta di una scelta quasi naturale considerando la complessità dei prodotti e il target di riferimento. Al momento attuale l’azienda americana non ha divulgato i prezzi di questi 3 nuovi acceleratori della famiglia Radeon Instinct, segnalando che il debutto sul mercato avverrà nel corso della prima metà del 2017.
La componente hardware è solo uno degli elementi che compongono l’iniziativa Radeon Instinct: MIOpen è il nome con il quale viene indicata la libreria open source per il deep learning abbinata alle soluzioni hardware Radeon Instinct proposta da AMD, soluzione che alla luce dei dati preliminari forniti da AMD permette di ottenere un livello prestazionale molto elevato nel complesso anche nel confronto con le soluzioni concorrenti basate su GPU NVIDIA. AMD prevede di rendere disponibile questa libreria nel corso del primo trimestre 2017, offrendo accelerazione delle elaborazioni via GPU con routine standard come quelle di convultion, pooling, activation functions, normalization e tensor format.
Più in generale quello che AMD propone con la piattaforma Radeon Open Compute è una soluzione che sfrutta le peculiarità hardware delle schede della famiglia Radeon Instinct abbinandovi i componenti richiesti dalle differenti applicazioni legate all’intelligenza artificiale. AMD ha chiaramente indicato come quello che vuole sviluppare sia un ecosistema open, nel quale possano venir utilizzati frameworks, middleware e librerie che sono già adottate dagli sviluppatori: emerge in modo chiaro la contrapposizione con l’ecosistema proprietario sviluppato da NVIDIA, che nelle intenzioni di AMD non rappresenta la strategia da seguire.
AMD ha già annunciato partnership con vari produttori di sistemi di supercalcolo per integrare soluzioni Radeon Instinct all’interno di proprie soluzioni. Un primo esempio è il sistema SuperMicro SYS 1028GQ-TRT, dotato al proprio interno di 3 acceleratori MI25 in abbinamento a due processori x86 che massimizza la potenza di elaborazione sfruttando uno chassis rack a 1 unità.
Il sistema K888 integra 4 schede Radeon Instinct MI25 ed è indicato essere capace di raggiungere una potenza di elaborazione di 100 TeraFLOPs con elaborazioni FP16: da questo dato, oltre che dallo studio dei nomi scelti da AMD per identificare queste schede, ne deriva la potenza di elaborazione di una singola scheda MI25 con GPU Vega che è pari a 25 TFLOPs con calcoli FP16.
Aumentano le dimensioni con il sistema Falconwitch: grazie all’integrazione di 16 schede Radeon Instinct MI25 si toccano i 400 TFLOPs di picco in uno chassis di dimensioni importanti ma che dalle immagini non dovrebbe occupare più di 7 unità rack.
Usando una soluzione ad armadio rack a 42 unità Inventec arriva a offrire una potenza di calcolo di picco di 3 TeraFLOPs, integrando ben 120 schede Radeon Instinct MI25. Una proposta di questo tipo, nell’ottica di AMD e dei propri partner in questo settore, mira a offrire potenze di elaborazione da supercomputer in cluster di notevole complessità mantenendo gli ingombri complessivi all’interno di un singolo armadio rack così da facilitarne l’installazione in ambienti dedicati e non necessariamente in un grande datacenter.
Da ultimo, uno sguardo in avanti alla metà del prossimo anno porta in modo pressoché naturale ad un abbinamento tra acceleratori Radeon Instinct e le future CPU AMD per sistemi server basate su architettura Zen, indicate con il nome in codice di Naples. Un abbinamento di questo tipo permetterà, secondo AMD, di ottenere una piattaforma di riferimento nel mondo delle elaborazioni di intelligena artificiale minimizzando dimensioni e latenza, con positive ricadute in termini di costi. Ma prima che questo avvenga sarà necessario attendere ancora alcuni mesi: AMD infatti annuncia quest’oggi la prima soluzione basata su GPU Vega ma la commercializzazione avverrà nel corso della prima metà del 2017, tempistica che del resto è allineata a quella di introduzione delle soluzioni server basate su piattaforma Naples.