CloudSigma GPU-as-a-Service

Preslav Dobrev2023-08-16 · 6 min read

CloudSigma consente ai clienti di aggiungere GPU alle proprie macchine virtuali e di utilizzare un calcolo ad alte prestazioni e conveniente in grado di soddisfare i carichi di lavoro più esigenti. Il cuore dell'offerta GPU di CloudSigma è la GPU NVIDIA A100 Tensor Core, ottimizzata per HPC, IA e analisi dei dati. L'A100 supera l'NVIDIA TESLA V100 e presenta nuove funzionalità di cui le applicazioni di IA possono trarre il massimo vantaggio. Consentiamo ai clienti di creare facilmente VM ottimizzate per NVIDIA A100 in modalità passthrough, in modo che le istanze VM abbiano il controllo diretto sulle GPU e sulla loro memoria integrata.

Casi d'uso

La crescita delle applicazioni ad alta intensità di calcolo in esecuzione nel cloud ha guidato la recente esplosione del cloud computing accelerato da GPU. Queste applicazioni includono l'addestramento e l'inferenza del deep learning per l'IA, l'analisi dei dati, il calcolo scientifico, la genomica, il rendering grafico e il gaming, solo per citarne alcune. Dall'aumento di scala (scaling-up) dell'addestramento dell'IA e del calcolo scientifico all'estensione (scaling-out) delle applicazioni di inferenza, fino all'abilitazione dell'IA conversazionale in tempo reale, le GPU forniscono la potenza necessaria per accelerare numerosi carichi di lavoro complessi e imprevedibili in esecuzione nel cloud.

La GPU NVIDIA A100 Tensor Core rappresenta un enorme balzo in avanti, offrendo un'accelerazione senza precedenti per l'IA, l'analisi dei dati e l'HPC a qualsiasi scala. Basata sull'architettura NVIDIA Ampere, l'A100 offre prestazioni fino a 20 volte superiori rispetto alla generazione precedente. CloudSigma rende disponibile la versione con memoria da 80 GB, la larghezza di banda più veloce al mondo con oltre 2 terabyte al secondo (TB/s) per eseguire i modelli e i set di dati più grandi.

Le GPU NVIDIA sono tra i principali motori di calcolo che alimentano l'IA, fornendo accelerazioni significative per i carichi di lavoro di addestramento e inferenza dell'IA. Inoltre, delle GPU NVIDIA accelerano molti tipi di applicazioni e sistemi di HPC e analisi dei dati, trasformando i dati in informazioni utili.

IA e HPC
Addestra modelli complessi di machine learning in modo più rapido ed efficiente con l'accelerazione GPU. Affronta attività ad alta intensità di dati e ottieni scoperte rivoluzionarie nell'innovazione guidata dall'IA.NVIDIA AI Enterprise è una suite end-to-end e cloud-native di software per l'IA e l'analisi dei dati, ottimizzata per consentire a qualsiasi organizzazione di utilizzare l'IA. È certificata per la distribuzione sul cloud pubblico e include un supporto aziendale globale per mantenere i progetti di IA sulla buona strada. L'A100 consente ai ricercatori di fornire rapidamente risultati reali e di distribuire soluzioni in produzione su scala.

ADDESTRAMENTO DEEP LEARNING
L'addestramento dei modelli di IA richiede una potenza di calcolo e una scalabilità enormi. I Tensor Core di NVIDIA A100 con Tensor Float (TF32) offrono prestazioni fino a 20 volte superiori rispetto a NVIDIA Volta con zero modifiche al codice e un ulteriore incremento di 2 volte con la precisione mista automatica e FP16.

Un carico di lavoro di addestramento come BERT può essere risolto su scala in meno di un minuto da 2.048 GPU A100, un record mondiale per il tempo di risoluzione.

Per i modelli più grandi con enormi tabelle di dati, come i modelli di raccomandazione di deep learning (DLRM), l'A100 da 80 GB raggiunge fino a 1,3 TB di memoria unificata per nodo e offre un aumento del throughput fino a 3 volte rispetto all'A100 da 40 GB.

La leadership di NVIDIA in MLPerf, che ha stabilito molteplici record di prestazioni nel benchmark di settore per l'addestramento dell'IA.

INFERENZA DEEP LEARNING
L'A100 introduce funzionalità rivoluzionarie per ottimizzare i carichi di lavoro di inferenza. Accelera una gamma completa di precisione da FP32 a INT4. La tecnologia Multi-Instance GPU (MIG) consente a più reti di operare simultaneamente su una singola A100 per un utilizzo ottimale delle risorse di calcolo. Inoltre, il supporto alla sparsità strutturale offre prestazioni fino a 2 volte superiori in aggiunta agli altri incrementi prestazionali di inferenza dell'A100.

Sui modelli di IA conversazionale all'avanguardia come BERT, l'A100 accelera il throughput di inferenza fino a 249 volte rispetto alle CPU.

Sui modelli più complessi vincolati dalla dimensione del batch, come RNN-T per il riconoscimento vocale automatico, la maggiore capacità di memoria dell'A100 da 80 GB raddoppia le dimensioni di ciascun MIG e offre un throughput fino a 1,25 volte superiore rispetto all'A100 da 40 GB.

Le prestazioni leader di mercato di NVIDIA sono state dimostrate in MLPerf Inference. L'A100 offre prestazioni 20 volte superiori per estendere ulteriormente tale leadership.

CALCOLO AD ALTE PRESTAZIONI
Per sbloccare le scoperte di prossima generazione, gli scienziati si affidano alle simulazioni per comprendere meglio il mondo che ci circonda.

NVIDIA A100 introduce i Tensor Core a doppia precisione per offrire il più grande balzo in avanti nelle prestazioni HPC dall'introduzione delle GPU. Con 80 GB della memoria GPU più veloce, i ricercatori possono ridurre una simulazione a doppia precisione di 10 ore a meno di quattro ore su A100. Le applicazioni HPC possono sfruttare TF32 per ottenere un throughput fino a 11X superiore per le operazioni di moltiplicazione di matrici dense a singola precisione.

Per le applicazioni HPC con i dataset più grandi, la memoria aggiuntiva di A100 80GB offre un aumento del throughput fino a 2X con Quantum Espresso, una simulazione di materiali. Questa memoria enorme e la larghezza di banda di memoria senza precedenti rendono l'A100 80GB la piattaforma ideale per i carichi di lavoro di prossima generazione.

ANALISI DEI DATI AD ALTE PRESTAZIONI
I data scientist devono essere in grado di analizzare, visualizzare e trasformare enormi set di dati in informazioni utili. Ma le soluzioni scale-out sono spesso rallentate da dataset sparsi su più server.

I server accelerati con A100 forniscono la potenza di calcolo necessaria — memoria enorme, oltre 2 TB/s di larghezza di banda di memoria e scalabilità con NVIDIA® NVLink® e NVSwitch™ — per affrontare questi carichi di lavoro. In combinazione con InfiniBand, NVIDIA Magnum IO™ e la suite di librerie open-source RAPIDS™, incluso RAPIDS Accelerator per Apache Spark per l'analisi dei dati accelerata da GPU, la piattaforma per data center NVIDIA accelera questi enormi carichi di lavoro a livelli di prestazioni ed efficienza senza precedenti.

In un benchmark di analisi dei big data, A100 80GB ha fornito informazioni con un incremento di 2X rispetto ad A100 40GB, rendendolo ideale per i carichi di lavoro emergenti con dimensioni dei dataset in rapida crescita.

SIMULAZIONI SCIENTIFICHE: Accelera la ricerca scientifica e le simulazioni, consentendo di ottenere informazioni e scoperte più rapide in fisica, chimica e scienze ambientali.

MEDIA E INTRATTENIMENTO: Esegui il rendering di grafica ad alta risoluzione, video e animazioni a velocità fulminea. Offri esperienze visive eccezionali al tuo pubblico senza compromettere la qualità.

MODELLAZIONE FINANZIARIA: Analizza vasti set di dati ed esegui modelli finanziari complessi con una velocità senza pari, fornendo informazioni fondamentali per decisioni informate.

Preslav Dobrev

Autore · CloudSigma

Preslav Dobrev è un designer creativo presso CloudSigma, con un focus su un'identità aziendale coerente attraverso l'uso di canali di marketing tradizionali e innovativi. È abile nel fondere la visione artistica con il marketing strategico per creare narrazioni di brand di grande impatto.

CloudSigma GPU-as-a-Service

Preslav Dobrev

Commenti