CloudSigma GPU-as-a-Service

Preslav Dobrev2023-08-16 · 5 min read

CloudSigma stelt klanten in staat om GPU's toe te voegen aan hun virtuele machines en gebruik te maken van krachtige, kosteneffectieve computing die kan voldoen aan de meest veeleisende workloads. Het hart van het GPU-aanbod van CloudSigma is de NVIDIA A100 Tensor Core GPU, geoptimaliseerd voor HPC, AI en data-analyse. De A100 presteert beter dan de NVIDIA TESLA V100 en heeft nieuwe functies waar AI-toepassingen optimaal van kunnen profiteren. We stellen klanten in staat om eenvoudig geoptimaliseerde NVIDIA A100 VM's te bouwen in passthrough-modus, zodat VM-instanties directe controle hebben over de GPU('s) en hun ingebouwde geheugen.

Gebruiksscenario's

De groei van rekenintensieve toepassingen die in de cloud draaien, heeft geleid tot de recente explosie van GPU-versnelde cloud computing. Deze toepassingen omvatten onder andere AI deep learning-training en -inferentie, data-analyse, wetenschappelijk rekenen, genomica, grafische rendering en gaming, om er maar een paar te noemen. Van het opschalen van AI-training en wetenschappelijk rekenen tot het uitschalen van inferentietoepassingen en het mogelijk maken van real-time conversationele AI: GPU's bieden de nodige rekenkracht om talrijke complexe en onvoorspelbare workloads in de cloud te versnellen.

De NVIDIA A100 Tensor Core GPU vertegenwoordigt een gigantische sprong voorwaarts en levert ongekende versnelling voor AI, data-analyse en HPC op elke schaal. Aangedreven door de NVIDIA Ampere-architectuur biedt de A100 tot 20X betere prestaties dan de vorige generatie. CloudSigma stelt de 80GB-geheugenversie beschikbaar, met 's werelds snelste bandbreedte van meer dan 2 terabyte per seconde (TB/s) om de grootste modellen en datasets uit te voeren.

NVIDIA GPU's behoren tot de toonaangevende rekenmotoren die AI aandrijven door aanzienlijke versnellingen te bieden voor AI-trainings- en inferentieworkloads. Daarnaast versnellen NVIDIA GPU's vele soorten HPC- en data-analysetoepassingen en -systemen, waardoor data wordt omgezet in inzichten.

AI en HPC
Train complexe machine learning-modellen sneller en efficiënter met GPU-versnelling. Pak data-intensieve taken aan en bereik doorbraken in AI-gestuurde innovatie. NVIDIA AI Enterprise is een end-to-end, cloud-native suite van AI- en data-analysesoftware die is geoptimaliseerd om elke organisatie in staat te stellen AI te gebruiken. Het is gecertificeerd voor implementatie in de openbare cloud en omvat wereldwijde enterprise-ondersteuning om AI-projecten op schema te houden. De A100 stelt onderzoekers in staat om snel resultaten uit de praktijk te leveren en oplossingen op schaal in productie te nemen.

DEEP LEARNING-TRAINING
Het trainen van AI-modellen vereist enorme rekenkracht en schaalbaarheid. NVIDIA A100 Tensor Cores met Tensor Float (TF32) bieden tot 20X betere prestaties dan de NVIDIA Volta zonder codewijzigingen en een extra 2X boost met automatische gemengde precisie (mixed precision) en FP16.

Een trainingsworkload zoals BERT kan op schaal in minder dan een minuut worden opgelost door 2.048 A100 GPU's, een wereldrecord voor de tijd tot een oplossing.

Voor de grootste modellen met enorme datatabellen, zoals deep learning-aanbevelingsmodellen (DLRM), bereikt de A100 80GB tot 1,3 TB aan uniform geheugen per node en levert deze tot 3X meer doorvoer dan de A100 40GB.

NVIDIA's leidende positie in MLPerf, waarmee meerdere prestatierecords zijn gevestigd in de sectorbrede benchmark voor AI-training.

DEEP LEARNING-INFERENTIE
De A100 introduceert baanbrekende functies om inferentieworkloads te optimaliseren. Het versnelt een breed scala aan precisie, van FP32 to INT4. Dankzij Multi-Instance GPU (MIG)-technologie kunnen meerdere netwerken tegelijkertijd op een enkele A100 werken voor een optimaal gebruik van de rekenbronnen. En ondersteuning voor structurele sparsiteit levert tot 2X betere prestaties bovenop de andere inferentieprestatieverbeteringen van de A100.

Op geavanceerde conversationele AI-modellen zoals BERT versnelt de A100 de inferentiedoorvoer tot wel 249X ten opzichte van CPU's.

Op de meest complexe modellen die beperkt zijn door de batchgrootte, zoals RNN-T voor automatische spraakherkenning, verdubbelt de grotere geheugencapaciteit van de A100 80GB de grootte van elke MIG en levert deze tot 1,25X hogere doorvoer dan de A100 40GB.

NVIDIA's marktleidende prestaties werden aangetoond in MLPerf Inference. De A100 brengt 20X betere prestaties om die leidende positie verder uit te breiden.

HIGH-PERFORMANCE COMPUTING
Om ontdekkingen van de volgende generatie te ontsluiten, kijken wetenschappers naar simulaties om de wereld om ons heen beter te begrijpen.

NVIDIA A100 introduceert double-precision Tensor Cores om de grootste sprong in HPC-prestaties te leveren sinds de introductie van GPU's. Met 80 GB van het snelste GPU-geheugen kunnen onderzoekers een double-precision simulatie van 10 uur terugbrengen tot minder van vier uur op de A100. HPC-toepassingen kunnen TF32 benutten om tot 11X hogere doorvoer te behalen voor single-precision, dense matrix-vermenigvuldigingsbewerkingen.

Voor de HPC-toepassingen met de grootste datasets levert het extra geheugen van de A100 80GB tot een 2X hogere doorvoer met Quantum Espresso, een materiaalsimulatie. Dit enorme geheugen en de ongekende geheugenbandbreedte maken de A100 80GB het ideale platform voor workloads van de volgende generatie.

HIGH-PERFORMANCE DATA-ANALYSE
Data scientists moeten in staat zijn om enorme datasets te analyseren, te visualiseren en om te zetten in inzichten. Maar scale-out oplossingen lopen vaak vertraging op door datasets die over meerdere servers verspreid zijn.

Versnelde servers met A100 bieden de benodigde rekenkracht—enorm geheugen, meer dan 2 TB/s aan geheugenbandbreedte en schaalbaarheid met NVIDIA® NVLink® en NVSwitch™—om deze workloads aan te pakken. Gecombineerd met InfiniBand, NVIDIA Magnum IO™ en de RAPIDS™-suite van open-source bibliotheken, inclusief de RAPIDS Accelerator voor Apache Spark voor GPU-versnelde data-analyse, versnelt het NVIDIA-datacentrumplatform deze enorme workloads met ongekende prestaties en efficiëntie.

Op een benchmark voor big data-analyse leverde de A100 80GB inzichten met een 2X toename ten opzichte van de A100 40GB, waardoor deze bij uitstek geschikt is voor opkomende workloads met exploderende datasetgroottes.

WETENSCHAPPELIJKE SIMULATIES: Versnel wetenschappelijk onderzoek en simulaties, wat zorgt voor snellere inzichten en ontdekkingen in de natuurkunde, scheikunde en milieuwetenschappen.

MEDIA EN ENTERTAINMENT: Render afbeeldingen, video's en animaties met een hoge resolutie in een mum van tijd. Lever uitzonderlijke visuele ervaringen aan uw publiek zonder in te leveren op kwaliteit.

FINANCIËLE MODELLERING: Analyseer enorme datasets en voer complexe financiële modellering uit met ongeëvenaarde snelheid, wat cruciale inzichten oplevert voor weloverwogen besluitvorming.

Preslav Dobrev

Auteur · CloudSigma

Preslav Dobrev is een creatief ontwerper bij CloudSigma, met de nadruk op een consistente bedrijfsidentiteit door middel van traditionele en innovatieve marketingkanalen. Hij is bedreven in het samenvoegen van artistieke visie met strategische marketing om impactvolle merkverhalen te creëren.

CloudSigma GPU-as-a-Service

Preslav Dobrev

Reacties