CloudSigma GPU-as-a-Service

Preslav Dobrev2023-08-16 · 6 min read

A CloudSigma permite que os clientes adicionem GPUs às suas máquinas virtuais e utilizem computação de alto desempenho e excelente custo-benefício que pode atender às cargas de trabalho mais exigentes. O coração da oferta de GPU da CloudSigma é a GPU NVIDIA A100 Tensor Core, otimizada para HPC, IA e análise de dados. A A100 supera a NVIDIA TESLA V100 e possui novos recursos dos quais as aplicações de IA podem tirar o máximo proveito. Permitimos que os clientes criem facilmente VMs otimizadas com NVIDIA A100 em modo passthrough, para que as instâncias de VM tenham controle direto sobre a(s) GPU(s) e sua memória integrada.

Casos de uso

O crescimento de aplicações de computação intensiva executadas na nuvem impulsionou a recente explosão da computação em nuvem acelerada por GPU. Essas aplicações incluem treinamento e inferência de deep learning de IA, análise de dados, computação científica, genômica, renderização de gráficos e jogos, para citar apenas alguns. Desde o escalonamento vertical (scaling-up) do treinamento de IA e da computação científica até o escalonamento horizontal (scaling out) de aplicações de inferência e a viabilização de IA conversacional em tempo real, as GPUs fornecem a potência necessária para acelerar inúmeras cargas de trabalho complexas e imprevisíveis executadas na nuvem.

A GPU NVIDIA A100 Tensor Core representa um salto gigante, oferecendo uma aceleração sem precedentes para IA, análise de dados e HPC em qualquer escala. Alimentada pela arquitetura NVIDIA Ampere, a A100 oferece um desempenho até 20X maior do que a geração anterior. A CloudSigma disponibiliza a versão com 80GB de memória, a largura de banda mais rápida do mundo com mais de 2 terabytes por segundo (TB/s) para executar os maiores modelos e conjuntos de dados.

As GPUs NVIDIA estão entre os principais motores computacionais que impulsionam a IA, proporcionando acelerações significativas para cargas de trabalho de treinamento e inferência de IA. Além disso, as GPUs NVIDIA aceleram muitos tipos de aplicações e sistemas de HPC e análise de dados, transformando dados em insights.

IA e HPC
Treine modelos complexos de aprendizado de máquina de forma mais rápida e eficiente com a aceleração por GPU. Enfrente tarefas intensivas em dados e alcance avanços na inovação impulsionada por IA.O NVIDIA AI Enterprise é uma suíte de software de IA e análise de dados ponta a ponta, nativa da nuvem, otimizada para permitir que qualquer organização utilize IA. Ela é certificada para implantação na nuvem pública e inclui suporte empresarial global para manter os projetos de IA no caminho certo. A A100 permite que os pesquisadores entreguem rapidamente resultados do mundo real e implantem soluções em produção em escala.

TREINAMENTO DE DEEP LEARNING
O treinamento de modelos de IA exige enorme poder de computação e escalabilidade. Os NVIDIA A100 Tensor Cores com Tensor Float (TF32) oferecem desempenho até 20X superior em relação ao NVIDIA Volta com zero alterações de código e um aumento adicional de 2X com precisão mista automática e FP16.

Uma carga de trabalho de treinamento como o BERT pode ser resolvida em escala em menos de um minuto por 2.048 GPUs A100, um recorde mundial de tempo para solução.

Para os maiores modelos com tabelas de dados massivas, como modelos de recomendação de deep learning (DLRM), a A100 80GB alcança até 1,3 TB de memória unificada por nó e oferece um aumento de taxa de transferência de até 3X em relação à A100 40GB.

A liderança da NVIDIA no MLPerf, estabelecendo múltiplos recordes de desempenho no benchmark de referência do setor para treinamento de IA.

INFERÊNCIA DE DEEP LEARNING
A A100 apresenta recursos inovadores para otimizar cargas de trabalho de inferência. Ela acelera uma gama completa de precisão, de FP32 a INT4. A tecnologia Multi-Instance GPU (MIG) permite que várias redes operem simultaneamente em uma única A100 para uma utilização ideal dos recursos de computação. E o suporte à esparsidade estrutural oferece até 2X mais desempenho além dos outros ganhos de desempenho de inferência da A100.

Em modelos de IA conversacional de última geração, como o BERT, a A100 acelera a taxa de transferência de inferência em até 249X em relação às CPUs.

Nos modelos mais complexos que possuem restrição de tamanho de lote (batch-size), como o RNN-T para reconhecimento automático de voz, a maior capacidade de memória da A100 80GB dobra o tamanho de cada MIG e oferece uma taxa de transferência até 1,25X maior em relação à A100 40GB.

O desempenho líder de mercado da NVIDIA foi demonstrado no MLPerf Inference. A A100 traz 20X mais desempenho para estender ainda mais essa liderança.

COMPUTAÇÃO DE ALTO DESEMPENHO
Para viabilizar descobertas de próxima geração, os cientistas recorrem a simulações para entender melhor o mundo ao nosso redor.

A NVIDIA A100 introduz Tensor Cores de precisão dupla para oferecer o maior salto em desempenho de HPC desde a introdução das GPUs. Com 80GB da memória de GPU mais rápida, os pesquisadores podem reduzir uma simulação de precisão dupla de 10 horas para menos de quatro horas na A100. As aplicações de HPC podem aproveitar o TF32 para alcançar um rendimento até 11X maior para operações de multiplicação de matrizes densas de precisão única.

Para as aplicações de HPC com os maiores conjuntos de dados, a memória adicional da A100 80GB oferece um aumento de rendimento de até 2X com o Quantum Espresso, uma simulação de materiais. Essa memória massiva e a largura de banda de memória sem precedentes tornam a A100 80GB a plataforma ideal para cargas de trabalho de próxima geração.

ANÁLISE DE DADOS DE ALTO DESEMPENHO
Os cientistas de dados precisam ser capazes de analisar, visualizar e transformar conjuntos de dados massivos em insights. Mas as soluções de scale-out frequentemente ficam sobrecarregadas por conjuntos de dados espalhados por múltiplos servidores.

Servidores acelerados com A100 fornecem o poder de computação necessário — memória massiva, mais de 2 TB/sec de largura de banda de memória e escalabilidade com NVIDIA® NVLink® e NVSwitch™ — para lidar com essas cargas de trabalho. Combinada com InfiniBand, NVIDIA Magnum IO™ e a suíte de bibliotecas de código aberto RAPIDS™, incluindo o RAPIDS Accelerator para Apache Spark para análise de dados acelerada por GPU, a plataforma de data center da NVIDIA acelera essas enormes cargas de trabalho em níveis sem precedentes de desempenho e eficiência.

Em um benchmark de análise de big data, a A100 80GB entregou insights com um aumento de 2X em relação à A100 40GB, tornando-a ideal para cargas de trabalho emergentes com tamanhos de conjuntos de dados em explosão.

SIMULAÇÕES CIENTÍFICAS: Acelere pesquisas e simulações científicas, permitindo insights e descobertas mais rápidas em física, química e ciências ambientais.

MÍDIA E ENTRETENIMENTO: Renderize gráficos, vídeos e animações de alta resolução com velocidade extrema. Entregue experiências visuais excepcionais ao seu público sem comprometer a qualidade.

MODELAGEM FINANCEIRA: Analise vastos conjuntos de dados e realize modelagens financeiras complexas com velocidade incomparável, fornecendo insights críticos para tomadas de decisão informadas.

Preslav Dobrev

Autor · CloudSigma

Preslav Dobrev é um designer criativo na CloudSigma, focado na construção de uma identidade empresarial consistente por meio de canais de marketing tradicionais e inovadores. Ele é hábil em combinar a visão artística com o marketing estratégico para criar narrativas de marca impactantes.

CloudSigma GPU-as-a-Service

Preslav Dobrev

Comentários