CloudSigma GPU-as-a-Service

Preslav Dobrev2023-08-16 · 1 min read

CloudSigmaでは、お客様が仮想マシンにGPUを追加し、最も要求の厳しいワークロードに対応できる高性能でコスト効率の高いコンピューティングを利用できるようにしています。CloudSigmaのGPUサービスの中心となるのは、HPC、AI、データ分析向けに最適化されたNVIDIA A100 Tensor Core GPUです。A100はNVIDIA TESLA V100を凌駕し、AIアプリケーションが最大限に活用できる新機能を備えています。当社では、VMインスタンスがGPUおよびその内蔵メモリを直接制御できるように、パススルーモードで簡単に最適化されたNVIDIA A100搭載VMを構築できるようにしています。

ユースケース

クラウドで実行される計算集約型アプリケーションの増加が、近年のGPUアクセラレーテッド・クラウドコンピューティングの爆発的な普及を牽引しています。これらのアプリケーションには、AIのディープラーニングのトレーニングと推論、データ分析、科学技術計算、ゲノミクス、グラフィックスレンダリング、ゲーミングなどが含まれます。AIトレーニングや科学技術計算のスケールアップから、推論アプリケーションのスケールアウト、リアルタイムの対話型AIの実現に至るまで、GPUはクラウドで実行される数多くの複雑で予測不可能なワークロードを高速化するために必要なパワーを提供します。

NVIDIA A100 Tensor Core GPUは、あらゆる規模のAI、データ分析、HPCに対して前例のない高速化を実現する、大きな飛躍を遂げた製品です。NVIDIA Ampereアーキテクチャを搭載したA100は、前世代と比較して最大20倍のパフォーマンスを提供します。CloudSigmaでは、最大規模のモデルやデータセットを実行するために、毎秒2テラバイト（TB/s）を超える世界最速の帯域幅を持つ80GBメモリバージョンを提供しています。

NVIDIA GPUは、AIのトレーニングおよび推論ワークロードを大幅に高速化することで、AIを支える主要な計算エンジンの1つとなっています。さらに、NVIDIA GPUは多くの種類のHPCやデータ分析アプリケーションおよびシステムを高速化し、データをインサイトへと変換します。

AIとHPC
GPUアクセラレーションにより、複雑な機械学習モデルをより迅速かつ効率的にトレーニングできます。データ集約型のタスクに取り組み、AI主導のイノベーションにおいて画期的な成果を達成しましょう。NVIDIA AI Enterpriseは、あらゆる組織がAIを利用できるように最適化された、エンドツーエンドのクラウドネイティブなAIおよびデータ分析ソフトウェアスイートです。パブリッククラウドへのデプロイが認定されており、AIプロジェクトを軌道に乗せるためのグローバルなエンタープライズサポートが含まれています。A100を使用することで、研究者は現実世界の成果を迅速に提供し、ソリューションを大規模に本番環境へデプロイすることができます。

ディープラーニングのトレーニング
AIモデルのトレーニングには、膨大な計算能力とスケーラビリティが必要です。Tensor Float (TF32)を搭載したNVIDIA A100 Tensor Coreは、コードを変更することなくNVIDIA Voltaと比較して最大20倍のパフォーマンスを提供し、自動混合精度とFP16を使用することでさらに2倍の高速化を実現します。

BERTのようなトレーニングワークロードは、2,048基のA100 GPUによって1分未満で大規模に解決でき、これは解決時間における世界記録です。

ディープラーニング推薦モデル（DLRM）のような大規模なデータテーブルを持つ最大規模のモデルにおいて、A100 80GBはノードあたり最大1.3 TBのユニファイドメモリに達し、A100 40GBと比較して最大3倍のスループット向上を実現します。

AIトレーニングの業界標準ベンチマークであるMLPerfにおいて、NVIDIAは複数のパフォーマンス記録を樹立し、リーダーシップを発揮しています。

ディープラーニングの推論
A100は、推論ワークロードを最適化するための画期的な機能を導入しています。FP32からINT4までの幅広い精度を高速化します。マルチインスタンスGPU（MIG）テクノロジーにより、単一のA100上で複数のネットワークを同時に動作させることができ、計算リソースの利用を最適化します。また、構造的スパース性のサポートにより、A100の他の推論パフォーマンス向上に加えて、最大2倍のパフォーマンスを提供します。

BERTのような最先端の対話型AIモデルにおいて、A100はCPUと比較して推論スループットを最大249倍高速化します。

自動音声認識用のRNN-Tなど、バッチサイズが制限される最も複雑なモデルにおいて、A100 80GBの増加したメモリ容量は各MIGのサイズを2倍にし、A100 40GBと比較して最大1.25倍高いスループットを実現します。

NVIDIAの市場をリードするパフォーマンスは、MLPerf Inferenceで実証されました。A100はさらに20倍のパフォーマンスをもたらし、そのリーダーシップをさらに拡大します。

ハイパフォーマンスコンピューティング
次世代の発見をもたらすために、科学者たちはシミュレーションを活用して、私たちの周りの世界をより深く理解しようとしています。

NVIDIA A100は、倍精度Tensorコアを導入し、GPUの登場以来、HPCパフォーマンスにおいて最大の飛躍をもたらします。80GBの超高速GPUメモリを搭載したA100により、研究者は10時間かかる倍精度シミュレーションを4時間未満に短縮できます。HPCアプリケーションはTF32を活用することで、単精度密行列乗算演算において最大11倍高いスループットを達成できます。

最大規模のデータセットを扱うHPCアプリケーションにおいて、A100 80GBの追加メモリは、材料シミュレーションであるQuantum Espressoで最大2倍のスループット向上を実現します。この大容量メモリと前例のないメモリ帯域幅により、A100 80GBは次世代のワークロードに最適なプラットフォームとなります。

ハイパフォーマンスデータアナリティクス
データサイエンティストは、大規模なデータセットを分析、可視化し、洞察へと変換する必要があります。しかし、スケールアウトソリューションは、複数のサーバーに分散したデータセットによって処理が滞ることがよくあります。

A100を搭載したアクセラレーテッドサーバーは、これらのワークロードに取り組むために必要なコンピューティングパワー（大容量メモリ、2 TB/秒を超えるメモリ帯域幅、NVIDIA® NVLink®およびNVSwitch™によるスケーラビリティ）を提供します。InfiniBand、NVIDIA Magnum IO™、そしてGPUアクセラレーテッドデータアナリティクス向けのRAPIDS Accelerator for Apache Sparkを含むオープンソースライブラリスイートであるRAPIDS™を組み合わせることで、NVIDIAデータセンタープラットフォームは、これらの巨大なワークロードを前例のないレベルのパフォーマンスと効率で高速化します。

ビッグデータ分析のベンチマークにおいて、A100 80GBはA100 40GBと比較して2倍の速度で洞察を提供し、データセットのサイズが爆発的に増加している新たなワークロードに最適です。

科学シミュレーション: 科学研究やシミュレーションを高速化し、物理学、化学、環境科学におけるより迅速な洞察と発見を可能にします。

メディア & エンターテインメント: 高解像度のグラフィックス、ビデオ、アニメーションを驚異的なスピードでレンダリングします。品質を損なうことなく、優れた視覚体験を視聴者に提供します。

金融モデリング: 膨大なデータセットを分析し、比類のないスピードで複雑な金融モデリングを実行して、情報に基づいた意思決定のための重要な洞察を提供します。

Preslav Dobrev

著者 · CloudSigma

Preslav DobrevはCloudSigmaのクリエイティブデザイナーであり、従来型および革新的なマーケティングチャネルを活用した一貫性のあるビジネスアイデンティティに注力しています。彼は芸術的なビジョンと戦略的マーケティングを融合させ、インパクトのあるブランドナラティブを生み出すことに長けています。

CloudSigma GPU-as-a-Service

Preslav Dobrev

コメント