まず  ページニュースAI 速度のボトルネックを解決するスーパーコンピューター

AI 速度のボトルネックを解決するスーパーコンピューター







研究者や学術機関は、高性能スーパーコンピューターを使用して、大規模な AI モデル、シミュレーション、データ集約型の実験を効率的に実行できるようになりました。

コンピューティング能力が限られているため、人工知能の研究はますます制限されています。大規模なモデルのトレーニング、複雑なシミュレーションの実行、大規模なデータセットの処理には、高性能システムが必要です。ラテンアメリカでは、学術機関がインフラストラクチャの限界に直面しており、AI イノベーションが遅れ、地域の状況に合わせたモデルの開発が制約されています。研究者は、データ集約型の AI、機械学習、科学技術コンピューティングのワークロードをサポートできるスケーラブルな環境を必要としていました。

Jailu スーパーコンピューターはこのニーズに応えます。96 個の NVIDIA B200 GPU と Supermicro サーバーを備えているため、研究者は AI モデルを実行し、シミュレーションを実行し、複雑なアルゴリズムを効率的に処理できます。このシステムは大容量ストレージと低遅延の相互接続を統合し、ボトルネックを軽減し、大規模な実験を可能にします。

そのアーキテクチャにはいくつかの利点があります。ヘッド ノードは、ログイン、オーケストレーション、ワークロード分散などの環境を管理します。GPU ノードは HGX 標準に従い、高速 GPU 間通信に NVLink を使用します。ストレージとネットワークは、高スループットと低遅延を維持するように設計されています。このシステムには、集中管理、GPU スケジューリング、実験再現性のためのソフトウェアも含まれています。

スーパーコンピューターの主な機能は次のとおりです。

5 つのヘッド ノードが管理、ログイン、オーケストレーションを処理します。
12 の GPU ノードにはそれぞれ 8 つの NVIDIA B200 SXM-5 GPU が搭載されています。
NVLink は GPU を接続して高速通信を実現します。
ストレージはBeeGFSを採用しており、約300TBが利用可能です。
ネットワークは、イーサネット 200 Gb/s と InfiniBand 800 Gb/s を組み合わせています。
NVIDIA AI ソフトウェアはワークロードを管理し、タスクをスケジュールします。
USP の人工知能・機械学習センター (CIAAM-USP) のファビオ G. コズマン氏は、「ジャイルのおかげで、大規模なモデルを開発し、ブラジルの状況に関連した研究を深めることができる AI インフラストラクチャが得られます。」と述べています。このシステムは、高性能ハードウェア、エンタープライズ ソフトウェア、専門エンジニアリングを組み合わせることで、ブラジルの学術能力と AI および高性能コンピューティングにおける競争力を強化します。