業界初のSupermicro NVIDIA HGX™ B200システム、MLPerf® Inference v5.0の結果でAI性能のリーダーシップを実証

2025-04-03 23:00

最新のベンチマークによると、NVIDIA B200を搭載したスーパーマイクロのシステムは、1秒あたりのトークン生成数が3倍で、前世代のシステムを凌駕している

カリフォルニア州サンノゼ, 2025年4月4日 /PRNewswire/ --AI/ML、HPC、クラウド、ストレージ、5G/エッジのトータルITソリューションプロバイダーであるスーパー・マイクロ・コンピューター社Super Micro Computer, Inc.、略称SMCIは、NVIDIA HGX™B200 8-GPUを使用し、いくつかのMLPerf Inference v5.0ベンチマークで業界をリードするパフォーマンスを初めて発表しました。4U液冷システムと10U空冷システムは、一部のベンチマークで最高のパフォーマンスを達成しました。スーパーマイクロは、Llama2-70BおよびLlama3.1-405Bベンチマークにおいて、H200 8-GPUシステムと比較して、1秒あたりのトークン生成量(Token/s)が3倍以上であることを実証しました。

Nvidia HGX B200 Systems
Nvidia HGX B200 Systems

「スーパーマイクロは、MLCommonsが2025年に初めて発表した新しいベンチマークからも明らかなように、AI業界のリーダーであり続けています」とスーパーマイクロの社長兼CEO、Charles Liang氏は述べています。「当社のビルディング・ブロック・アーキテクチャにより、さまざまなワークロードに最適化された多様なシステムをいち早く市場に投入することができます。我々は、システムを微調整し、AIワークロードにおけるリーダー的地位を確保するために、エヌビディア(NVIDIA)と緊密に協力し続けます。」

新しいMLPerf v5.0推論ベンチマークの詳細については、https://mlcommons.org/benchmarks/inference-datacenter/をご覧ください

スーパーマイクロは、空冷式と液冷式のNVIDIA HGX™B200 8-GPUシステムの両方で、MLPerf推論性能の記録(一部のベンチマーク)を公表している唯一のシステム・ベンダーです。空冷式も液冷式も、MLCommonsのベンチマーク開始日以前には稼働していました。スーパーマイクロのエンジニアはシステムとソフトウェアを最適化し、素晴らしいパフォーマンスを披露しました。オペレーティング・マージンの範囲内で、スーパーマイクロの空冷B200システムは液冷B200システムと同レベルのパフォーマンスを示しました。スーパーマイクロは、ベンチマークを実施する間、これらのシステムを顧客に提供してきました。

MLCommonsは、すべての結果が再現可能であること、製品が入手可能であること、他のMLCommonsメンバーが結果を監査できることを重視しています。スーパーマイクロのエンジニアは、MLCommonsのルールに従ってシステムとソフトウェアを最適化しました。

SYS-421GE-NBRT-LCC(8x NVIDIA B200-SXM-180GB)とSYS-A21GE-NBRT(8x NVIDIA B200-SXM-180GB)は、Mixtral 8x7B Inference、Mixture of Expertsベンチマークを129,000トークン/秒で実行し、パフォーマンスでトップに立ちました。スーパーマイクロの空冷および液冷NVIDIA B200ベースのシステムは、大規模なLlama3.1-405bモデルで1,000トークン/秒を超える推論を実現しました。一方で、以前の世代のGPUシステムではその結果は大幅に低くなっていました。LLAMA2-70bベンチマークを使用した小規模な推論タスクでは、NVIDIA B200 SXM-180GBを搭載したスーパーマイクロ・システムが、ティア1システム・サプライヤの中で最高のパフォーマンスを示しています。

内容は次のようなものです。

• Stable Diffusion XL(サーバ)
SYS-A21GE-NBRT(8x B200-SXM-180GB)

#1 クエリー/秒、28.92

• llama2-70b-interactive-99(サーバ)
SYS-A21GE-NBRT(8x B200-SXM-180GB)

#1 トークン/秒、62,265.70

• ラマ3.1-405b(オフライン)
SYS-421GE-NBRT-LCC(8xB200-SXM-180GB)

#1 トークン/秒 1521.74

• Llama3.1-405b(サーバ)
SYS-A21GE-NBRT(8x B200-SXNM-180GB)

#1 トークン/秒、1080.31(8GPUノードの場合)

• mixtral-8x7b(サーバ)
SYS-421GE-NBRT-LCC(8x B200-SXM-180GB)

#1 トークン/秒、129,047.00

• mixtral-8x7b(オフライン)
SYS-421GE-NBRT-LCC(8x B200-SXM-180GB)

#1 トークン/秒、128,795.00ドル

「MLCommons は、スーパーマイクロの MLPerf Inference v5.0ベンチマークに提出した成果を祝福します。彼らの結果が、旧世代のシステムと比較して大幅な性能向上を示していることを嬉しく思います」とMLCommonsのMLPerf部門責任者であるDavid Kanter氏は述べています。「中立的で、代表的で、再現性のあるMLPerfの結果によって検証された性能向上が達成されたことで、顧客は満足することでしょう。」

スーパーマイクロは、100以上のGPU最適化システム、空冷および液冷オプション、シングルソケット最適化システムから8ウェイ・マルチプロセッサ・システムまで、CPUの選択肢を備えた包括的なAIポートフォリオを提供しています。スーパーマイクロのラックスケール・システムには、コンピューティング、ストレージ、ネットワークの各コンポーネントが含まれているため、顧客に納入された後の設置に要する時間が短縮されます。

スーパーマイクロのNVIDIA HGX B200 8 GPUシステムは、次世代の液体冷却および空冷テクノロジーを採用しています。新開発のコールドプレートと新しい 250kW 冷却剤分配ユニット (CDU) により、同じ 4U フォーム・ファクターで前世代の 2 倍以上の冷却能力が実現しました。42U、48U、または 52U 構成で利用可能で、新しい垂直冷却剤分配マニホールド (CDM) を備えたラックスケール設計により、貴重なラックユニットを占有することがなくなりました。これにより、42Uラックに64NVIDIA Blackwell GPUを搭載した8システム、52Uラックに96NVIDIA Blackwell GPUを搭載した最大12システムが可能になります。

新しい空冷式 10U NVIDIA HGX B200 システムは、8 つの1000W TDP Blackwell GPU を収容できるように熱ヘッドルームが拡張された再設計されたシャーシを備えています。新しい10U空冷システムは最大4台までラックに設置して完全に統合でき、前世代と同じ密度で、最大15倍の推論パフォーマンスと3倍のトレーニング・パフォーマンスを実現します。

スーパー・マイクロ・コンピューターについて

スーパーマイクロ(NASDAQ: SMCI)は、アプリケーション最適化の総合ITソリューション分野のグローバルリーダーです。カリフォルニア州サンノゼにて設立運営しているスーパーマイクロは、企業、クラウド、AI、5G通信/エッジITインフラストラクチャ向けに、業界初のイノベーションを提供することに尽力しています。同社は、サーバ、AI、ストレージ、IoT、スイッチ・システム、ソフトウェア、サポート・サービスを含む、トータルITソリューションのメーカーです。スーパーマイクロのマザーボード、電源、シャーシ設計の専門知識により、同社が開発と生産をさらに強化し、グローバルな顧客のためのクラウドからエッジまでの次世代イノベーションを実施しています。製品は、インハウス(米国、アジア、オランダ)で設計・製造されており、グローバル・オペレーションを利用して、スケールと効率性を高め、最適化によってTCOの改善と環境への影響を低減(グリーン・コンピューティング)します。受賞歴のあるServer Building Block Solutions®ポートフォリオでは、顧客が正確な作業負荷量と用途に合わせて、フォーム・ファクター、プロセッサ、メモリ、GPU、ストレージ、ネットワーク、電源、冷却ソリューション(空調、フリー・エア・クーリング、液冷)の包括的なセットをサポートしている柔軟かつ再利用可能な、そしてビルディング・ブロックで構築されたシステムを、幅広いラインナップから選択して最適することができます。

Supermicro、Server Building Block Solutions、およびWe Keep IT Greenは、スーパー・マイクロ・コンピューターの商標および/または登録商標です。

その他のブランド、名称、商標は、各所有者に帰属します。

写真 - https://mma.prnasia.com/media2/2656893/Super_Micro_Computer_MLPerf.jpg?p=medium600

ロゴ -https://mma.prnasia.com/media2/1443241/Supermicro_Logo.jpg?p=medium600

  1. 世界初オーストラリアで16歳未満“SNS禁止法”施行 12歳「TikTokが使えなくなった」各国で進む“SNS規制”日本では?【news23】
  2. スリランカでのサイクロン被害 派遣された医療チームが日本へ帰国 解団式を行う
  3. 「si」→「shi」「ti」→「chi」ローマ字表記を約70年ぶりに改定へ 「ヘボン式」統一でどう変わる【Nスタ】
  4. 「落としもの」が“検索”可能に?!施設や公共交通機関の「壁」越える新サービス【Nスタ解説】
  5. 【 芦田愛菜 】「“生きること” “愛”について深く考えるキッカケをもらった」 岡田将生の“迷い”にも神回答
  6. こたつの中が熱くなってくると→猫がとった『予想外のスタイル』に笑ってしまう人が続出「可愛すぎるw」「上手な付き合い方w」と1万いいね
  7. 家賃高騰で「広さ」を妥協?「自分が我慢すれば…」と若年層は“近さ”優先か 戸建ても…?【Nスタ解説】
  8. 猫が『亡くなる直前』にみせる兆候5つ 限られた時間で飼い主ができることもご紹介
  9. 犬の老化が進む『タブー行為』5選 避けるべき絶対NG行動や飼い主が見直すべき暮らし方まで
  10. 【 秋吉久美子 】「方向音痴なので笑」360度ステージに苦戦「観ると大変そうじゃないのが悔しい」
  1. 「自称・一夫多妻」の男とその妻ら3人逮捕…20代女性との性交動画を盗撮し動画サイトに投稿したか 警視庁
  2. 【速報】小5男児がトラックにひかれ心肺停止の重体 東京・板橋区 警視庁
  3. ロンドンで進む中国の「メガ大使館」建設計画 “国境を越えた弾圧”を危惧…香港からの亡命者が抗議の声
  4. 【速報】小5男児が横断歩道でトラックにひかれる 搬送先の病院で死亡 東京・板橋区 警視庁
  5. ドン・キホーテが新業態オープン コスメなど最大90%割引で販売 物価高などを背景に「オフプライスストア」急拡大
  6. 【 釣りアイドル・神野梓 】 車大破の事故 命を救った「iPhoneの『衝突事故検出』機能」 強い衝撃を感知後 「反応がないと119や緊急連絡先に自動通報してくれます」
  7. 「si」→「shi」「ti」→「chi」ローマ字表記を約70年ぶりに改定へ 「ヘボン式」統一でどう変わる【Nスタ】
  8. 【 芦田愛菜 】「“生きること” “愛”について深く考えるキッカケをもらった」 岡田将生の“迷い”にも神回答
  9. 【 HKT48 】 17日(水)の劇場公演を中止 「諸般の事情を踏まえ」
  10. 帰省・忘年会などで事故多発“魔の12月” 警察官コンビが「笑い」で伝える交通安全【Nスタ解説】
  11. 「落としもの」が“検索”可能に?!施設や公共交通機関の「壁」越える新サービス【Nスタ解説】
  12. 家賃高騰で「広さ」を妥協?「自分が我慢すれば…」と若年層は“近さ”優先か 戸建ても…?【Nスタ解説】