Myrtle.ai、AMD Alveo V80コンピューティング・アクセラレータカード上で大規模モデルのマイクロ秒レベルのML推論レイテンシを実現

2025-07-29 21:22

ケンブリッジ(イギリス), 2025年7月29日 /PRNewswire/ --Myrtle.aiは、機械学習推論の高速化における先駆的企業として知られており、同社は本日、同社の推論アクセラレータ「VOLLO®」が AMD Alveo™ V80コンピューティング・アクセラレータカードに対応したことを発表しました。

Microsecond ML inference
Microsecond ML inference

VOLLOは、1マイクロ秒未満という業界最先端のML推論計算レイテンシを実現しながら、優れたスループット、電力効率、およびラックスペース効率を提供します。この新しいリリースにより、大規模モデルを扱うML開発者は、単一のFPGA上で動作させることで、極めて低いレイテンシの恩恵を受けることが可能になります。たとえば、2,200万パラメータの3層LSTMモデルは、p99レイテンシが10マイクロ秒未満で動作します。さらに大規模なモデルであっても、複数のFPGAに分割(シャーディング)して実行することで、依然として競合ソリューションよりも低いレイテンシを実現できます。

VOLLOは、金融取引、無線通信、サイバーセキュリティ、ネットワーク管理など、極限まで低いレイテンシでML推論を実行することが、セキュリティ、安全性、収益性、効率性、コスト面での優位性につながる幅広い分野で高い需要があります。

「VOLLOへの需要は両面から来ています。」と、Myrtle.aiのCEOであるPeter Baldwin氏は述べています。「一定のレイテンシ制約があるお客様にとっては、これまで小規模なモデルでしか達成できなかったレイテンシで、より大規模なモデルを実行できるようになったことに大変満足されています。また、特定のモデルに対して可能な限り低いレイテンシを求めるお客様もいらっしゃいます。単一のFPGA上で実行可能なモデルのサイズを拡大できたことは、両者にとって大きな助けとなりました。」

「メモリ集約型ワークロード向けに本番環境対応となったAMD Alveo V80コンピューティング・アクセラレータでVOLLOがサポートされることを大変嬉しく思います。」と、AMDのデータセンター向けFPGA事業ディレクターであるGirish Malipeddi氏は述べています。「AMDの顧客は、VOLLOを用いることで非常に低いレイテンシでML推論を実行できるようになり、また、VOLLOの実行に適したコンピューティング・アクセラレータを購入したい方には、VOLLOがこれまでに対応した中で最大のモデル容量を持つ単一FPGAであるAlveo V80を選択するという選択肢が提供されます。」

Alveo V80カードは、2.6M LUTのロジック密度、32GBのHBM、さらに32GBのDDR4および800Gネットワークインターフェースを備えたAMD Versal™Adaptive SoCをベースにしています。このカードは、アプリケーションに応じてハードウェアを柔軟に適応させるFPGAファブリックを特徴とし、大規模なデータセットやメモリ集約型の計算処理に対応するHBM2eを組み合わせています。

ご興味のある方は、本日よりvollo.myrtle.aiからML向けのVOLLOコンパイラをダウンロードし、ご自身のモデルがAMD Alveo V80コンピューティング・アクセラレータカード上でどのようなレイテンシを達成できるかをお確かめいただけます。

Myrtle.aiについて

Myrtle.aiは、主要なFPGAサプライヤー各社のFPGAベースプラットフォーム上で、世界水準の推論アクセラレータを提供するAI/MLソフトウェア企業です。Myrtleは、あらゆる種類のMLネットワークに対応するニューラルネットワークの専門知識を有しており、FinTech、音声処理、レコメンデーション向けにアクセラレータを提供してきました。

AMDAMDロゴ、AlveoVersal、およびこれらの組み合わせは、Advanced Micro Devices, Inc.の商標です。

写真:https://mma.prnasia.com/media2/2739187/Myrtle_ai.jpg?p=medium600
ロゴ:https://mma.prnasia.com/media2/2739186/Myrtle_ai_Logo.jpg?p=medium600

  1. トランプ大統領 中国訪問は予定通り 「素晴らしいものに」
  2. 「やさしい日本語」の現在地~テレビ報道にいま問われている視点~【調査情報デジタル】
  3. こども家庭庁の職員とこども・若者支援の成長企業が意見交換を図る初の試み「こども若者まんなかダイアローグwithスタートアップ」開催
  4. トランプ大統領 イラン攻撃からの早期の撤退を否定 「途中で手を引いて問題が再発するようなことにはさせない」
  5. 2026年GWは“お手軽アウトドア”がトレンド? BBQやグランピングが人気上昇傾向に
  6. 駐独米軍5000人の撤退 ヘグセス米国防長官が命令 対独圧力の一環か 半年から1年で完了の見通し
  7. 米財務省 イランに通航料支払いで制裁の可能性 ホルムズ海峡を通過する船舶に警告
  8. 難民認定のあるべき姿を示した東京高裁・地裁の2つの判決 「難民認定の大原則」を守り入管の主張を退けた判断は“スタンダード”になり得るか【“知られざる法廷”からの報告】
  9. 【脳トレ】「迋」の中に紛れて1つ違う文字がある!?あなたは何秒で探し出せるかな??【違う文字を探せ!】
  10. 平和国家の転換か、抑止力の強化か― 「防衛装備移転三原則」改定の全貌と最後の歯止め“国民の理解”の行方
  1. 「持ってきた包丁で殺した」娘の元交際相手(51)逮捕 大阪・和泉市の母娘殺人事件
  2. 旭山動物園で妻のものとみられるスマホ見つかる 鈴木達也容疑者(33)の供述に基づいて捜索 遺体損壊事件
  3. 米財務省 イランに通航料支払いで制裁の可能性 ホルムズ海峡を通過する船舶に警告
  4. 駐独米軍5000人の撤退 ヘグセス米国防長官が命令 対独圧力の一環か 半年から1年で完了の見通し
  5. 難民認定のあるべき姿を示した東京高裁・地裁の2つの判決 「難民認定の大原則」を守り入管の主張を退けた判断は“スタンダード”になり得るか【“知られざる法廷”からの報告】
  6. 関東から西を中心に行楽日和 ひんやり空気から一転夏日続出へ 東京も今年一番の暑さ
  7. 2026年GWは“お手軽アウトドア”がトレンド? BBQやグランピングが人気上昇傾向に
  8. トランプ大統領 イラン攻撃からの早期の撤退を否定 「途中で手を引いて問題が再発するようなことにはさせない」
  9. トランプ大統領 中国訪問は予定通り 「素晴らしいものに」
  10. 東京・江東区の強盗未遂事件 新たにトクリュウのリクルート役とみられる男など2人を逮捕 実行役ら3人は既に逮捕 警視庁
  11. 「殺すつもりはなかった」逃走していた高林輝行容疑者(44)を逮捕 東京・福生市“金づち”殺人未遂事件
  12. 「事実上の吸収合併」旧統一教会が“財産移転先”に指定した「天地正教」の実態【報道特集】