Solution

推論に最適化されたターンキーAMD GPUクラスター

Morehは、カスタムカーネルからクラスターレベルのオーケストレーションまで、フルスタックのソフトウェア最適化が組み込まれたAMD Instinct GPUクラスターを提供します。初日から本番環境にすぐ投入できます。

2,000+お客様のAIデータセンターに 導入済みのAMD GPU
Solution

提供内容

GPU

AMD Instinctアクセラレータ

すべての世代にわたり、AMD Instinct GPUはコンピュート、メモリ、帯域幅でNVIDIAに匹敵またはそれを上回ります。ノード内GPU間通信は、NVIDIAのNVLinkに相当するAMDのInfinity Fabricが担います。

MI300X vs H100
AMDNVIDIA

FP16性能

MI300X
1,307TFLOPS
H100
989TFLOPS

メモリ

MI300X
192GB
H100
80GB

メモリ帯域幅

MI300X
5.3TB/s
H100
3.35TB/s
MI325X vs H200
AMDNVIDIA

FP16性能

MI325X
1,307TFLOPS
H200
989TFLOPS

メモリ

MI325X
256GB
H200
141GB

メモリ帯域幅

MI325X
6TB/s
H200
4.8TB/s
MI355X vs B200
AMDNVIDIA

FP16性能

MI355X
2,500TFLOPS
B200
2,250TFLOPS

メモリ

MI355X
288GB
B200
180GB

メモリ帯域幅

MI355X
8TB/s
B200
7.7TB/s
ネットワーキング

RoCEクラスターネットワーキング

Morehは、ワークロードとクラスター規模に最適化されたRoCE(RDMA over Converged Ethernet)ネットワークトポロジーを設計し、ソフトウェアレベルの通信最適化を提供します。

  • クラスター規模とワークロードに合わせたRoCEネットワークトポロジー設計
  • 通信オーバーヘッドを最小化するソフトウェアレベルの最適化
プラットフォーム

Kubernetesベースのクラスタープラットフォーム

すべてのクラスターには、オープンソースコンポーネントで構築された本番環境対応のKubernetesプラットフォームが含まれており、チームはインフラではなくモデルに集中できます。

  • GPU対応スケジューリング付きKubernetesオーケストレーション
  • モデルウェイトとチェックポイント用Ceph分散ストレージ
  • モニタリングとロギング(Prometheus、Grafana、Loki)
  • 認証とアクセス制御(LDAP、Keycloak)
  • AIジョブ管理とスケジューリング(SkyPilot)
ソフトウェア

Moreh推論ソフトウェア

すべてのクラスターには、AMD GPU専用に設計され、初日から本番環境で使用可能なMorehのフルスタック推論ソフトウェアが含まれます。

Moreh vLLM

単一ノード推論エンジン

  • OpenAI互換APIを備えたvLLMのドロップインリプレースメント
  • AMD GPUで最高水準のスループットとレイテンシ
  • コンテナイメージとして提供、定期的にアップデート

MoAI Inference Framework

クラスター規模のオーケストレーション

  • 単一ノードからフルクラスターデプロイメントまでスケール
  • Prefill-Decodeディスアグリゲーション、スマートルーティング、オートスケーリング、SLO駆動最適化
  • クラスター全体のOpenAI互換APIエンドポイント
ヘテロジニアスGPU

すでにNVIDIA GPUをお持ちですか?

既存のインフラを置き換える必要はありません。NVIDIAクラスターにAMD GPUノードを追加し、単一の統合推論エンドポイントとして運用できます。MoAI Inference Frameworkがクロスベンダーオーケストレーションを処理し、各リクエストを適切なアクセラレータに自動ルーティングします。

ヘテロジニアスGPUクラスターについて
1.7×クロスベンダーPDディスアグリゲーションによるスループット
1全GPUベンダーを統合するAPIエンドポイント
0必要なアプリケーション変更
Why AMD

AMD GPUクラスターを選ぶ理由

AMD Instinct GPUはNVIDIAに対する有力な選択肢です。Morehのソフトウェアがその優位性を余すことなく発揮させます。

大容量メモリ、大規模モデル

MI325XはGPUあたり256 GBを提供 — H200の1.8倍。ノードあたりより大きなモデルをサービング、または同じモデルをより少ないGPUで運用できます。

競争力のあるTCO

AMD Instinct GPUはドルあたり同等以上のコンピュート性能を提供します。Morehのソフトウェア最適化と組み合わせることで、同じ投資からより多くのスループットを得られます。

性能に妥協なし

Morehのフルスタックソフトウェアがエコシステムの差を解消します。カスタムカーネル、クラスターレベルのオーケストレーション、本番品質のツールにより、AMD GPUの潜在能力を完全に発揮させます。

Process

エンドツーエンドサポート

01

ハードウェア供給

AMD Instinct GPUとサーバーを調達・供給し、お客様に代わって調達プロセスを処理します。

02

クラスター構築

ラックレイアウトと電力計画からネットワークトポロジーまで、クラスターを設計・構築します。

03

ソフトウェアデプロイ

Moreh vLLMとMoAI Inference Frameworkをデプロイし、お客様のワークロードに合わせて最適化します。

04

テクニカルサポート

AMD GPU固有の問題、性能チューニング、ソフトウェアアップデートに対する継続的なサポートを提供します。

AMD GPU推論を大規模にデプロイする準備はできましたか?

単一ノードからフルクラスターまで — ハードウェア、ソフトウェア、その間のすべてを私たちが対応します。