Solution

비용 효율적인 Tenstorrent AI 클러스터

Moreh는 Tenstorrent의 네트워크 통합 가속기를 중심으로 확장 가능한 AI 클러스터를 설계하고 구축합니다 — 추론에 최적화되고 학습에도 대응 가능 — 클러스터 아키텍처와 네트워킹부터 풀스택 소프트웨어와 지속적인 지원까지.

제공 내역

Wormhole 프로세서

Tenstorrent의 Wormhole 프로세서는 AI 클러스터를 위한 경량 고효율 빌딩 블록입니다. 164 TFLOPS의 BLOCKFP8 (BF16) 성능과 12 GB 메모리를 제공합니다. Wormhole의 진정한 힘은 다수의 칩이 하나의 클러스터를 형성할 때 발휘됩니다.

Wormhole 프로세서자세히 보기 (tenstorrent.com)

서버

Galaxy 서버

Tenstorrent의 Galaxy 서버는 32개의 Wormhole 프로세서를 탑재하여 일반적인 8-GPU 서버에 상응하는 성능을 제공합니다.

자세히 보기 (tenstorrent.com)

네트워킹

스위치 없는 Chip-to-Chip Torus 네트워크

모든 Wormhole 프로세서에는 3.2 Tbps Ethernet 인터페이스가 있어 스위치 없이 직접 chip-to-chip torus 네트워크를 형성하며, 대규모 AI 통신 패턴을 효율적으로 처리합니다.

소프트웨어

Moreh AI 소프트웨어

Moreh의 풀스택 소프트웨어는 Tenstorrent 하드웨어에서 추론과 학습 모두를 지원합니다 — 첫날부터 프로덕션에 사용 가능합니다.

Moreh vLLM

단일 노드 추론 엔진

  • Tenstorrent Wormhole 칩 전용으로 구축
  • DeepSeek, GPT-OSS, Qwen을 포함한 SOTA MoE 모델 지원
  • 450개 이상의 최적화된 연산
자세히 보기

MoAI Inference Framework

클러스터 규모 추론

  • 다수의 Galaxy 서버에 걸쳐 확장
  • Torus 인식 스케줄링 및 분리
  • 클러스터를 위한 OpenAI 호환 API
자세히 보기

MoAI Training Framework

파인튜닝 및 학습

  • TT 클러스터에서 파인튜닝 및 학습
  • PyTorch 호환, 450개 이상의 연산
  • 추론과 학습에 동일한 클러스터 사용

출시 예정

엔드투엔드 지원

01

하드웨어 공급

Tenstorrent Wormhole 칩과 Galaxy 서버를 소싱 및 공급하여 조달 과정을 대신 처리합니다.

02

클러스터 구축

랙 레이아웃과 전력 계획부터 torus 네트워크 토폴로지까지 클러스터를 설계하고 구축합니다.

03

소프트웨어 배포

Moreh vLLM과 MoAI Inference Framework를 배포하고 특정 워크로드에 맞게 최적화합니다.

04

기술 지원

Tenstorrent 관련 이슈, 성능 튜닝, 소프트웨어 업데이트에 대한 지속적인 지원을 제공합니다.

Moreh와 Tenstorrent 파트너십

Tenstorrent와의 파트너십과 3년간의 공동 개발을 통해 하드웨어부터 소프트웨어까지 완전히 통합된 솔루션을 제공합니다 — 다양한 AI 워크로드를 효율적으로 실행할 수 있습니다.

전략적 파트너십 보도자료

Tenstorrent AI를 대규모로 배포할 준비가 되셨나요?

단일 Galaxy 서버에서 전체 클러스터까지 — 추론과 학습을 위해 하드웨어, 소프트웨어, 그리고 그 사이의 모든 것을 저희가 처리합니다.

영업팀 문의