풀스택 소프트웨어
이기종 가속기에 최적화된 엔드투엔드 추론 스택
빌딩 블록
이기종 가속기 간 지능적 워크로드 분배
크로스 벤더 GPU 메모리 패브릭을 통한 소프트웨어 정의 KV 캐시 전송
AMD GPU에서 최대 2배 높은 처리량의 vLLM 드롭인 대체제
Tenstorrent 가속기에서의 고성능 vLLM 서빙
가속기별
풀스택 소프트웨어 최적화를 갖춘 턴키 AMD Instinct GPU 클러스터
Tenstorrent의 네트워크 통합 가속기 기반 비용 효율적 AI 클러스터
과제별
벤더, 아키텍처, 세대가 다른 GPU를 하나의 추론 클러스터로 통합
칩 수준, 클러스터 수준, 인프라 최적화로 달러당 토큰 극대화
Moreh의 최신 소식이 궁금하시거나 더 알고 싶으신가요?
이메일: contact@moreh.io
2445 Augustine Drive Suites 150 & 201, Santa Clara, CA 95054
서울특별시 서초구 서초대로 396, 20층 (06619)
Room 12A02, IPH Building, 241 Xuan Thuy Street, Dich Vong Hau Ward, Cau Giay District, Hanoi