풀스택 소프트웨어
이기종 가속기에 최적화된 엔드투엔드 추론 스택
빌딩 블록
이기종 가속기 간 지능적 워크로드 분배
크로스 벤더 GPU 메모리 패브릭을 통한 소프트웨어 정의 KV 캐시 전송
AMD GPU에서 최대 2배 높은 처리량의 vLLM 드롭인 대체제
Tenstorrent 가속기에서의 고성능 vLLM 서빙
가속기별
풀스택 소프트웨어 최적화를 갖춘 턴키 AMD Instinct GPU 클러스터
Tenstorrent의 네트워크 통합 가속기 기반 비용 효율적 AI 클러스터
과제별
벤더, 아키텍처, 세대가 다른 GPU를 하나의 추론 클러스터로 통합
칩 수준, 클러스터 수준, 인프라 최적화로 달러당 토큰 극대화
빠르게 성장하고, 열정적이며, 두려움 없이 혁신하는 팀의 일원이 되세요. AI 산업에서 가장 중요한 문제를 해결하는 글로벌 팀에 합류하세요.