全栈软件
针对异构加速器优化的端到端推理栈
构建模块
跨异构加速器的智能工作负载分配
软件定义的跨厂商 GPU 内存 Fabric,用于 KV 缓存传输
在 AMD GPU 上吞吐量提升最高 2 倍的 vLLM 替代方案
在 Tenstorrent 加速器上的高性能 vLLM 服务
按加速器
具备全栈软件优化的交钥匙 AMD Instinct GPU 集群
基于 Tenstorrent 网络集成加速器的高性价比 AI 集群
按挑战
将不同厂商、架构和代际的 GPU 统一为单一推理集群
通过芯片级、集群级和基础设施优化最大化每美元token产出
想了解Moreh的最新动态或更多信息?
请发送邮件至 contact@moreh.io
2445 Augustine Drive Suites 150 & 201, Santa Clara, CA 95054
20th Floor, 396 Seocho-daero, Seocho-gu, Seoul 06619
Room 12A02, IPH Building, 241 Xuan Thuy Street, Dich Vong Hau Ward, Cau Giay District, Hanoi