随着今年具身人形XMAN系列的发布,上海擎朗智能科技有限公司(简称“擎朗智能”)在近日正式升级并发布首个针对服务行业的VLA模型:KOM2.0(KEENON Operator Model 2.0)。
据介绍,擎朗智能KOM2.0模型采用了快-慢双系统架构,慢系统(K-Mind)基于VLM多模态大模型,通过公司构建的岗位服务场景数据集K-Infinity(KEENON Infinity Dataset)实现对服务场景的环境感知、任务理解与规划;快系统(K-Act)采用Action Expert(动作专家模型),利用大量真机数据进行训练,用于精细的动作生成。
值得一提的是,在KOM模型之上,擎朗智能开创性地提出并实践“岗位化”理念,倾力打造了岗位化垂域模型KEENON ProS,该模型是面向具体服务岗位的深度专业化垂直领域模型,可有效提升通用具身大模型在特定垂直领域中的适用性和效率,使得擎朗具身服务机器人掌握餐饮、酒店、商超等场景中具体岗位的技能,实现“岗位化”的快速落地。
擎朗智能表示,KOM模型的发布,不仅是技术架构的升级,更是对机器人在真实场景中“所见即所知,所知即所行”能力的重要推进。未来,公司将继续打造“通用+专用”多形态具身服务机器人矩阵,持续迭代多模态大模型能力,与全球合作伙伴共同推动具身智能技术的规模化应用落地。

