力压李飞飞团队登顶WorldScore,黑马Manifold AI领跑世界动作模型

机器之心编辑部

通用世界模型评测榜单 WorldScore 登顶、建立具身世界模型评测榜单 WorldArena 、发布通用世界模型 WorldScape 、发布世界-动作模型 WorldScape Policy，这家低调的世界模型创业公司 Manifold AI（流形空间）近期走出隐身模式频频出手，开始领跑世界-动作模型具身新路线。

力压李飞飞团队

登顶通用世界模型榜单 WorldScore

近日，国际权威榜单 WorldScore迎来更新，Manifold AI自研模型 WorldScape 强势登顶，在全球同台竞技中拿下第一。

在世界模型的全球竞逐中，国际权威榜单 WorldScore 被公认为检验通用世界模型基座实力的终极试金石。该基准从各类可控性、生成质量等多类维度，考验模型在数千个不同场景的生成能力，对模型进行严苛的极限测试。

面对这一高门槛，团队研发的 WorldScape 模型强势突围，总分稳居全球榜首。与其同场竞技的包括李飞飞团队、MIT、阿里、Runway、智谱、MiniMax、腾讯混元等。

WorldScore世界模型评测兼具深度与广度

长久以来，世界模型的通病是“重渲染、轻规律”，生成的视频看似精美，但在涉及复杂场景的运动、多步控制时，往往破绽百出。WorldScape 恰恰在最难攻克的物理和交互指标上，拉开了显著的领先优势，从而成功登顶。

这意味着，WorldScape 已经成功跨越了“像不像”的视觉表象，真正触及了“对不对”的底层物理逻辑。这不仅是一次分数的超越，更是国产世界模型在真实世界执行力上的一次标志性跨越。

更难能可贵的是，WorldScape 模型参数规模小于排名前列的其他模型一个量级，展现了该模型全球最高的空间智能密度。

WorldScape 为什么能做到？答案是“生成”与“控制”的深度融合。

WorldScape核心架构图

全面领先的交互体验，而非单一交互：WorldScape 通过统一的动作—世界状态建模框架，将空间位移与物体交互纳入同一生成过程，避免了多模块拼接带来的不一致问题，从而同时支持空间导航与物体操作。

更稳定、可信的三维世界结构：WorldScape 在训练过程中显式引入三维几何感知的空间表示与约束，使生成结果在连续交互中保持一致的空间结构。这种设计有效缓解了长时生成中常见的几何漂移与结构崩塌问题。

实时生成下保持高视觉质量：在效率方面，WorldScape 并未简单依赖模型压缩或分辨率降低，而是通过结构化生成与高效训练策略，在单张 GPU 上实现接近实时（6–16 FPS）的交互式生成，并在成像质量、运动平滑度等视觉指标上位居前列，实现了速度与质量兼得的交互式生成。

具备“记忆”的世界：长期一致性是区分“视频生成模型”和“世界模型”的关键，WorldScape 通过几何感知的世界状态记忆机制，使模型能够在不同时间步之间共享和更新空间信息。

除了在国外已有的通用世界模型榜单登顶，Manifold AI 的联创团队也联合国内外十多所高校提出面向具身世界模型的统一评测体系 WorldArena ，并举办 CVPR 2026 WorldArena Challenge，推动世界模型从“视觉逼真”向“功能可用”转型。

近期国内外多家企业纷纷在这个具身世界模型的标准评测体系上进行了测试，成为具身世界模型领域的评测金标准。

Manifold AI 的联创团队也联合国内外十多所高校提出面向具身世界模型的统一评测体系 WorldArena。

最早专注于世界模型的公司

Manifold AI 成立于 2025 年 5 月底，聚焦于研发具备物理真实的世界模型和具身智能应用，也是国内第一家自研世界模型做为具身基础模型落地到机器人的创业公司。

虽然成立时间不久，但每次技术发布都颇具份量。

去年成立初期的几个月，Manifold AI 就发布了用于机器人的世界模型 RoboScape 和用于无人机的世界模型 AirScape，分别收录于计算机顶级会议 NeurIPS 和 ACM MM 。

正如官网的标语说的那样“Better World Model For Better World”， Manifold AI 相信世界模型不只是各个领域的应用模型，而是更好的基础模型会带来更强的泛化能力，带来物理 AI 各个应用场景的能力持续进化。

之后的几个月，他们聚焦在世界模型的基础设施的搭建和数据 Scaling，研发更加通用的基础世界模型。

今年年初，Manifold AI 发布了WorldScape 世界模型，是世界范围内首个同时支持移动和操作交互的实时世界模型，并以此作为机器人的预训练基模。

今天登顶世界模型榜单 WorldScore 的正是 WorldScape v0.1 版本。而这只是一个开始，模型的能力正在快速地提升中。

同期，Manifold AI也发布了WorldScape Policy具身世界-动作模型。

WorldScape Policy利用世界模型基模进行时空状态预测，并结合视觉输入进行空间内生推理从而执行动作，精度上全面超过现有VLA模型，具备少样本零样本执行能力。

Manifold AI的初创团队有来自Momenta、小鹏、元戎等自动驾驶领域的技术专家，他们深知稳固的基础设施是模型持续迭代的基础。

从第一天起，Manifold AI就持续在基建方面投入，坚持硬件-数据-模型的闭环迭代，自主研发了从Ego-Centric、UMI、到RL采测一体等多种数采设备，搭建了模型驱动的数据管线，通过数据采集、数据过滤、数据增强、数据标注等环节持续产生规模化的高质量数据，日产能超过10万clips。

概念未火时成立，10个月斩获5轮融资

Manifold AI成立于2025年5月底，昔时“世界模型”在国内资本圈还是个比较小众的概念，而随着2025年下半年Google DeepMind发布Genie 3、李飞飞World Labs发布RTFM实时世界生成模型，越来越多的资本开始布道世界模型、发现国内居然已经有了这家可以对标海外顶尖团队的公司。

今天，公司宣布完成数亿元Pre A+轮融资，由顺禧基金领投，银杏谷资本、复星锐正、金雨茂物、同创伟业跟投。其成立10个月已累计获得五轮融资，包括了君联资本等顶级创投和华为哈勃等知名产业投资。

这批黑马没有聘请外部FA机构，甚至没有专职融资员工，但资本市场的认可度侧面证明了其超前的技术判断力和扎实的研发成果。

创始人兼CEO武伟博士为前商汤科技高管，2015年加入商汤初创，有数百人的团队管理经验，早在2023年开始就主导了商汤世界模型的研发和落地，曾连续两年击败特斯拉团队获得Waymo SimAgents比赛第一。

联合发起人为清华大学教授、教育部长江学者，发表过包括十余篇Nature子刊在内的数百篇学术论文，多次入选全球前2%科学家，其所带领的实验室建立并维护了具身世界模型的世界权威评测平台WorldArena。

Manifold AI创始团队还包括多位来自微软、Momenta、小鹏等AI名企的技术总监，以及前中国最年轻的券商网金部总经理，也不乏00后的天才少年，强大的技术背景和运营能力助力了模型架构和应用能力的快速迭代演进，“Better World Model For Better World”是他们共同的信仰。