物理世界模拟器:通用人工智能 AGI 真正的角逐场


物理世界模拟器:下一个必争之地

从春节假期至今,Sora 作为 OpenAI 开发的一种先进人工智能视频生成模型,已经给了各行各业一点点“AI 暴击”。除了生成视频准确逼真的视觉效果、流畅丝滑的视角切换,以及 60s 的超长时间,最令人兴奋的,还是——

所谓构建“世界模拟器(world simulators)”的愿景:不少支持者认为,Sora 代表的人工智能,已经掌握了世界物理模型,通过人工智能学习理解并模拟现实世界的各种场景和物理动态,从而达到一个前所未有的模拟能力和智能水平。

在 OpenAI 看来,这种融合了现实物理世界规律的“物理世界模拟器将能够提供更加真实和精确的模拟结果,这对于科学研究、工程设计、教育培训以及娱乐产业等多个领域都可能产生深远的影响。”

经历了生成式 AI 狂飙突进的 2023 年,想要再进一步实现世界模拟器(甚至通过它进一步实现具身智能和所谓 AGI),一要看着逼真,二要物理正确。不管 Sora 现阶段做得如何,至少 OpenAI 已经意识到了。

OpenAI 官方研究报告

不止是 OpenAI,英伟达也对物理世界的真实模拟深以为然。英伟达 CEO 黄仁勋表示,人工智能的下一个浪潮将是具身智能(embodied AI),即能理解、推理、并与物理世界互动的智能系统。

刚刚履新英伟达通用具身智能体研究小组 GEAR 负责人的高级科学家 Jim Fan,就对 Sora 所蕴含的数据驱动的物理引擎的能力给予了高度评价。他认为虽然 Sora 还没达到完全真实模拟物理世界的程度,但是已经具备了一定学习和还原真实世界的能力。

Jim Fan 还强调,2024 年将是属于机器人、游戏 AI 和模拟的一年。GEAR 正在构建基础智能体:一个具有通用能力的 AI,可以在许多虚拟和现实的世界中学习如何熟练地行动。

英伟达更是对这个方向寄予厚望。Jim Fan 宣称,GEAR 团队可能是全球最有钱的具身智能实验室,准备了足够的资金一次性解决机器人基础模型、游戏基础模型和生成式模拟。

当然,在“吹捧” Sora 的同时,英伟达也从不放过机会秀秀自己的肌肉:Omniverse,Issac Sim,Eureka,Voyager 等等,显示出极大的决心和极充分的技术资源储备。仿佛在传递“也许 Sora 还做不到真正的物理世界模拟,但英伟达要做就肯定要做真的”的信息。

至于 Sora 作为物理模拟器有多大潜力,英伟达是否是捕蝉螳螂后面的黄雀,我们拭目以待。

那么说了这么多,到底怎么定义物理模拟器呢? 

什么是物理模拟器?物理模拟器能做什么?

物理模拟器可以理解成一种技术工具或平台,旨在模拟真实世界的物理规律、环境行为和交互逻辑。这种模拟器可以通过数字模型来重现现实世界中的场景、物体和事件,从而提供一个虚拟的环境,用于研究、测试、设计或训练等目的。

物理模拟器的应用场景非常广泛。像直面大众消费的虚拟现实和游戏开发领域,通过模拟真实世界的物理规则和行为,虚拟现实和游戏可以提供更加逼真和沉浸式的体验。在工业领域,物理仿真已经成为智能制造的核心技术,工程师们可以在虚拟环境中测试和优化设计方案,减少实际制造过程中覆盖海量 corner case 的试错成本。在科学研究中,也是模拟试验的必备手段。

以手机测试做个简单的例子。当厂家在研发手机的时候,跌落试验是必经的步骤,通过检测各种情况下跌落,通过观察手机的损坏程度,来改进手机设计,以便符合设计质量标准。

最初的跌落试验,就是实体测试,即简单地让机械手各种方式拿着手机然后松开,让手机一次一次真实地跌落。例如华为拆分出了 11 个维度和 3000 多个测试用例,用机械臂一下一下地测试。

这种笨办法是足够真实,但也能看出有不少问题。

  • 一是仍然不能覆盖所有可能发生的情况。比如说跌落在水泥地还是瓷砖上,屏幕着地还是边缘着地,跌落高度多少?各种各样千奇百怪的场景和设定(corner cases),不可能完全穷尽。
  • 二是效率很低,需要在一个一个地测试,耗费大量的时间和人力,还要在跌落后不停测试和记录、反馈。一般需要加班加点,才能赶得上产品开发和发售的进度。
  • 三是成本非常高,报废的手机非常多。也是因为成本过高,因此只能选少数集中测试场景,覆盖度不够,又回到了最初的问题,影响了测试的结果,进而影响了产品的性能和好评度。

物理模拟器可以很好的解决上述问题。通过在系统中设定产品的物理参数,包括材质、碰撞、压力、加速度、碰撞角度等,可以在计算机上物理模拟仿真所有跌落行为。华为计算过,整个跌落试验只需要 8 个小时就能拿到结果,节省了时间、人力、物力各种成本,极大地加快了手机的研发进程。

比起单一任务的手机跌落测试,人工智能的下一个浪潮具身智能(embodied AI),作为能理解、推理、并与物理世界互动的智能系统,产品涉及的维度和参数空前提升,测试的难度、成本、时间周期也被大大拉长了。实体测试的时间和成本都变成了天文数字,完全指望实体测试进行产品研发变得越来越不现实。越来越多的仿真工具被应用到具身智能的研发和测试中。

其中,物理模拟的仿真训练是核心突破点。仿真软件 CAE、英伟达的 Omniverse、松应科技的 Orca Studio 都是提供物理仿真的模拟器。它们实现了大部分的物理规律的数字化重构,比如包含偏微分方程,可以模拟临界状态的灾变机理,从而还原真实的世界。

以上的物理模拟器,在通用 AI 领域可以通过数据方程的工程化表现,来适应虽然多样化但相对有限的工程场景要求,最终达成具身智能的通用性,服务社会。可以说,具身智能是强人工智能或通用人工智能的终极追求,具身智能的成功落地必然有优秀的物理模拟器作为支撑和必要条件。

怎样实现物理模拟器?合格的物理模拟器有哪些特征?

为了实现对现实世界中的物理现象和行为进行准确的复现这一目标,物理模拟器需要利用先进的数学方法、跨学科定律、计算技术和算法等。

物理模拟是复杂的。尽管物理定律本身是确定的,但模拟真实物理世界却面临着众多的挑战。像手机跌落试验,牵涉到场景、角度、力度等等,如何准确模拟多个物体之间的相互作用和运动轨迹是一个巨大的挑战。所以,物理模拟器需要采用先进的算法和技术来提高模拟的准确性和稳定性。

我们认为物理模拟器需要具备以下四大功能:

1. 物理正确

物理正确是模拟器的核心。它要求模拟器能够准确地模拟现实世界中的物理定律和规律,如重力、碰撞、刚体动力学、速度、声场、光场等。这种模拟需要精确的算法和模型来确保虚拟世界的真实性和准确性。物理模拟的精度直接影响到模拟结果的可信度和实用价值。

这是大语言模型不具备的。像 Sora 是由文本生成视频,受限于文本是离散的、具有有限数量的符号;也许可以做到形似,但几乎做不到精准建模,尤其是对复杂系统和缺乏足够学习样本的 corner case。

2. 计算机视觉数据更真实

人类 80% 以上的外界信息依靠视觉获得,而高清渲染技术对于提供逼真的计算机视觉信息至关重要。

高清渲染包括光照模型、纹理映射、阴影和反射等效果的实现,以提供视觉上接近真实世界的模拟环境。借助 RTX 实时光线追踪和 PT 路径追踪渲染器打造逼真效果,以及通过 MaterialX 材质定义支持实现基于物理属性的逼真渲染。

例如高清渲染助力清洁机器人基于相机对商场工作环境中,根据高清图像实时捕捉、分析和识别多种垃圾类型,包括对地面液体的准确识别,并及时清理。液体在光滑地面和光线反射下,常常被误认为是其他物体的倒影,比如绿植,模特,墙面广告等,机器人由于缺乏多视角,多样化环境的训练,从而无法准确识别,并选择忽视,造成清洁效果不佳,还需要额外配置清洁人员辅助,既没有提升效率,也没有降低成本。

Orca Sim 仿真扫地机器人:生成的 3D 高清渲染场景

3. 统一数据格式和交互标准

物理模拟器会从各种信息源和吸收、交换和集成各种多模态数据。需要物理模拟器与各种其他系统和工具进行高效的链接,例如从其他来源导入数据(如工厂模型、机器人模型、地形数据等),以及将模拟结果导出给其他系统以供进一步分析或使用。要驾驭这样一套复杂精密的系统,“书同文”的工作必不可少。

所以,采用一种统一的数据格式和交互标准变得至关重要。openUSD(Universal Scene Description)作为一种新兴的开源标准,在物理模拟领域必不可少。USD 旨在提供一种通用的、可扩展的描述三维场景及其元素(包括几何、材质、光照等)的方式,支持多种软件和平台间的数据交换。

通过采用 openUSD 作为统一的数据格式和交互标准,物理模拟器可以实现与其他系统和工具的无缝对接。像宝马基于 openUSD 统一数据格式连接不同 DCC 软件,集成造车的仿真虚拟场景,让各个软件和系统整合运行起来——包括装配线,装配线上的汽车,以及机器人和物流体系等。最终极大地提升了效率:在数字工厂规划阶段效率提高了约 30%,整车制造阶段缩短到每 56 秒生产一辆车。

此外,不论是从 GIS 系统导入地形数据、BIM 系统的建筑模型数据,还是从 CAD 软件导入工厂设备和机器人模型,都可以通过 openUSD 进行高效、准确的数据转换和传递。通过 DataLink 数据管线,这一过程都是实时的。同时,物理模拟器的输出结果也能以 openUSD 格式输出,方便其他系统和工具进行后续处理和分析。

宝马:采用 三维智能数字工厂 模拟和优化生产线

4. 传感器模拟与终端数据传输

多种类的传感器传输是物理模拟器与真实物理世界进行交互的关键。通过传感器传输,模拟器可以接收来自现实环境的输入(如位置、速度、温度、声音等),并将模拟结果发送回实际控制系统,实现闭环控制和反馈。这种交互使得模拟器不仅仅是一个孤立的虚拟环境,而是能够与真实世界进行实时互动和响应的系统。

传感器模拟与传输技术为物理世界模拟器的实际应用提供了无限的可能性,如工业控制、自动驾驶、智能机器人操作等领域。

在统一数据格式的基础上,Orca Studio可以通过连接各种传感器,并进行高效率数据传输,实现从传感器到物理模拟,输出结果,辅助决策的闭环。

 Orca Sim:机器人碰撞模拟和路径优化

以上技术共同作用,使得物理模拟器能够模拟真实世界的物理规律、提供逼真的视觉体验、实现与其他系统的数据交换和集成,并与真实世界进行实时互动。

物理模拟器对中国企业的重大意义,我们可以做些什么? 

2024年政府工作报告指出,加快数字经济发展一方面“要深化大数据、人工智能等研发应用,开展“人工智能+”行动” 。另一方面,要“实施制造业数字化转型行动。”可以说,发展新质生产力,离不开传统制造业的智能化。而我国超过4400家的人工智能企业,也需要在广阔的产业中寻找生根落地的契机。物理世界模拟器将作为重要的工业软件和人工智能的基础设施,作为桥梁链接AI和智能制造。

2023年12月,《工业和信息化部等八部门关于加快传统制造业转型升级的指导意见》指出,”传统制造业是我国制造业的主体,是现代化产业体系的基底。推动传统制造业转型升级,是主动适应和引领新一轮科技革命和产业变革的战略选择,是提高产业链供应链韧性和安全水平的重要举措,是推进新型工业化、加快制造强国建设的必然要求,关系现代化产业体系建设全局。”我国拥有全世界最完整的产业体系,制造业总体规模连续14年保持全球第一。目前全国已建设近万家数字化车间和智能工厂。

无论是数字化车间还是智能工厂,对能够理解、推理并与物理世界互动的人工智能体的需求量将大大提升。无论是厂房的数字化改造,还是具身智能的数据和测试,集成了物理模拟器的仿真平台起着决定成败的关键作用。如何高效经济地提高模拟的精度和逼真度、如何实现实时交互,以及如何将仿真结果应用到实际的问题,都与所选用的三维仿真模拟平台密不可分。

自主可控的对于中国的具身智能仿真平台,对我国具身智能产业的成败决定性作用。

松应科技推出的Orca Sim专门提供包括人形机器人在内的多种类型机器人仿真模拟,可以在各种不同的逼真环境中构建和测试虚拟机器人。

通过核心虚拟仿真技术,开发人员可以创建智能体、环境以及可能需要的其他实体的数字版本。虚拟环境同样会遵守物理定律,并模拟现实世界的重力、摩擦、材料和光照等条件。最终达成目的,验证、确认和优化机器人的设计和系统及其算法。

Orca Sim 机器人三维仿真模拟平台作为新型智能工业软软件,全面链接AI智能体与智能制造,必将为新质生产力的发展贡献力量。

松应科技正在积极布局人工智能体(AI Agent)结合引擎的物理级仿真技术,进行具体行业、落地场景的大数据模型训练;可以在不需要人为干预的情况下,自主地与环境进行交互,并做出决策。

总的来说,AI 人工智能技术和物理模拟器的不断融合,有利于构建多物理场耦合模型,综合考虑多个物理体的影响,实现更加精确的模拟。在 AI 下半场中,物理模拟器将发挥更加深入和广泛的作用,推动人工智能走进现实生活。

基于物理规律和高精度数据的物理世界模拟器,正在加速驱动 AI 人工智能与物理世界的深度融合

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注