超越资本狂热:具身智能的死亡之谷与真实拐点-军工资源网—

超越资本狂热:具身智能的死亡之谷与真实拐点

2025/10/02

作者：彭昭（智次方创始人、云和资本联合创始合伙人）物联网智库原创

这是我的第389篇专栏文章。

过去这段时间，关于“具身智能”的讨论和投入几乎达到了前所未有的“疯狂”状态。头部企业重仓下注，创投圈高频出手，产业巨头与创业公司同台竞技，一时间“具身智能”成了资本和媒体的宠儿。市场上，更是频频涌现出数十亿级的融资大单，产业链上下游如火如荼，仿佛谁慢一步就要错失时代红利。

然而，热潮之下，冷静的声音并未消失。

正如《经济日报》所言，别再搞一哄而上的“人工智能+”。这句警语不仅点中了中国AI产业的“成长烦恼”，也为当下这场全球范围内的具身智能竞赛敲响了警钟。

在资本、政策和技术驱动的三重推力下，我们更需要回头看看，除了“融资热”和“明星企业”，还有什么才是真正值得长期关注和深度思考的命题？

具身智能的浪潮，确实带来了想象空间和产业机遇。

它不仅是AI从虚拟世界走向物理世界的里程碑，更被视作“下一个通用技术平台”。但如果我们只停留在融资排行榜、Demo视频和PPT故事之中，忽视了创新的可持续性、技术的现实边界、产业的生态健康以及社会的伦理责任，所谓的“热潮”很快就会像以往的技术泡沫一样退去，甚至带来更大失望和资源浪费。

因此，本文希望跳出“资本狂热”和“赛道爆发”的表层逻辑，将目光转向技术创新、产业落地、责任治理、社会价值等更具深度与可持续性的议题。

让我一起从热闹的背后去反思：热潮之下还有哪些值得思考的创新命题？在资本和技术之外，我们需要怎样的产业耐心和培育机制？只有这样，这场AI与物理世界的深度融合，才能真正开花结果。

资本狂欢背后：具身智能产业的真实分层

上面的长名单还在继续，2024年到2025年的具身智能领域，资本市场上演了一场罕见的集体狂欢，单笔融资更是屡创新高。

无论是欧美的Figure AI、1X、Boston Dynamics，还是中国的智元机器人、傅利叶、宇树科技等本土新贵，都在资本推波助澜下加速扩张，成为产业新闻的头条主角。

巨头公司与创新独角兽频频达成战略合作，头部资源迅速向少数领跑者聚拢，产业链上下游的马太效应加剧。“头部收敛、巨头绑定”成了这个周期的主旋律。

不可否认的是，中国在全球具身智能的发展中，承担了半壁江山的作用。根据麦肯锡的分析，按照现有趋势发展，到2040年全球具身智能的市场规模将达到3700亿美元，中国市场占据50%的份额。

但热闹背后，是一个更加冷峻而复杂的行业现实。随着大额资本涌入，具身智能领域的“二八分化”愈发明显。

获得融资和资源的企业可以快速扩充技术团队、攻克关键环节、加大市场投入，甚至提前布局跨界生态。而大量中小企业却在这轮资本洪流中被边缘化，研发进度受限，融资渠道收紧，市场空间被进一步压缩。

某种意义上，产业洗牌期已然来临。能否熬过资本的周期性波动，成为企业能否“活得久、走得远”的关键门槛。

资本堆叠和估值飞涨并不意味着创新能力的同步跃升。回顾这一波具身智能融资潮，我们可以看到大量资金更多流向了“规模化生产”“市场占位”乃至“明星团队”本身，而真正面向底层技术突破与长期ROI的耐心资本依然稀缺。

至今，能够被称为“杀手级应用”的商用案例仍然屈指可数，无论是人形机器人还是多功能移动平台，绝大多数应用还处于小规模试点或演示验证阶段。

“融资热≠创新突破”“Demo≠生产力”成为行业内部越来越响亮的反思声音。资本的推动固然重要，但只有那些真正穿越产业周期、愿意等待技术成熟、敢于深耕复杂场景的团队，才有可能在下一轮产业升级中站稳脚跟。

具身智能的“空间革命”：从堆叠到进化

任何一次真正意义上的技术革命，都远不止于“功能加法”或者简单的堆叠与升级。具身智能领域的最新突破，正是如此。行业最深层的创新，不再局限于AI大模型与硬件的机械组合，而是源于空间智能、三维世界生成、多模态感知与推理能力的质变。

上图梳理了AI从感知世界到深度融入和变革物理世界的能力演进路径。

空间智能让AI具备了理解和重建三维空间结构的能力，相当于为AI“打开了眼界”；在此基础上，具身智能让AI能够通过感知、运动和反馈实现与真实环境的动态交互，真正“体验”世界；最终，物理AI则代表着AI不仅能够认知和学习，还能在复杂的平台和生态系统中部署和协作，从而推动现实世界的深刻变革。

以空间智能的新锐项目World Labs为代表，AI系统已经进化到能够基于图像、文本、音频、视频等多源输入，完成复杂的空间认知和动态推理。它们不仅“看得到”，更能“理解环境”，甚至能够基于一张二维图片，推演和还原出完整的三维世界结构。

这种空间感知与动态预测的能力跃迁，为工业机器人、虚拟现实、自动驾驶等领域提供了全新的通用底座，也意味着机器不再是被动执行的“机械体”，而是真正具备“自适应世界”的智能体。

多模态融合与“交互智能”的崛起，正在让AI迈入全新的发展阶段。相比传统只能处理单一感知信息的机器人，如今的具身智能正朝着“全感知、全对话、全反馈”的交互型智能体演进。

AI不只是理解图像或语音，更能综合多种信号，实现自然语言对话、环境感知、即时响应和复杂任务的动态调整。这种多模态认知能力，正在催生出比ChatGPT更具“行动力”和“迁移能力”的AI新物种。

更重要的是，这场空间智能和多模态认知的革命，倒逼产业必须跳出“堆硬件、卷参数”的旧有路径。中国具身智能产业如果一味追求硬件规模扩张、参数堆砌和PPT式创新，终将错失全球空间智能与软硬协同的战略窗口。

超越资本狂热:具身智能的死亡之谷与真实拐点

分享到

网站已关闭