超越资本狂热:具身智能的死亡之谷与真实拐点

2025/10/02

作者:彭昭(智次方创始人、云和资本联合创始合伙人)物联网智库 原创

这是我的第389篇专栏文章。

过去这段时间,关于“具身智能”的讨论和投入几乎达到了前所未有的“疯狂”状态。头部企业重仓下注,创投圈高频出手,产业巨头与创业公司同台竞技,一时间“具身智能”成了资本和媒体的宠儿。市场上,更是频频涌现出数十亿级的融资大单,产业链上下游如火如荼,仿佛谁慢一步就要错失时代红利。

然而,热潮之下,冷静的声音并未消失。

正如《经济日报》所言,别再搞一哄而上的“人工智能+”。这句警语不仅点中了中国AI产业的“成长烦恼”,也为当下这场全球范围内的具身智能竞赛敲响了警钟。

在资本、政策和技术驱动的三重推力下,我们更需要回头看看,除了“融资热”和“明星企业”,还有什么才是真正值得长期关注和深度思考的命题?

具身智能的浪潮,确实带来了想象空间和产业机遇。

它不仅是AI从虚拟世界走向物理世界的里程碑,更被视作“下一个通用技术平台”。但如果我们只停留在融资排行榜、Demo视频和PPT故事之中,忽视了创新的可持续性、技术的现实边界、产业的生态健康以及社会的伦理责任,所谓的“热潮”很快就会像以往的技术泡沫一样退去,甚至带来更大失望和资源浪费。

因此,本文希望跳出“资本狂热”和“赛道爆发”的表层逻辑,将目光转向技术创新、产业落地、责任治理、社会价值等更具深度与可持续性的议题。

让我一起从热闹的背后去反思:热潮之下还有哪些值得思考的创新命题?在资本和技术之外,我们需要怎样的产业耐心和培育机制?只有这样,这场AI与物理世界的深度融合,才能真正开花结果。

资本狂欢背后:具身智能产业的真实分层

上面的长名单还在继续,2024年到2025年的具身智能领域,资本市场上演了一场罕见的集体狂欢,单笔融资更是屡创新高。

无论是欧美的Figure AI、1X、Boston Dynamics,还是中国的智元机器人、傅利叶、宇树科技等本土新贵,都在资本推波助澜下加速扩张,成为产业新闻的头条主角。

巨头公司与创新独角兽频频达成战略合作,头部资源迅速向少数领跑者聚拢,产业链上下游的马太效应加剧。“头部收敛、巨头绑定”成了这个周期的主旋律。

不可否认的是,中国在全球具身智能的发展中,承担了半壁江山的作用。根据麦肯锡的分析,按照现有趋势发展,到2040年全球具身智能的市场规模将达到3700亿美元,中国市场占据50%的份额。

但热闹背后,是一个更加冷峻而复杂的行业现实。随着大额资本涌入,具身智能领域的“二八分化”愈发明显。

获得融资和资源的企业可以快速扩充技术团队、攻克关键环节、加大市场投入,甚至提前布局跨界生态。而大量中小企业却在这轮资本洪流中被边缘化,研发进度受限,融资渠道收紧,市场空间被进一步压缩。

某种意义上,产业洗牌期已然来临。能否熬过资本的周期性波动,成为企业能否“活得久、走得远”的关键门槛。

资本堆叠和估值飞涨并不意味着创新能力的同步跃升。回顾这一波具身智能融资潮,我们可以看到大量资金更多流向了“规模化生产”“市场占位”乃至“明星团队”本身,而真正面向底层技术突破与长期ROI的耐心资本依然稀缺。

至今,能够被称为“杀手级应用”的商用案例仍然屈指可数,无论是人形机器人还是多功能移动平台,绝大多数应用还处于小规模试点或演示验证阶段。

“融资热≠创新突破”“Demo≠生产力”成为行业内部越来越响亮的反思声音。资本的推动固然重要,但只有那些真正穿越产业周期、愿意等待技术成熟、敢于深耕复杂场景的团队,才有可能在下一轮产业升级中站稳脚跟。

具身智能的“空间革命”:从堆叠到进化

任何一次真正意义上的技术革命,都远不止于“功能加法”或者简单的堆叠与升级。具身智能领域的最新突破,正是如此。行业最深层的创新,不再局限于AI大模型与硬件的机械组合,而是源于空间智能、三维世界生成、多模态感知与推理能力的质变。

上图梳理了AI从感知世界到深度融入和变革物理世界的能力演进路径。

空间智能让AI具备了理解和重建三维空间结构的能力,相当于为AI“打开了眼界”;在此基础上,具身智能让AI能够通过感知、运动和反馈实现与真实环境的动态交互,真正“体验”世界;最终,物理AI则代表着AI不仅能够认知和学习,还能在复杂的平台和生态系统中部署和协作,从而推动现实世界的深刻变革。

以空间智能的新锐项目World Labs为代表,AI系统已经进化到能够基于图像、文本、音频、视频等多源输入,完成复杂的空间认知和动态推理。它们不仅“看得到”,更能“理解环境”,甚至能够基于一张二维图片,推演和还原出完整的三维世界结构。

这种空间感知与动态预测的能力跃迁,为工业机器人、虚拟现实、自动驾驶等领域提供了全新的通用底座,也意味着机器不再是被动执行的“机械体”,而是真正具备“自适应世界”的智能体。

多模态融合与“交互智能”的崛起,正在让AI迈入全新的发展阶段。相比传统只能处理单一感知信息的机器人,如今的具身智能正朝着“全感知、全对话、全反馈”的交互型智能体演进。

AI不只是理解图像或语音,更能综合多种信号,实现自然语言对话、环境感知、即时响应和复杂任务的动态调整。这种多模态认知能力,正在催生出比ChatGPT更具“行动力”和“迁移能力”的AI新物种。

更重要的是,这场空间智能和多模态认知的革命,倒逼产业必须跳出“堆硬件、卷参数”的旧有路径。中国具身智能产业如果一味追求硬件规模扩张、参数堆砌和PPT式创新,终将错失全球空间智能与软硬协同的战略窗口。


网站已关闭

您的网站已到期,请及时续费
联系电话:400-606-1198