近日,昆仲天使投资企业「戴盟机器人」联合创始人兼首席科学家王煜受邀出席以“让AI成为创新生产力”为主题的联想Tech World2025创新科技大会。大会上,二百余位产学研各界精英与权威专家汇聚一堂,共同分享具身智能的最新科研成果及实践经验,积极探索 AI 技术在具身智能领域的创新突破路径与商业化落地模式。
围绕机器人如何获得丰富的操作能力、机器人如何落地实用场景等问题,王煜教授分享了《具身智能——机器人操作技能与人工智能技术融合》的主题演讲。
机器人落地工业应用场景,关键在于灵巧操作能力
王煜教授在演讲之初提出:今年或为人形机器人工业应用元年。他强调,机器人实现工业场景落地的核心在于突破精细操作与任务泛化能力——一旦机器人掌握灵巧操作技能,其应用场景将广泛拓展。
以半导体和电子产品的制造场景为例,虽然前端工序已高度自动化,但后端异形零件装配仍严重依赖人工。普通工人经短期培训即可胜任的工作,对机器人却是巨大的挑战。王煜教授认为,机器人系统需构建具备认知决策能力的“大脑”与泛化操作能力的“小脑”协同架构,让机器人真正拥有灵巧操作的能力。
机器人无法完成简单任务的背后——论触觉对于灵巧操作的重要性
王煜教授指出,当前业界普遍采用视觉-语言-动作(Vision-Language-Action,VLA)大模型来实现机器人操作。在该框架下,视觉模块(V)使机器人能够解析环境场景,语言模块(L)帮助其理解操作指令,而动作模块(A)则负责将语义信息转化为具体的运动、操作执行。然而他强调,机器人实现从语言理解到精准动作的执行仍面临挑战。
他补充,实现机器人的基础移动功能(Locomotion)相对简单,而使其完成复杂操作任务(Manipulation)则有难点——这要求机器人必须掌握真正的操作技能与执行能力。
人类可以轻松完成拧螺丝、拧瓶盖等操作,这得益于双手敏锐的触觉、力觉反馈和手指形变等感知信息。但对机器人而言,这些看似简单的动作却极具挑战——关键在于缺乏触觉感知。没有触觉感知的机器人,不仅操作速度缓慢,更难以完成精细、复杂的任务。
王煜教授介绍,戴盟在开始做人形机器人之初,便将触觉传感器确立为最重要的产品开发。今年4月,戴盟发布了全球首款多维高分辨率高频率视触觉传感器DM-Tac W。DM-Tac W采用了基于单色光的图案追踪原理的技术路线,成功攻克了视触觉传感器算力要求高、发热量大、耐用性差等难题,显著降低了生产成本。
DM-Tac W赋予夹爪等执行末端类人触觉能力,已应用于工业自动化、消费电子、智慧物流等场景。基于此,戴盟还将视触觉传感器的厚度开创性地减少到毫米级别,可轻松集成于五指灵巧手等执行末端。
业界共识与趋势:通过大规模、高质量数据进行机器人模仿学习
王煜教授引用其导师Matthew Mason的观点指出:机器人操作面临的根本挑战在于与真实世界的交互,真实世界既遵循物理规律,又充满不确定性——并非所有现象都能被完全理解和预测。若缺乏丰富的感知能力,机器人将难以应对环境变化,从而影响任务完成度。
今年,戴盟全球首款多维高分辨率高频率视触觉传感器DM-Tac W,已在具身智能领域树立了技术与产品的双重标杆,基于前沿的触觉感知技术,戴盟将持续挖掘机器人学习方法。
王煜教授分享了行业最新动态:波士顿动力与英伟达达成战略合作,共同开发基于人类行为建模的“大行为模型”(Large Behavior Model)。该技术路线不依赖传统物理事件模型,采用仿真数据建立基础的模型,通过引入真实数据来进行训练并得到真实可靠的模型,进一步引入操作与人机交互的真实数据来提升模型可靠性。
他提到,当前机器人模仿学习主要采用两种训练路径:一是通过仿真环境生成的数据进行训练,二是通过真实物理世界中机器人操作的数据进行训练。第二种方式需要大规模、高质量数据支撑,低质量数据反而会影响学习效果。为此,戴盟推出了穿戴式遥操作系统DM-EXton,专为机器人远程操控、数据采集及学习训练而设计。
从神经科学视角看机器人设计:聚焦于核心功能需求
王煜教授还从神经科学的角度分享了他对未来机器人设计的思考。人类大脑皮层的功能分配揭示了操作能力的生物学基础,通过经典的感官脑皮小人(Sensory Homunculus Model)可见,大脑皮层中负责面部和手部功能的区域占据了最大比例,这印证了人类的智慧主要服务于精细操作、语言交流和社会互动等需求。
他认为,真正实用的机器人未必会完全仿照人类形态,而是聚焦于核心功能需求。未来的机器人可能会拥有一双高度发达的手,凭借强大的感知能力、丰富的灵巧度完成精细、复杂的操作任务,满足不同落地场景的需求,展现真正的社会价值。