大模型赋能机器狗,西工大离线具身智能研究取得新突破!
发布日期:2024-03-21 


“啪嗒啪嗒......”,一只机器狗在街上迈着规律的步伐,拉着牵引绳的盲人,在它的带领下越过沿路障碍,平稳地行走着。电子导盲犬能否取代传统导盲犬,解决视障人士一犬难求的困境?西工大团队在此方面开展研究攻关,并取得了新的突破。

近日,西北工业大学光电与智能研究院联合中国电信人工智能研究院在探索离线具身智能应用方面取得阶段性进展。具身智能,即具有物理实体,能够通过传感器和执行器与环境进行实时互动,执行相应指令或进行决策的智能机器。
李学龙教授团队将机器狗搭载离线大模型,应用在智能导盲场景,开发出大模型离线具身智能导盲犬,并实现了其智能人机交互、智能乘梯引导、智能过街引导、智能室内引导等功能。
该成果进一步展示了使用离线具身智能导盲犬代替传统导盲犬的可能性,同时验证了离线具身智能范式的可行性,使大模型具身智能机器人可以脱离互联网环境,应用在无网或网络信号不佳的工况环境,进一步拓展了临地安防的应用场景。
近年来,随着机器人技术和SLAM导航技术的快速发展,针对电子导盲犬的探索也层出不穷。然而受制于自然语言处理技术的限制,上一代电子导盲犬仍然欠缺和人类“自由对话”的能力,也难以为视障人士提供情感陪伴。
大模型及具身智能技术的出现使电子导盲犬实现这种高级能力成为可能。但机器狗的低算力计算平台难以支撑大模型运行所需的海量计算资源,通常只能通过请求云服务的“在线具身智能”范式获得大模型的高级能力,这严重限制了电子导盲犬的场景应用范围。
电子导盲犬
为此,李学龙教授团队结合目前最新的大模型量化压缩和加速推理技术,成功将大模型部署至机器狗的低算力计算平台,验证了“离线具身智能”范式的可行性。
目前通过实验,团队开发的离线具身智能导盲犬已能够与视障人士流畅沟通指令,并带领其通过马路、楼梯、电梯等多样复杂环境,验证了离线具身智能导盲犬的智能人机交互能力、电梯弱网络环境下的智能乘梯引导能力、实时性要求较高的智能过街引导能力和智能室内引导能力等。
离线具身智能导盲犬指引视障人士进电梯
离线具身智能导盲犬指引视障人士过马路
该成果证明了离线具身智能导盲犬代替传统导盲犬的可能性,同时验证了离线具身智能范式的可行性,使大模型具身智能机器人可以脱离互联网,应用在无网或网络信号不佳的工况环境,提供更加实时的智能响应以及更好的人机交互体验。

未来,团队将进一步优化具身智能导盲犬技术方案,与电信星辰大模型相结合,探索在线与离线相融合的分布式异构具身智能方案,进一步拓宽离线具身智能导盲犬及更多智能机器人平台的应用场景,有效赋能工业生产智能化,加快形成新质生产力。
拓展阅读:
李学龙, 临地安防(Vicinagearth security), 中国计算机学会通讯, 18(11), 44-52, 2022.
全文下载:
https://dl.ccf.org.cn/article/articleDetail.html?type=xhtx_thesis&_ack=1&id=6219452051015680

文章来源:西北工业大学