中科视语重磅发布 LightPlanner!首个开源轻量化具身推理大模型,打破机器人轻量与推理能力困局
中科视语在具身智能领域再获突破!此前,中科视语发布了PhysVLM——首个开源机器人物理空间具身大模型。该模型突破了传统模型普遍存在的局限,通过多模态感知、动态环境建模与自主决策规划的深度融合,PhysVLM成功赋予机器人在复杂物理空间中类人级的操作能力。
当前,中科视语再次取得关键进展,发布首个开源轻量化具身决策深度推理大模型——LightPlanner,通过创新的层次化决策框架,成功突破边缘设备上 “轻量与智能不可兼得” 的行业难题,为机器人在物流、制造、服务等场景的规模化部署奠定了技术基础,持续引领具身智能技术的创新与发展。
让边缘端机器人“既能思考又能行动”
传统大语言模型(LLM)在具身任务中展现了强大的语义理解能力,但其庞大的参数规模难以在边缘设备上高效运行。轻量级模型虽解决了算力限制,却因缺乏复杂推理能力,如在 “抓取最大积木” 等需动态逻辑判断的任务中表现乏力。这一“推理能力瓶颈”已成为制约轻量级具身智能系统规模化应用的核心障碍。
图1: LightPlanner与主流任务规划方法的对比
针对这一挑战,中科视语提出了首个具身规划决策的轻量化深度推理大模型——LightPlanner。借鉴DeepSeek-R1在复杂任务推理中的成功经验,LightPlanner通过创新的层次化深度推理和动态参数化技能控制方法,充分释放了多种规格轻量级LLM的推理能力,以提升其在复杂任务规划中的性能。LightPlanner在机器人规划决策任务中复现了类似DeepSeek-R1的“回溯、反思、纠错”行为,从而显著提高了任务规划的准确性和系统的鲁棒性。
图2: LightPlanner在决策推理时出现的“回溯、反思、纠错”行为
图3: LightPlanner框架,生成层次化深度推理与动态技能控制
LightPlanner三大核心创新突破
● 层次化深度推理
模拟人类决策逻辑,在每一步执行前触发三层验证:
· 执行反馈:通过历史记忆动态修正偏差,实现 “错误自愈”;
· 语义一致性:确保子动作与全局任务目标对齐;
· 参数有效性:实时计算抓取对象的空间位置等连续参数,提升动作精度。
● 参数化动态技能链
突破固定技能模板限制,通过上下文感知的函数调用机制,动态解析指令中的动态参数(如 “最大积木” 需实时计算面积并定位),使得系统能够执行需要视觉或空间推理的复杂具身任务。
● 边缘设备友好架构
在大模型的输入端引入一个动态更新的历史行动记忆模块,结合迭代式上下文管理,显著降低显存占用。在长期任务规划中,平均显存占用不超过3.9G(未量化),满足边缘端设备的部署需求。当前设备已支持Nvidia jetson 系列边缘计算设备,以及瑞芯微、算能、华为Atlas等国产化边缘计算设备
开源生态:4万级数据集+轻量模型,加速产业落地
为推动技术普惠,团队同步开源了:
开源量化模型:模型提供0.9到2.7g多种量化版本,凭借其卓越性能与实用价值,近期在Hugging Face平台热度飙升,单周下载总量已突破300次。
LightPlan-40K 数据集:首个具身决策深度推理数据集,覆盖动作序列长度为2-13的不同复杂度任务,总计包含4万个带有层次化深度推理的动作决策步骤,其中精选2.3万条高质量数据作为训练集。
表1: 不同复杂度的任务中的性能表现
我们基于LightPlan-40K数据集训练了LightPlanner模型。实验结果显示,在真实世界环境中的具身决策规划任务中,尽管LightPlanner的参数数量最少,仅为1.5B,但其任务成功率最高。在需要空间语义推理的任务中,其成功率比ReAct高出14.9%。此外,实验还展示了LightPlanner在边缘设备上的运行潜力,突显其在资源受限环境中的适用性。
图4: LightPlanner在Jetson Xavier Orin上的部署展示
● 立即获取
论文地址:https://arxiv.org/abs/2503.08508
代码地址:https://github.com/unira-zwj/LightPlanner
- "WhatsApp批量采集,精准获客新策略 采集活跃用户,WS群发引流新高度。
- 数字化转型 增材制造企业的未来发展之路
- 智能协议分配,Line协议号注册器助您突破国际市场推广的瓶颈
- Instagram群发软件,ins高效引流助手,ig私信增长 +Instagram协议号
- 比特币ETF“吸金”41亿美元
- 随着全球化的不断发展,海外营销变得越来越重要。而WhatsApp作为一款全球流行的通讯工具
- IR3566AMSM01TRP: Advanced Multiphase Voltage Regulator for High-Performance Systems | ChipsX
- Instagram精准引流神器,ins高效私信软件,ig全自动引流,ins一手协议号
- Instagram高效引流工具,ins精准营销助手,ig自动化推广,ins全参协议号
- 曾经的我为了推进工作焦头烂额但现在 有了WhatsApp拉群工具 一键发送的利器 我轻轻松松推进事业 简直是事业的指南针
- 迈向存储新高度,西部数据多款新品亮相闪存峰会
- Instagram标签自动采集工具,ins自动化采集博主软件,ig全球采集软件
- Instagram私信群发工具,ins引流神器,ig自动拉群,ins一手协议号
- 东莞市卓业彩盒包装有限公司:专业量身定制,为您打造完美包装
- 刷爆朋友圈,AlphaGPT在法律ai圈子火了,案件仅需3分钟搞定
- WhatsApp精准群发助手,ws自动筛选工具,ws高级过滤器,营销群发引流
- Instagram群发推广助手,ins自动化引流工具,ig私信助手,ins协议号批量出售
- Instagram快速私信助手,Ins群发工具,ig采集引流私信
- 业务掌舵手揭秘 WhatsApp拉群营销,奇迹由好奇启航
- "WhatsApp引流新纪元 揭秘WS批量群发的5种技术路径教程
- 你发现了WhatsApp拉群营销工具吗?有人已经体验,一起来聊聊
- Instagram批量养号 - ins自动登录/ig采集指定地区/ins群发软件
- 远光软件参编的三项信创团体标准发布
- 互联之梦 WhatsApp拉群工具,梦想飞翔之翼
- Instagram群发软件,ins网页版协议群发工具,ig私信采集软件
- Instagram引粉工具,ins高效引流助手,ig全自动引流 +ins协议号
- Instagram群发筛选软件,Ins群发注册工具,助你轻松营销!
- WhatsApp群发营销获客 WS助力,私信群发轻松上手
- 在时光穿梭的商务魔法中,科技魔法师们手握WhatsApp拉群(WhatsApp)这一神奇工具
- 人生需要转折点,我在WhatsApp拉群工具的帮助下,找到了我的职业转机
推荐
-
丰田章男称未来依然需要内燃机 已经启动电动机新项目 尽管电动车在全球范围内持续崛起,但丰田章男 科技
-
疫情期间 这个品牌实现了疯狂扩张 记得第一次喝瑞幸,还是2017年底去北京出差的 科技
-
升级的脉脉,正在以招聘业务铺开商业化版图 长久以来,求职信息流不对称、单向的信息传递 科技
-
老杨第一次再度抓握住一瓶水,他由此产生了新的憧憬 瘫痪十四年后,老杨第一次再度抓握住一瓶水,他 科技
-
智慧驱动 共创未来| 东芝硬盘创新数据存储技术 为期三天的第五届中国(昆明)南亚社会公共安 科技
-
苹果罕见大降价,华为的压力给到了? 1、苹果官网罕见大降价冲上热搜。原因是苹 科技
-
如何经营一家好企业,需要具备什么要素特点 我们大多数人刚开始创办一家企业都遇到经营 科技
-
全力打造中国“创业之都”名片,第十届中国创业者大会将在郑州召开 北京创业科创科技中心主办的第十届中国创业 科技
-
创意驱动增长,Adobe护城河够深吗? Adobe通过其Creative Cloud订阅捆绑包具有 科技
-
B站更新决策机构名单:共有 29 名掌权管理者,包括陈睿、徐逸、李旎、樊欣等人 1 月 15 日消息,据界面新闻,B站上周发布内部 科技