很抱歉,当前没有启用javascript,网站无法正常访问。请开启以便继续访问。
logo2025年12月02日 13:28:10
字节Seed发布GR-RL 首次实现真机强化学习穿鞋带
《科创板日报》2日讯,字节跳动Seed团队发布最新研究成果GR-RL,着力于拓展VLA模型在长时程精细灵巧操作方面的能力边界。GR-RL提出了一套从离线数据筛选到在线真机微调的强化学习框架,在业界首次实现“让机器人给整只鞋连续穿鞋带”。相较前作监督学习模型GR-3,GR-RL在穿鞋带任务上将成功率从45.7%提升至83.3%,减少了近70%的失败情况。
264.08W
关联话题
4.43W 人关注
1.15W 人关注
2.46W 人关注
6.85W 人关注
关于我们|网站声明|联系方式|用户反馈|网站地图|友情链接|举报电话:021-54679377转617举报邮箱:editor@cls.cn财联社举报
财联社 ©2018-2026上海界面财联社科技股份有限公司 版权所有沪ICP备14040942号-9沪公网安备31010402006047号互联网新闻信息服务许可证:31120170007沪金信备 [2021] 2号