关于我们
网站声明
联系方式
用户反馈
网站地图
帮助
首页
电报
话题
盯盘
VIP
FM
投研
下载
全部
加红
公司
看盘
港美股
基金
提醒
2025年12月02日 13:28:10
字节Seed发布GR-RL 首次实现真机强化学习穿鞋带
《科创板日报》2日讯,字节跳动Seed团队发布最新研究成果GR-RL,着力于拓展VLA模型在长时程精细灵巧操作方面的能力边界。GR-RL提出了一套从离线数据筛选到在线真机微调的强化学习框架,在业界首次实现“让机器人给整只鞋连续穿鞋带”。相较前作监督学习模型GR-3,GR-RL在穿鞋带任务上将成功率从45.7%提升至83.3%,减少了近70%的失败情况。
收藏
阅262.98W
我要评论
反馈意见
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
关联话题
机器人
4.02W 人关注
字节跳动
1.11W 人关注
TMT行业观察
2.29W 人关注
人工智能
5.96W 人关注