关于我们
网站声明
联系方式
用户反馈
网站地图
帮助
首页
电报
话题
盯盘
VIP
FM
投研
下载
全部
加红
公司
看盘
港美股
基金
提醒
2025年02月06日 20:28:18
独家|李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成
《科创板日报》6日讯,今日有报道称李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。《科创板日报》记者调查后发现,s1模型的训练并非从零开始,其基座模型为阿里通义千问(Qwen)模型。s1用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对千问模型进行微调而成。(记者毛明江 黄心怡)
关联文章
【电报解读】李飞飞团队“50美元”复刻DeepSeek,基于阿里云Qwen模型监督微调而成,这家公司与阿里云共建智算云,旗下平台接入通义千问
收藏
阅277.69W
我要评论
反馈意见
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
关联话题
人工智能
6.03W 人关注
云计算
2.14W 人关注