很抱歉,当前没有启用javascript,网站无法正常访问。请开启以便继续访问。
训练大模型的数据或在2026年耗尽 数据源头公司深度受益于AI浪潮
原创
2023-08-29 07:39 星期二
财联社
责编 龚闯
①研究机构Epoch AI认为,对数据需求急剧增加,以至于可用于训练的高质量文本可能会在2026年耗尽。
②在本轮AI浪潮下,叠加数据要素市场的快速变革,本身是数据源、或接近数据源的公司能够更好地使用AI创造出更大价值,成为AI新时代真正的受益者。

超大模型依赖于海量的数据,研究机构Epoch AI认为,对数据需求急剧增加,以至于可用于训练的高质量文本可能会在2026年耗尽。

人工智能模型的两个基本要素就是数据集和处理能力,系统在数据集上接受训练,模型通过处理能力检测这些数据集内外部之间的关系。在某种程度上,这两大基本要素可以相互替代:一个模型可以通过吸收更多数据或增加更多处理能力加以改进。然而,在专业人工智能芯片短缺的情况下,后者正变得越来越困难,这导致模型构建者加倍专注于寻找数据。东北证券分析称,在本轮AI浪潮下,叠加数据要素市场的快速变革,本身是数据源、或接近数据源的公司能够更好地使用AI创造出更大价值,成为AI新时代真正的受益者。

据财联社主题库显示,相关上市公司中:

中文在线拥有海量的正版中文数据资源,公司拥有网络原创驻站作者440余万名,超万亿字的中文文字资源。

中信出版是全国优秀出版机构,拥有图书、报刊、电子、音像和网络出版及批发零售全牌照,主营图书出版与发行、数字阅读与服务业务和书店业务。

88.24W
要闻
股市
关联话题
8.72W 人关注
1.64W 人关注
关于我们|网站声明|联系方式|用户反馈|网站地图|友情链接|举报电话:021-54679377转617举报邮箱:editor@cls.cn财联社举报
财联社 ©2018-2026上海界面财联社科技股份有限公司 版权所有沪ICP备14040942号-9沪公网安备31010402006047号互联网新闻信息服务许可证:31120170007沪金信备 [2021] 2号