2024年04月14日 19:19:03
上海人工智能实验室葛佳烨:大模型评测亟需可靠的数据污染检测技术
《科创板日报》14日讯,在“知乎AI先行者沙龙”上,上海人工智能实验室司南大模型评测产品负责人葛佳烨表示,大语言模型评测中面临全面性、评测成本、数据污染、鲁棒性等挑战。她表示,评测数十万道题需要大量算力资源,基于人工打分的主观评测成本高昂。同时,海量语料不可避免带来评测集污染,亟需可靠的数据污染检测技术。此外,大模型对提示词十分敏感,多次采样情况下模型性能不稳定。(记者 黄心怡)
收藏
391.93W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
关联话题
4.81W 人关注
1.74W 人关注
6.06W 人关注
1.5W 人关注