很抱歉,当前没有启用javascript,网站无法正常访问。请开启以便继续访问。
logo2025年02月19日 15:33:19
撞车DeepSeek NSA Kimi杨植麟署名的新注意力架构MoBA发布
《科创板日报》19日讯,2月18日,DeepSeek发布了一篇新论文,提出了一种改进版的注意力机制NSA,有创始人兼CEO梁文锋亲自参与。同一天,月之暗面发布了一篇主题类似的论文,月之暗面创始人兼CEO杨植麟也是该论文的署名作者之一。这篇论文提出了一种名为MoBA的注意力机制,据介绍,MoBA是“一种将混合专家(MoE)原理应用于注意力机制的创新方法。”该方法遵循“更少结构”原则,并不会引入预定义的偏见,而是让模型自主决定关注哪些位置。
261.22W
关联话题
6.94W 人关注
关于我们|网站声明|联系方式|用户反馈|网站地图|友情链接|举报电话:021-54679377转617举报邮箱:editor@cls.cn财联社举报
财联社 ©2018-2026上海界面财联社科技股份有限公司 版权所有沪ICP备14040942号-9沪公网安备31010402006047号互联网新闻信息服务许可证:31120170007沪金信备 [2021] 2号