恒生聚源总经理吴震操：企业大模型的下一场是知识管理|AI领先者心声2024

原创

2024-01-16 15:43 星期二

科创板日报记者黄心怡

①对于AI三要素算法、算力和数据，吴震操认为，算法随着开源趋势正在平民化；国产芯片的发展下，突破算力瓶颈只是时间问题；数据的使用、检索、和知识生成将会成为企业形成AI生产力和竞争力的关键；
②在AIGC、Copilot之后，企业级大语言模型的下一阶段将会是知识管理的入口。

《科创板日报》1月16日讯（记者黄心怡） ChatGPT的横空出世，带来2023年全球大模型热潮。

在2024年新年之际，财联社、《科创板日报》记者联合上海市人工智能行业协会，邀请人工智能领军者与行业精英推出“2024·AI领先者心声”系列报道，回顾过去的一年，展望新的一年AI大模型发展的机遇与挑战。

恒生聚源总经理吴震操向《科创板日报》记者表示：

2023年是国内大模型元年，模型的规模和能力一日千里。AIGC成为主流应用，Copilot开始展现巨大的生产力潜力。囿于大模型对于企业专有场景的理解能力有限，大模型在B端场景应用还未全面展开。

如果大模型成为企业的生产力，需要理解所在行业的领域知识，以及内部业务数据。通过预训练、有监督精调、强化学习等手段，让模型吸纳这些知识；在结合检索增强生成（RAG）后，“语控万数”的大模型就成为了企业新一代的知识库的入口，为各个岗位提供及时有效的数据和知识，加速数字化转型的进程。

吴震操“2024·AI领先者心声”全文如下：

2023年是国内大模型发展的元年，恒生聚源是最早布局大模型的金融数据厂商之一，凭借自身在金融数据和智能投研领域的积累，制定了AI和Big Data双轮驱动的战略。通过训练自有大模型，探索LLM在金融市场，如投研、投顾、交易等领域的应用；并利用过去二十年积累的全量市场数据不断提升大模型的金融领域知识理解能力，助力大模型在金融行业的落地。

在大模型研发的过程中，恒生聚源走出了一条从训练数据选择、基座模型选择、模型预训练、有监督精调、人类反馈强化学习，大模型中间件研发、金融场景应用的道路。深刻理解了大模型的“能”与“不能”，在多模态模型、RAG和知识图谱之上研发出创新一代的投资研究平台WarrenQ，解决了金融行业中对于大模型幻觉、信息溯源、以及内部数据安全的担心。我们不仅把训练出来的金融垂域大模型用来服务金融行业客户，自身也使用大模型进行数据的生产加工。

通过这一过程，我们实践了企业大模型的落地路径：通用大模型通过对行业知识和语料的学习成为垂域大模型；垂域大模型再进一步学习企业内的业务知识，并结合内部工具和系统成为为企业内的大模型，从而能够真正理解企业内外部知识，与企业经营场景结合，承担更复杂的任务。

展望2024年，企业大模型的下一场将会是知识管理：基于大模型和RAG链接企业的内外部知识，形成企业特有的知识库。并通过重构企业的应用入口，使用更贴近自然语言的交互方式（“语控万数”），打造贴合业务场景的Copilot，提供更广泛精准的Insight，进而未来可以进化到AI Agent。

阅115.13W

我要评论

反馈意见