大华股份先进技术研究院院长殷俊:年内将推行业视觉大模型,首先应用于城市管理|财专访
原创
2023-07-22 14:00 星期六
财联社记者 陈抗
①大华从2019年开始视觉领域大模型的研发,有望于年内发布自己的大模型,在不同时间段推出各类行业大模型;
②大华不做通用大模型,而是面向业务场景做行业专属大模型,并围绕视觉方向展开;
③研发难点有很多,落地难点在于如何将模型小型化,低成本运行。

财联社7月22日讯(记者 陈抗)AI技术在过去几年推动安防行业完成了视频识别、分析、响应处理的不断升级,但传统算法正面临着场景多元化、用户差异化的挑战,时下热门的大模型技术为行业提供了新的可能性。

安防产业链的各企业已有不少推出了自己的大模型,比如商汤科技的“日日新”大模型、云从科技的“从容”大模型、宇视科技的“梧桐”行业大模型等。安防龙头海康威视(002415.SZ)在5月表示,训练的百亿级别参数大模型已应用在AI开发平台上。

近日,财联社记者专访了大华股份(002236.SZ)先进技术研究院院长殷俊,他带领的团队从2019年开始负责视觉领域大模型的研发,他透露大华股份有望于年内发布自己的大模型。

财联社记者了解到,大华没有选择以GPT为代表的生成式语言模型,而是选择面向不同业务场景研发行业专属模型,以精确度为前提,正确、客观地识别和解析,落地行业会优先在城市管理、电力、物流等行业展开。

殷俊认为,应用落地是衡量大模型成功与否的唯一标准。因此,大华专注于在已有的应用场景加速落地,这也是目前急需突破的方向。

今年3月决策,围绕视觉方向启动行业大模型

财联社:大华是从什么时候开始做大模型的?

殷俊:我们从2019年开始,那时候不叫大模型,称为Transformer技术。团队用ViT技术做半自动化标注方案,节省很多人力,2020年初就有了检测+分割+分类的自动化标注模型。

今年年初大模型研讨会之后,公司决策要做行业专属大模型,并额外追投研发预算,也追加了40-50个算法人员的投入。

我们对大模型确立了三个方向:第一,我们不做主流的通用大模型,而是面向业务场景做行业专属大模型;第二,我们不做ChatGPT那样的文本生成式AI,还是围绕视觉方向;第三,我们要重点投入私有化部署,因为大华客户的很多数据是需要做到合规安全,要用到私有云。

大华会在不同时间段推出各类行业大模型,今年就会发布。

财联社:现在一些行业头部公司已经在做细分行业的大模型,比如恒生电子有针对金融数据分析的大模型,那么大华的竞争优势是什么?

殷俊:我们的大模型不是针对金融领域的数据分析,而是通过数智化手段提升管理质量和效率。以城市管理为例,针对一个路口就有几十条纷繁多样的管理规范要求,包括出摊经营、井盖识别、小广告“牛皮癣”、盲道侵占等等。我们的优势是有丰富的行业客户、行业经验、行业的作业流程经验。

通用大模型对云厂家很友好,但需要非常大体量的算法去跑,采用超大规模参数的算法对用户的使用成本太高,我们会在训练和推理优化技术上做一个平衡,让用户在成本可控的情况下使用大模型。

财联社:大模型从研发到落地的过程中,最大的难点是什么?

殷俊:研发难点有很多,首先是在视觉领域没有可参照的模型架构,和现在大众认知的AGI、AIGC技术方向存在差异,在CV(Computer Vision计算机视觉)领域完全靠自己搭建。

因为选择路径不同,所以在数据源的处理上,也要靠自己摸索,包括数据对齐、图像描述等。训练框架也是个难点,多模态大模型是由多个大模型组合的,数据输入以视频为主,音频、雷达、激光数据为辅,输出都要以文本为主,视频转换为文本的过程都需要自己摸索。

此外落地的难点还有如何将模型小型化,这也是我们下半年的重点,例如研发出一套100亿参数的大模型,怎么用算法把它小型化,让这个模型可以低成本地运行起来。大算力高成本的大模型很难打动客户,我们一定要先去帮客户考虑使用成本的问题。

之前说到我们的私有云部署,这也涉及到成本控制,公有云用户考虑服务费用,而私有云用户因为要自己搭建云,所以关注服务+建设两部分的成本,对成本控制更在意。

优先落地城市管理行业,未来大模型或迎洗牌

财联社:大华的大模型技术会优先在哪些行业落地?

殷俊:从行业刚需出发,目前我们在考虑城市管理(行业),因为城市管理的需求非常多,环境千差万别,任务需求多但需求明确;其次就是电力行业,仪器仪表操作复杂、设备种类繁多且安全性要求高。此外,像物流行业中的条码扫描,有很多遮挡、破损、污迹、移位各方面的问题,我们也想试试大模型能不能进一步提升类似的识别能力。

财联社:现在大模型竞争白热化,算力优化被认为是竞争核心,您如何看待?

殷俊:现在大家都在做的通用大模型,很耗算力,大模型又在风口上,算力很难采购,导致了一个争夺算力的局面。

我觉得并非算力越大模型就越好,而且我们做行业专属大模型,不需要那么大参数量的算法体系。对我们来说,大模型已经有雏形,重点是如何落地,我们是奔着产业化去的,不能只停留在技术层面,“只能看不能用”是不行的。

财联社:您如何看待未来一年大模型的发展?

殷俊:公司选择做大模型,要看是否对主营业务有所升级,比如科大讯飞(002230.SZ)的大模型可以提升NLP业务,百度大模型可以升级搜索引擎,恒生大模型对金融数据分析业务有提升。所以大华也会首选在现有业务的基础上,根据客户需求去研发大模型。

大模型技术能够不断增强智慧视觉等垂直应用领域解决方案的竞争力,解决现在的问题和大量的需求,帮助我们不断完善方案。当然大模型的发展对公司在研发成本控制、资源整合、精细化管理等方面也有很大帮助。

未来行业肯定会洗牌,能快速产业化的公司才能活下来,每个细分领域会出现头部玩家。大模型技术也会对已有的行业格局有所冲击,布局方向对不对,能不能落地,都是很关键的节点。

(编辑 刘琰)

收藏
136.56W
我要评论
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
要闻
股市
关联话题
8545 人关注
4.06W 人关注