AI军备竞赛七日谈:巨头八倍速狂飙!一文看懂近期AI行业“排位赛”战况
原创
2023-03-22 18:32 星期三
财联社 唐叶天
科技巨头多模态大模型竞赛启动。

财联社3月22日讯(编辑 唐叶天)2023年的人工智能赛道,自微软打响注资OpenAI头一炮后,热度逐渐升温。海内外科技巨头纷纷加入AI军备竞赛,至3月中下旬渐至白热化。从底层硬件至终端应用,近一周时间内,各家头部竞争者纷纷加快产品发布节奏,本文将盘点一周AI行业竞争白热化的战况。

3月14日 OpenAI和ChatGPT的挑战者,来了

[云服务]谷歌向开发人员开放其大语言模型PaLM的API接口

PaLM是是谷歌在2022年发布的语言大模型,而后又在此基础上发布了逻辑性更强的大模型PaLM-E,可处理多模态信息。本次API接口开放后,用户能通过谷歌云和AI建构工具MakerSuite来构建AI模型,并根据特定要求定制API,比如将聊天机器人功能编程到特定的应用程序中。

[AI+办公]谷歌所有Workspace办公组件将上线生成式AI功能

image

图源:Google Workspace演示页

Google Workspace是谷歌的一整套办公组件,包括Gmail以及Google Doc、Sheets、Slides等。谷歌将生成式AI模型接入后,用户将拥有通过剪短摘要在Gmail中生成完整电子邮件的选项,以及生成AI图像,音频和视频等新应用。此举显示了谷歌在AI军备竞赛中保持领先地位的决心。也喻示着AI协同办公新时代开启。

3月15日 GPT模型,超进化

[大模型] OpenAI发布多模态预训练大模型GPT-4

image

图源:OpenAI官网GPT-4介绍页

相比上一代模型,GPT4.0升级显著,文字输入限制提升了7倍、开始支持图像输入、回答准确性显著提高、创作能力进一步提升、幻觉问题得到改善、安全防护能力增强。在解释梗图和对创造力要求较高的人类考试中表现亦优秀。但随着模型复杂度加大,也大幅提升了算力需求。

3月16日 百花齐放!中文AI大模型出世

[大模型]百度发布大语言模型、生成式AI产品文心一言

image

发布当日,百度展现了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五大方面的能力。背后是百度从芯片层(昆仑芯)、框架层(飞桨)、模型层(文心大模型)、应用层(C端应用、B端应用)的全栈人工智能技术。在3月27日,百度将召开新品发布会,发布文心一言云服务及应用产品。

3月17日 AI版Office,微软的全生态AI利器

[AI+办公]微软发布Microsoft 365 Copilot,将AI功能全面接入Office等应用软件

image

图源:Microsoft 365 Copilot介绍页面

Microsoft 365 Copilot无缝集成了GPT-4模型,提供的功能包括包括编写和编辑文档、制作演示文稿、完成数据分析和制成可视化图等。使办公场景的AI助手应用跨入新阶段。机构认为有望从根本上改变人们的工作方式,并开启新的生产力增长浪潮。

3月20日 AI生成式应用接连成“爆款”

[AI+图像]Midjourney生成的人类情侣图片刷爆互联网

image

Midjourney v5是AI图像生成式应用Midjourney的最新迭代版本,解决了手指无法准确描绘的问题。经测试,Midjourney v5生成的1990年代中国情侣照片效果逼真。机构认为,随着AIGC工具加速迭代,各类场景下的商业应用有望率先落地。

3月21日 巨头扎堆加入AIGC战局,“AI迎来iPhone时刻”

[底层硬件]NVIDIA在2023GTC大会上发布四种配置与体系架构的推理平台L4|L40|H100 NVL|Grace Hopper、GPU光刻软件NVIDIA cuLitho

其中,H100 NVL是两个H100 GPU通过NVLink拼接在一起的非消费级GPU,专门用于训练大型语言模型(LLM)。机构认为,计算成本是讨论AI应用发展的核心问题,本次英伟达推出更高效算力方案为行业解决基建痛点。

[云服务]人工智能云服务NVIDIA DGX Cloud、NVIDIA Base Command™平台软件

image

Nvidia DGX Cloud使企业不需要采购与拥有服务器设备,可通过云服务供应商合作托管的DGX Cloud基础设施租用算力,价格为37000美元/月。随着算力租用的开放,任何企业都可拥有构建AI的可能。英伟达方面表示,甲骨文将成为租用服务的第一个合作伙伴,微软、谷歌云也将加入。

[云服务]谷歌Bard有限开放公测

Bard是ChatGPT的竞品,曾于2023年2月8日,微软将ChatGPT接入Bing搜索引擎时短暂上线,因出错遭谷歌撤下相关演示的官方视频。3月重新发布的Bard测试版目前仅支持英语,且不具备编码能力。但谷歌强调本次为“早期实验”。

[AI+视频]Runway发布文字生成视频模型Gen-2

image

[AI+图像]Adobe发布创意生成式AI应用Firefly

image

机构表示,应用端在AIGC的加持后,有助于提升数字内容的体验,从文字、图片、视频、短视频、沉浸式、互动式等媒介的演变,均说明新技术可带来内容、媒介发展新红利。”

收藏
65.61W
我要评论
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
要闻
股市
关联话题
8211 人关注
1.26W 人关注
3.94W 人关注