OpenAI反击谷歌:ChatGPT图像功能大升级 敲打Photoshop“饭碗”
原创
2025-12-17 17:21 星期三
财联社 史正丞
①OpenAI推出新版ChatGPT图像功能,生成更快、编辑更准,支持精细地添加、删除、合并等操作,速度最高提升4倍,正面挑战谷歌Nano Banana和传统修图软件;
②新模型成本也较上一代下降20%;
③在中文、阿拉伯语等语言的图像生成领域,谷歌依然大幅领先OpenAI。

财联社12月17日讯(编辑 史正丞)OpenAI与谷歌的世界顶级AI应用之战,又展开新一轮攻防。

北京时间周三凌晨,OpenAI宣布推出新版ChatGPT图像功能,除了图像生成质量更好、生成速度更快外,新版Images模型在图像编辑的精确性方面也迎来重要进步。可以说,OpenAI不仅向谷歌备受赞誉的Nano Banana系列模型发起反击,还顺势踢了一脚Photoshop的“饭碗”。

image

OpenAI介绍称,基于最新旗舰图像生成模型的“ChatGPT图像”功能,能够在保持细节完整的同时进行精确编辑,更有可能呈现出用户希望看到的效果。在保持细节完整的同时进行精确编辑,生成速度提升至多4倍

当然,图像生成模型的效果,得用图像来说明。

作为此次升级的最关键提升,OpenAI介绍称,新模型擅长多种类型的精确编辑,包括添加、删除、合并、混合和转置,在获取修图效果的同时,保留图片本身的特点

举例而言,以下是ChatGPT新图像模型生成的90年代末的洛杉矶街头摄影(演示版)。

image

→把人物的衬衫改成红色帽子改成黄色,限速改为15卡车改成消防车

image

→在左侧加一群观看的人,右侧人行道上栖着一只鹰,远处有一只飞船在天空中飞过;

image

→带有该图像全包印花的T恤挂在晾衣绳上;

image

→将那件T恤给穿到滑板手身上。

image

作为AI生成图像的重要应用,ChatGPT图像在创造性改造现有图片方面也有进步。例如将公司CEO奥尔特曼的个人照,转换成美国80年代的健美操教练,或是把他的脸放进世界名画《戴珍珠耳环的少女》中。

image

另外,ChatGPT也向谷歌的传统优势项目——生成富含文字信息的示意图,发起了挑战。OpenAI表示,该模型在文本呈现上更进一步,能够处理更密集、更小的文字

image

需要说明的是,虽然ChatGPT在生成英文字体时已经能够“以假乱真”,但官方也承认,这个新模型在生成中文、阿拉伯语、希伯来语方面仍存在局限性

image

因此,至少在中文文字图像生成方面,Nano Banana依然是彻底碾压ChatGPT的存在

image

值得一提的是,新图像生成模型更强、也更便宜了。与GPT Image 1相比,升级后的GPT Image 1.5图像输入和输出成本均降低20%。

收藏
5.31W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
要闻
股市
关联话题
13.3W 人关注
6.01W 人关注
5.37W 人关注