IDEA研究院讲席科学家张家兴:中文世界需要有中国文化内核的AIGC模型|财专访
原创
2022-12-20 21:34 星期二
财联社记者 崔铭
受海外Stability AI公司开源Stable Diffusion模型启发,CCNL于今年11月1日正式开源了自主研发的首个中文Stable Diffusion模型“太乙”,将AI绘画底层模型带入中文语境。

《安安访谈录》是界面财联社执行总裁徐安安出品的一档深度访谈类栏目。从投资角度对话1000位行业领军人物,覆盖传媒创新、VC/PE、信息服务、金融科技、交易体系、战略新兴等方向。

《财专访》是由《安安访谈录》出品的系列专访,财联社上市公司报道部聚焦行业热点,通过专访各类专家、领军人物,致力寻找投资价值标的,还原行业发展逻辑。

image

本期访谈人物:

IDEA研究院讲席科学家 张家兴

“中文世界需要有中国文化内核的AIGC模型,行业发展还需要有更多的AIGC产品创新出现,传统产品都值得用AIGC做一次升级。”

▍个人介绍

现任IDEA研究院讲席科学家,认知计算与自然语言研究中心负责人;曾任微软亚洲研究院研究员、蚂蚁金服资深算法专家、360数科首席科学家。

▍第一标签

AIGC底层技术研究和实践的领军者

▍组织简介

粤港澳大湾区数字经济研究院(International Digital Economy Academy,简称“IDEA研究院”)成立于2020年,目前已聚集包括院士、世界著名大学教授、世界知名开源系统发明人在内的国际一流技术专家,致力于在AI基础技术与开源系统、人工智能金融科技、区块链技术与机密计算、企业级AI系统、产业智能物联网与智能机器人等领域研发国际顶尖成果,并培育一批国际领先科技企业,带动深圳乃至大湾区万亿级数字经济产业发展。

IDEA研究院认知计算与自然语言研究中心(Cognitive Computing and Natural Language,CCNL)致力于推动预训练大模型为代表的新一代认知与自然语言基础前沿技术的进一步发展,力图解决大模型实际落地过程中的全部技术问题,构建对话机器人、知识抽取、知识体系等自然语言领域的新的技术架构,打造认知人工智能的新技术范式。

image

AIGC正成为继PGC和UGC之后的全新内容创作模式,底层模型能力突破带来的行业应用潜力初现。在AI绘画这一技术应用分支,受海外Stability AI公司开源Stable Diffusion模型推动,行业准入门槛大幅降低,AI绘画的产业化和商业化进程加速。

由此可见,在AIGC行业发展初期,底层模型的迭代、开源将成为重要的核心推动力。基于此,CCNL于今年11月1日正式开源了自主研发的首个中文Stable Diffusion模型“太乙”,旨在更好地助力中国AIGC文化产业数字化转型的创新发展。

IDEA研究院讲席科学家张家兴在接受财联社记者专访时表示,中国并不缺乏产品创新者,当下欠缺的是AIGC底层能力的提供者。“我们团队希望在中国的AIGC产业里,承担Open AI跟Stability AI这样的角色,不断迭代底层模型能力,助力上层出现更多的产品创新,服务于更广泛的用户。”

01

——————————

AIGC模型也需要有中国文化内核

受海外Stability AI公司开源Stable Diffusion模型启发,CCNL于今年11月1日正式开源了自主研发的首个中文Stable Diffusion模型“太乙”,将AI绘画底层模型带入中文语境。

之所以选择推出“太乙”,张家兴表示,一方面因为英文模型会产生翻译损耗、难以生成具有中国文化内核的图片。另一方面Stable Diffusion模型已经在英文世界中证明了自己的价值,即极大降低了AIGC行业门槛,中文世界同样需要一个“原汁原味”的Stable Diffusion模型去推动整个产业发展。

对于AI来说,“投喂”什么样的数据会直接决定学习结果。例如,在英文Stable Diffusion模型中输入“宫殿”关键词,由于系统默认为英文思维,故输出的也是西方类型的各式宫殿图片。而在“太乙”中输入“宫殿”,生成的则是具有中国特色的宫殿建筑。输入人像、古诗类描述词也是同样的道理。

张家兴透露,“太乙”的训练数据量超过了1亿对的中文的图文对。“我们已经把整个团队都投入进去了,几十个成员基本都是在围绕着AIGC模型研究实践,也希望做一些更贴近下游应用的AIGC模型。”

实际上,目前Stable Diffusion模型技术并不完美。一个最明显的不足点是,当图片为照片风格时,人脸生成和人手的生成质量较差。为此,“太乙”加入了图像编辑功能,用户可以对一张图片的人脸部分进行单独修复,这是原版Stable Diffusion模型无法支持的。

02

——————————

“太乙”只是第一步,生态合作是关键

在整个AIGC行业,“太乙”作为底层模型,为应用层提供技术支撑。张家兴表示,推出“太乙”只是CCNL在AIGC方向上走出的第一步,后续团队将从三个层面持续发力。

一是不断进行模型迭代,对模型结构进行创新、构建质量越来越高的数据集等,完善最基础最底层的AIGC模型。目前CCNL已经开源了88个预训练模型,整体称为“封神榜”是目前中国最大的预训练模型开源体系。

二是推出针对特定领域的AIGC模型,例如二次元、科幻、游戏等领域。张家兴认为,一个通用的AIGC模型很难在所有领域上都表现出色,而与各垂直行业业内公司合作,有助于一同推出更多精准的模型工具。

三是通过API(Application Program Interface,应用程序界面)将模型接入更多的业务场景。“太乙”团队目前已经推出了API功能,免费提供给用户,每人每天有1万的调用额度。“这足以支持一个小团队前期去做产品创新,在特定领域面向特定用户的公司,往往有自己独特的经验和产品上的想法。这个时候可以直接调用我们的API构建产品,如果后期试验的比较成功了,我们可以再进一步探讨如何做一些针对产品的定制化的模型。”张家兴表示。

当前阶段,“太乙”已经在推进一些生态合作,对象主要瞄准在数据和场景上有优势的公司,CCNL提供模型技术支持,对方公司则专注于产品运营,双方形成优势互补关系。

“一种是对方的产品已经跑在前面了,但急需技术升级,以及更好的 AIGC模型内核。另一种是对方本身有很强的数据图像方面的优势,通过‘太乙’技术赋予数据新的价值。因为有的数据是有版权的,有一定获取成本,现在用AIGC的方式给业务数据再进行一次大规模的扩充,这样他们就有了更多自有版权了,并且基本是零成本。”张家兴表示。

张家兴透露,目前团队也在跟一些在图片数据上非常有优势的头部公司商议,推出一些商业版的模型,能够生成更高分辨率更高清晰度更写真的照片。

03

——————————

中国AIGC产业的瓶颈和机会

AIGC被业界广泛视为解放未来生产力的工具,与“降本增效”紧密挂钩。在张家兴看来,AIGC改变的更多是生产方式。“现在AI生成一张图片基本上1秒钟就够了,就算需要人工筛选也只需要几分钟。但过去如果是纯人工生成,可能以天为基数。”在AI的加持下,人在创作过程中更多是提供创意,以及筛选和挑选,颠覆了以往的生产方式。

张家兴认为,“降本增效”并不是AIGC真正的潜力。“降本增效只是任何一个技术刚出来时,大家都会关注的点。但时间久了,让这个技术真正被大家广泛使用,成为社会底层的支撑性技术,都是因为它支持了一些新的产品甚至新的产业,这才是它真正的价值。”

张家兴表示,中国不缺乏做产品创新的人,但现在缺少AIGC底层能力的提供者。“海外比如Open AI和Stability AI两家公司,对整个AIGC产业提供基础设施。国内这方面目前比较欠缺,至今没有这样的一个商业公司出现。”

“这就造成一个问题,每个想做AIGC的公司从模型到产品都要考虑在内,但前期的资源往往有限,可能更多为了保证产品效果,在底层模型研发上投入不了那么多的精力,也不可能投入像Open AI和Stability AI那么大的资源,基本上是对模型进行一些微调,然后就上线了,这样其实会存在大量问题。”张家兴表示。

张家兴透露,目前部分推出AIGC产品的公司已经大体实现收支平衡,头部产品已经有很大的用户体量和日调用量。“但其实还需要有更多AIGC的产品和落地场景出现,包括一些传统场景,比如图片搜索和图库,值得全部做一次升级。”

至于眼前的机会,张家兴表示,明年最值得期待的是视频和3D功能突破。“目前两方面还处于初级阶段,类似于两年前的图像生成。而人工视频的制作成本要比图片成本高,但对于AI来说区别不大,如果有AIGC技术在这些方面大幅度应用的话,会产生更大的商业价值。”

(记者:崔铭) (编辑:刘琰)

对话1000位行业领军人物:安安访谈录

———————

访谈人物录:

(按首字拼音排序,排名不分先后)

保险机构:

中信保诚人寿保险有限公司副总经理、资深精算师:崔巍(资深精算师,保险产品开发、营销领域专家)

材料金属:

金石资源董事长:王锦华(萤石资源开发引领者)

宠物经济:

佩蒂股份董事长:陈振标(“宠物食品”第一股掌门人)

储能设备:

康菲中国总裁威诺德(Bill Arnold)(油气行业低碳发展的探路者)

南都电源董事长:朱保义(储能全场景应用的构建者)

中关村储能联盟理事长:陈海生(中国新型储能技术研究和产业化领军者)

传媒创新:

《科创板日报》主编:徐杰(一级市场及科创板权威报道和服务平台)

电商平台:

京东集团副总裁:何晓冬博士(人工智能科学家)

动力电池:

蜂巢能源董事长:杨红新(动力电池行业勇闯者)

协鑫能科总裁:费智(移动数字能源科技的先行者)

港口码头:

中远海运港口总经理助理:洪峻(港口供应链业务开拓者)

高端装备:

天宜上佳董事长:吴佩芳(轨交耗材龙头“掌门人”)

公募基金:

财通资管权益私募投资部总经理:陈李(专户老将,不断进阶的“实业派”高手)

诺德基金董事长:潘福祥(进入证券业最早的投资学老师,教授投资学时间最长的证券从业者)

兴业基金固定收益董事总经理、投资总监:周鸣(大类资产配置与跨市场多资产投资专家)

工业软件:

群核科技联合创始人兼董事长:黄晓煌(3D云设计SaaS引领者)

赛美特董事长兼CEO:李钢江(国产工业软件领域的推动者和践行者)

光伏电力电子设备:

昱能科技董事长:凌志敏(美国硅谷技术背景,国内微型逆变器先行人)

航空航天:

北斗三号总设计师:林宝军(中国航空航天最前沿技术的探索者)

集成电路:

黑芝麻智能CMO:杨宇欣(自动驾驶芯片行业创业“老炮”)

沐曦联合创始人、CTO兼首席软件架构师:杨建(高性能国产GPU的开拓者)

睿控创合创始人、总经理:张平(关键领域国产嵌入式系统推动者)

芯擎科技董事兼CEO:汪凯博士(国产车规级芯片研发带头人)

芯源微董事长:宗润福(大数据分析和人工智能技术专家)

亿铸科技创始人、董事长兼CEO:熊大鹏(存算一体 AI 大算力芯片的开拓者)

英特尔大数据技术全球首席技术官:戴金权(大数据分析和人工智能技术专家)

家族办公室:

华实禾岸创办人:王长华(家办行业的创新者)

景观设计:

奥雅股份联合创始人&董事总裁:李方悦 (数字科技与文旅融合的先行者)

LED电子设备:

木林森创始人:孙清焕 (LED封装及应用产品供应商)

农业养殖:

神农集团董事长:何祖训 (健康安全生猪产能理念践行者)

券商机构:

安信证券副总裁:魏峰(券商O2O财富管理“探路人”)

德邦证券副总裁:顾勇(从保险到券商的跨界先锋)

方正证券副总裁:崔肖(投交业务的坚守者)

富途董事总经理、国际化战略及财富管理负责人:曾煜超(科技券商依托互联网开拓财富管理业务的探索者)

光大证券业务总监:梁纯良(兼有一线经验和全局思维的券业财富设计师)

海通证券财富管理总部总经理:吴国华(财富管理践行者)

华林证券CEO:赵卫星(首批成功试水数字金融的跨界领路人)

华泰金控董事总经理兼张乐通全球负责人:朱亚莉(中资券商APP国际化探索者)

华西证券董事长:鲁剑雄(深耕金融数十年的跨界券业掌舵人)

国海证券副总裁:蒋健(深耕券商财富管理的马拉松跑者)

国泰君安证券私人客户部总经理:张谦(财富管理行业的奋楫者)

国信证券副总裁:谌传立(深化资本市场注册制改革的践行者)

国信证券资产管理总部副总经理:项琨(固定收益领域投资“深耕者”)

华福证券首席信息官、零售业务条线事业部总裁:王俊兴(精通金融与IT的券业先锋)

瑞银证券财富管理主管:高慧(瑞士财富管理“百年老店”的中国女高管)

申万宏源证券固定收益融资总部总经理:范为(宏观经济与资本市场资深专家)

申银万国证券研究所总经理:周海晨(券商研究“黄埔军校”少帅)

天风国际董事长:王勇(最懂风险管理的中资券商出海掌舵手)

湘财证券副总裁:周乐峰(从证券一线强势崛起的初生代大V)

兴业证券数智金融部副总经理:郑可栋(财富管理的践行者)

招商证券总裁助理、投资银行委员会主任委员:王治鉴(亲历创业板注册制改革的投资银行家)

中金公司投资银行部负责人:王曙光(见证与建言资本市场改革发展的资深投行家)

中金公司研究部固收研究负责人、董事总经理:陈健恒(宏观经济及债券投资策略分析专家)

中信建投证券执委委员、投资银行业务管理委员会主任:刘乃生(制度建设的投行亲历者、建言者)

评级机构:

东方金诚董事长:崔磊(资管、银行、信评等多领域资深专家)

中诚信国际董事长:闫衍(头部评级机构的管理者人)

权威专家、研究学者:

国家信息中心预测部产业室主任:魏琪嘉(国家发改委系统、产业经济领域专家)

国务院发展研究中心宏观经济研究部研究员:张立群(国务院发展研究中心宏观经济研究部研究员)

民盟中央经济委副主任:冯奎(曾任国家发改委研究员,城镇化议题专家)

同济大学艺术与传媒学院院长:李麟学(用科技赋能建筑的“城市规划者”)

中国宏观经济研究院对外经济研究所研究员:杨长湧(国家发改委系统、宏观经济领域外贸专家)

中国宏观经济研究院决策咨询部研究员:盛朝迅(国家发改委系统、产业经济领域专家)

中国首席经济学家论坛副理事长:屈宏斌(中国宏观经济的洞悉者)

中山大学传播与设计学院副院长:钟智锦(大湾区传媒人才“培育者”)

汽车零配件:

森麒麟总经理:林文龙(轮胎新势力领军人物)

企业服务:

八爪鱼&云听CEM创始人:刘宝强(国内首个客户体验管理SaaS平台开创者)

观远数据创始人兼CEO:苏春园(引领数据智能行业长远创新的长期主义者)

果集科技创始人:胡东(构建社媒全链路营销的先锋者)

科沃斯蒲公英加速器CEO:陈亮(中国科技优质项目投资蓄水池建设者)

酷克数据联合创始人:简丽荣(云原生数据库“从无到有”的推动者)

神策数据创始人:桑文锋(数据闭环方法论SDAF的提出者)

数说故事创始人&CEO:徐亚波(行业领先的大数据AI独角兽企业“掌门人”)

数位大数据创始人兼CEO:黄兴丽(国内最大全域全场景大数据库建设者)

顺网科技董事长:邢春华(泛娱乐产业数字化的推动者)

通联数据CEO:蒋龙(资管数智化创新实践者)

威尔森创始人&CEO:梁维新(行业领先的汽车数据信息综合应用平台“掌舵人”)

有米云CTO:蔡锐涛(全球数字营销先行者)

智慧芽创始人&CEO:张济徽(科技创新信息服务领军人物)

人工智能:

IDEA研究院讲席科学家:张家兴(AIGC底层技术研究和实践的领军者)

达观数据董事长:陈运文(文本数据智能化处理研究与工程专家)

复亚智能CEO:曹亚兵(无人机全自动飞行系统领域的先行者和推动者)

共达地CMO:李苏南(行业首个商用AutoML自动化AI训练平台布道者)

科大讯飞总裁:吴晓如(AI赋能的践行者)

深兰科技创始人:陈海波(坚持基础研究和应用开发并重的人工智能“深耕者”)

小冰CEO:李笛(人工智能情感计算框架首倡者)

小i集团创始人、董事长兼CEO:袁辉(中国认知智能及元宇宙领域领军人物)

云从科技联合创始人、战略规划部负责人:姚志强(人机协同操作系统的先行者)

中科闻歌执行总裁:曲宝玉(大数据和人工智能领域探索者)

数字安全及测试测量:

东方中科董事长:王戈(中科院技术资本领军人物)

数字经济:

数字人民币产业联盟理事长:王晶(数字人民币产业创新者)

碳中和:

复旦大学绿色金融研究中心执行主任:李志青(绿色经济金融的研究者,绿色转型发展的助推者)

天津排放权交易所总经理:李天(中国负碳平台的先行者)

氢交所最早发起人:林辉(氢能源交易平台探路者)

中国社会科学院生态文明研究所副所长:庄贵阳(中国低碳经济研究的先行者)

中国政法大学民商经济法学院副院长:于文轩(专注生态环境法治的研究者和推动者)

体育运动:

阿迪达斯大中华区董事总经理:萧家乐(运动品牌中国故事的讲述者)

投资机构:

鼎心资本创始合伙人:胡慧(聚焦半导体产业链的VC投资人)

鼎兴量子创始人:金宇航(成都新能源与新材料ToB领域资深投资人)

东方引擎合伙人、副总经理:李慧鹏(连续多年保持优秀投资业绩的债券金牛基金经理)

复星创富联席董事长:徐欣(产业背景深厚的科技投资人)

高特佳投资执行合伙人:范大龙(产融结合生态系统构建者)

汉理资本董事长:钱学锋(资深天使投资人、A轮学堂创办人)

合晟资产创始人、董事长:胡远川(拥有丰富实战经验的股债投资专家)

活水资本创始合伙人:许乐家(东南亚创投圈探索者)

基石资本合伙人:杨胜君(产业背景深厚的硬科技投资人)

加华资本创始合伙人:宋向前(消费服务行业冠军的“超级陪练”)

蓝驰创投管理合伙人:陈维广(新经济早期投资人)

朗盛投资合伙人:李佳(科研出身,服务过百家生物医疗企业的早期投资人)

梅花创投创始合伙人:吴世春(最懂创业者"的天使投资人)

深高投资创始合伙人/CIO:李凯(中国首批高收益债投资人、企业信用风险分析专家)

唐兴资本创始人:宫蒲玲(硬科技赛道“有温度的资本”发起人)

盈米基金副总裁、盈米基金研究院院长:杨媛春(多资产配置、FOF投研专家)

源码资本董事总经理:王菂(智能制造、清洁能源的“发现者”)

元起资本创始管理合伙人:何文俊(数字世界的安全守卫者)

中欧资本董事长:张俊(华为前副总裁、硬科技战略投资者)

VR/AR/元宇宙:

蓝色光标元宇宙业务负责人:刘方铭(元宇宙营销的实践者)

Nreal 创始人、CEO:徐驰(中科院技术资本领军人物)

数字经济学家:陈晓华(中国数字经济研究先行者)

Unity中国总裁:张俊波(元宇宙内容创作者和运营者)

英伟达中国区Omniverse负责人:何展(元宇宙基础设施的搭建者)

文化旅游:

复星旅文董事长:钱建农(休闲度假生活方式引领者)

新能源:

多氟多董事长:李世江(打破六氟磷酸锂国外垄断的创新者)

极电光能联合创始人、总裁:于振瑞(钙钛矿产业化先行者)

晶科能源董事长:李仙德(光伏产业海内外垂直一体化布局的领航者)

新汽车:

岚图汽车创始人:卢放(坚定而充满汽车情节的“长期主义者”)

零跑汽车创始人:朱江明(汽车界的“超级工程师”)

哪吒汽车联合创始人兼CEO:张勇(打造高品质智能电动车的产品经理)

信托机构:

平安信托运营中心总监:龙健(平安信托,信托业科技实力的标杆)

建信信托副总裁:王业强(建信信托,股权投资支持科技创新的先行者与探索者)

云南信托总裁:舒广(云南信托,信托转型战略践行的先行者)

新消费:

林清轩创始人:孙来春(中国本土消费品品牌高端化道路探索者)

魔筷科技创始人:王玉林(直播电商供应链服务商)

行云集团创始人:王维(全球D2C供应链)

新一代信息技术:

洞见科技创始人、董事长:姚明(数据价值安全释放的推动者)

华天软件董事长:杨超英(国内首套机械CAD创立者,工业软件领域领跑人)

均普智能总经理:解时来(中国智能制造、数字制造的助力者)

山石网科董事长:罗东平(网络安全领域早期海归工程师、科创板公司创始人)

中控技术董事长兼总裁:崔山(工业3.0+4.0的赋能者)

医疗健康:

佰仁医疗董事长:金磊(国产心脏瓣膜介入治疗新时代的开创者)

贝瑞基因董事长:高扬(中国基因测序开拓者)

春雨医生CEO:王羽潇(互联网医疗在线问诊模式探路者)

东方生物创始人:方效良(体外诊断领域全产业链布局的开拓者)

复锐医疗董事长:刘毅(中国能量源医美器械头把交椅的掌舵人)

复星健康董事长:陈玉卿(妇儿医疗服务的先行者)

和元生物董事长:潘讴东(基因治疗CDMO“独角兽”企业的掌门人)

华大基因CEO:赵立见(中国基因行业龙头企业的领军者)

和誉医药董事长兼总裁:徐耀昌博士(徒步小分子雨林的猎手)

康缘药业总经理:杨永春(中药抗疫的先行者)

曼朗医疗CEO:唐德凯(高端私营精神心理医疗机构践行者)

脑虎科技创始人兼CEO:彭雷(中国脑机接口领域先行者)

锘崴科技创始人、董事长:王爽(基于隐私计算构建国家级医疗健康网络的实践者)

燃石医学创始人兼首席执行官:汉雨生(中国肿瘤精准医疗引领者)

睿心医疗合伙人&COO:刘晓扬(心脑血管诊疗一体化的软硬件生态平台先行者)

天鹜科技创始人:洪亮(AI新药开发领航者)

通策医疗董事长:吕建明(连锁口腔医院数字化的先行者)

望石智慧CEO:周杰龙(AI创新药研发新范式的探路者)

未知君联合创始人兼CEO:谭验(AI+BT微生态制药闭环探路人)

沃比医疗CEO:安穆克(Michael Alper)(神经介入领域出海的先行者)

星药科技创始人&CEO:李成涛(人工智能+药物研发领域的顶尖学者)

星奕昂创始人:王立群(国内细胞治疗领域的早期开拓人)

医药魔方创始人:周立运(医药数据全链整合引领者)

药明奥测首席科学官兼首席技术官:方焯博士(整合诊断/人工智能赋能精准医疗的创新者)

中科新进创始人兼董事长:任培根(多肽药物赛道的科学家创业者)

银行理财:

汇华理财资产配置总监:马少章(汇华理财,中长期稳健投资老将)

光大理财总经理:潘东(光大理财,银行理财业务的创新者)

华夏理财总裁:苑志宏(华夏理财,客户至上、绝对收益的坚守者)

农银理财董事长:马曙光(农银理财,提供最佳客户体验的践行者)

平安理财固定收益投资部负责人:熊珣(平安理财,银行理财领域多资产多策略配置领跑者)

影视文化:

华策影视总裁:傅斌星(新时代文化产业生力军)

开心麻花联席总裁:汪海刚(驻扎于喜剧的“坚守者”)

自动驾驶:

纵目科技CEO:唐锐(自动驾驶与高级驾驶辅助系统(ADAS)领域的14年研发管理老兵)

宏景智驾创始人兼CEO:刘飞龙(自动驾驶大潮中的探索者)

政府系统:

黄山市副市长:江卓琪

收藏
113.72W
我要评论
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
要闻
股市
关联话题
8510 人关注
7215 人关注
7924 人关注