揭秘国产TPU“逆袭”之路:首颗量产芯片性能超海外知名GPU产品,5年走完自主化从0到1
原创
2025-12-29 08:20 星期一
科创板日报记者 王楚凡
①中昊芯英作为国内TPU赛道先行者,已完成第一代芯片量产,性能逐步超越海外知名GPU公司上代产品。
②中昊芯英以TPU为核心路线,在深度学习领域实现较传统GPU可实现3-5倍的性能提升与更高性价比,正构建从芯片设计到生态合作的全链条能力,推动国产算力基础设施发展。

编者按:筚路蓝缕敲钟成,上下求索知路远。这是一档针对科创领域领袖人物的访谈节目。他们有哪些少为人知的传奇经历?企业经营过程中,他们的心路历程有何变化?《对话科创家》与您一起探寻,以期远眺未来。

本期,《对话科创家》栏目的嘉宾是中昊芯英创始人兼首席执行官杨龚轶凡。

“从架构创新的维度来看,TPU是AI算力演进中的一次‘路径重构’。中国不缺芯片设计的团队,缺的是在主流技术路线外敢于定义新规则、构建新生态的‘架构探索者’。我们想做的,不是算力竞赛的跟随者,而是以自研架构推动智能普惠的长期主义者。”

个人介绍

杨龚轶凡,中昊芯英创始人兼CEO,国家级领军人才。他于2018年回国创立中昊芯英,带领团队在2023年成功研发中国首颗量产级GPTPU架构AI专用算力芯片“刹那®”,实现性能、能耗、成本的全面突破。如今,他正推动自研TPU芯片在智算中心与多行业落地,致力于构建中国自主的AI算力生态,成为硬科技创业浪潮中的关键架构定义者与产业推动者。

公司简介

中昊芯英(杭州)科技有限公司是一家专注于高性能AI芯片及计算集群研发的硬科技企业,由前谷歌TPU核心研发专家杨龚轶凡于2020年在杭州创立。公司致力于TPU架构的自主研发,已成功推出“刹那”芯片及“泰则”计算集群,在算力性能与能效比上实现突破。作为国家级专精特新“小巨人”企业,中昊芯英正通过自主可控的技术链,推动国AI算力生态的构建与落地。

image

《科创板日报》12月29日讯(记者 王楚凡)这是一家独特的AI芯片企业:它选择了一条国内鲜有人走的路线——放弃跟随主流GPU架构,转而深耕自研TPU技术;它起步于海外顶尖团队的回归,成立仅五年,便推出首颗性能比肩国际水平的高性能AI芯片,该公司亦是目前国内为数不多实现盈利的AI芯片企业。

它就是中昊芯英——国内TPU赛道的先行者。

它背后的技术理想与商业逻辑是什么?在巨头垄断的AI算力赛道中,它如何实现从架构设计到生态构建的突破?面对人工智能浪潮,它又将如何定义国产算力的未来?

在上海报业集团融媒体中心,中昊芯英创始人兼CEO杨龚轶凡接受了《科创板日报》记者的专访,分享他在AI芯片自主创新之路上的选择与展望。

TPU是更契合AI时代趋势的技术路线

《科创板日报》:近期,大家都非常关注英伟达H200芯片获准进入中国市场。对你来讲,这件事是机遇还是压力?

杨龚轶凡:既是机遇也是挑战。国产芯片正处在关键的替代窗口期。像我们这些在2018、2019年前后成立的公司,经过这几年的努力,大多已完成了第一代芯片的研发和量产,但要说全面超越国际竞争对手,我们还需要时间。

令人欣慰的是,我们的进步是实实在在的。在2023年,我们的产品在市场上已经证明,其性能可以超越海外知名GPU公司的上一代芯片。目前,整个行业都在向下一代芯片冲刺,目标就是达到类似H100的性能水平。

H200获准进入中国,无疑会让竞争更激烈,压力也更大了。但我认为,在这样一个强大的对手在面前,反而会激励我们国内团队更快地迭代技术、完善软硬件生态。从长远看,这正是我们实现真正突破、走出一条国产芯片成功之路的必经过程。

《科创板日报》:中昊芯英是TPU技术的先行者,与GPU等其他路线相比,TPU的核心优势体现在哪些方面?

杨龚轶凡: GPU虽然并行能力强,但其架构源于图形处理,并非专为深度学习设计,因此在执行AI任务时存在效率损耗,且软件栈极为复杂,难以充分调度其数以万计的核心,导致实际利用率不高。

相比之下,谷歌在设计TPU时便针对深度学习计算模式进行了定制,使其在计算效率、核心利用和软件调度上都更为简洁高效。这使得TPU在同等工艺和成本下,能实现比传统GPU高出3至5倍的性能表现。

与为特定算法定制的ASIC不同,TPU面向的是神经网络计算体系,对一类算法具备良好的通用适配能力。在当今AI快速发展阶段,我们坚信这是一条更契合趋势的技术路线。

《科创板日报》:目前算法是否已经收敛?这对芯片路线选择有何影响?

杨龚轶凡:算法已在收敛,但尚未收敛到单一算法适用于所有场景。如今大模型结构已趋于收敛,主要以Transformer类结构为基础,算法虽有革新与调整,但计算模式趋于简化。不同模型如通义千问、DeepSeek等的算法仍有区别,这给市场带来一定难度:为某个算法定制设计的ASIC可能无法完全适配其他算法。

在这种背景下,像TPU这样针对一个方向进行优化设计、采用DSA架构的技术路线,在一定时间内反而更符合时代发展需求。

《科创板日报》:在成本方面,TPU与GPU的比较优势如何?

杨龚轶凡:从生产成本看,两者相差不大。但在相同工艺、成本与能耗背景下,TPU通常能实现3-5倍的性能提升,因此性价比更高。以云端性价比为例,与谷歌云、亚马逊云上的GPU相比,同算力条件下TPU的性价比是传统GPU的2倍以上。

这对于人工智能企业的大模型落地非常有利。我们认为,对大模型公司而言,只要芯片能与算法适配并实际应用,性价比将成为赛道中的核心考量因素。大模型能否快速落地、广泛使用,一方面取决于性能,另一方面也取决于开销。

《科创板日报》:目前在中国,只有你们一家在做TPU路线。这个方向是否存在独特的壁垒?

杨龚轶凡:目前实现高性能 TPU AI 芯片量产与交付的主要是我们。但最近这一年,我们一些在美国的师兄弟也开始在国内逐步创立新的TPU企业。我们相信,未来5到10年,国内会出现更多TPU企业,共同将这一架构的生态做起来,把TPU的使用者生态和开发者生态推向新的高度。

《科创板日报》:TPU这种技术路线的应用宽度大概有多少?

杨龚轶凡:我们设计TPU时,本质上就是针对深度学习做了高度定制化的设计。因此,它的应用宽度基本上就集中在深度学习领域。

对于深度学习以外的很多人工智能算法,比如随机森林(Random Forest)或一些带排序的算法,TPU并不很友好。从架构特性理解,TPU需要计算能表达为良好的向量或数学表达式,其性能才能得到较强展现。好处在于,当前深度学习的大模型大部分不带排序操作,因此TPU的价值体现会更高。

《科创板日报》:你会坚持一直走自研TPU的路线吗?

杨龚轶凡:我们会一直坚持自研TPU路线。创业之初,我们的理念就是希望算力成为人类社会的推动力。如今大模型的出现、AI政策的发展以及行业走向,其实都是对我们创业第一天理念的延伸。我们希望通过TPU这种算力芯片,提供更优质、更便宜、更好的算力,为整个人工智能新浪潮和产业奠定基础,帮助应用更快迭代与落地,最终实现真正的人工智能浪潮。

早期投资人实现高回报

《科创板日报》:对中昊芯英来讲,当时拿到第一笔融资是什么样的感受?

杨龚轶凡:我们团队在2018年底回国,首先在深圳落地。经过约一年运营后,因杭州向我们伸出橄榄枝,于是在2020年10月将公司主体迁至杭州,成立了中昊芯英。

融资方面,第一笔实际上在回国前就已基本确定。我们在谷歌参与TPU研发时,目睹了Transformer、Bert等模型在TPU上展现出的泛化能力——这是一种接近人类推理的"猜测"能力。我们预判,大约5-7年后,类似GPT-3的强推理模型将会出现,这对专用算力芯片将是巨大机遇。因此我们决心投身于此。

当时我们面临在硅谷或国内创业的选择。在接触美元基金的同时,我们也清醒认识到中美关系的变化趋势。我们坚信,在国内推进这项事业不仅具备商业价值,更具有重要的社会意义。

最终,杭州对科技创新的包容环境吸引了我们。我们将总部设在杭州,研发放在上海,从2018年底启动设计,到2023年完成流片,整整走过了五年的研发历程。

《科创板日报》:作为第一家做比较新的TPU,当时如何说服天使投资人愿意投你们?

杨龚轶凡:首先,早期接触的美元投资人,他们认可我们在谷歌的经验以及我们想做这件事的理念,因此早期获得美元资金的认可后,人民币基金也很愿意跟随和相信我们,并且对我们团队很认可。

但回国后的融资过程变得非常艰难。一方面,当时人工智能赛道因算法遇到瓶颈,没有大模型出现,模型越做越小以降低成本,像我们这样做大芯片的可能被认为没有市场、没有价值,很多人并不认可。正好我们被引到杭州,这也体现了杭州这座城市的包容和对创新的支持。

《科创板日报》:杭州国资投你们了吗?

杨龚轶凡:投了,并且这起到了一定的带动作用,社会资本对这个方向的支持力度也很高,包括我们早期的投资——赛智伯乐,他们对团队给予了极大的信任。

在大家都不看好这个方向的时候,他们投了进来。到2023年以后,整个赛道爆发了,大家反而更认可我们的价值,后期的融资就相对简单一点。

《科创板日报》:你们天使轮拿了多少钱?

杨龚轶凡:天使轮拿了1000多万人民币。

推理算力将成为最主要增长动力

《科创板日报》:近期,包括摩尔线程、沐曦股份等国内AI芯片公司纷纷上市,这是否会带动中昊芯英的IPO节奏?

杨龚轶凡:上市潮会带动行业对我们的关注,我们与投资人在沟通中会有相应规划,但也会根据市场环境与公司未来战略部署进行动态调整。

《科创板日报》:刚才你提到算力与推理,如何看待当前人工智能发展的状态?

杨龚轶凡:这需要分行业来看。目前有些领域的算力需求已从训练转向推理,比如人机对话应用已深刻改变生活,其推理算力需求甚至超过了训练。但在自动驾驶等尚未大规模落地的领域,训练仍是主要需求。

从市场规模看,今年中国算力芯片销售额预计在800-1000亿元人民币,而美国已达约1000亿美元,差距明显。美国市场目前虽以训练为主,但预计明年规模将增长至2000-3000亿美元,其中主要增量将来自推理需求。

随着大模型技术的成熟,越来越多的应用场景正在涌现。未来3到5年,随着各类应用加速落地,推理算力需求将迎来显著增长。预计推理芯片的销售占比将逐步超越训练芯片,虽然训练市场也会持续增长,但推理端将成为最主要的增长动力。

《科创板日报》:近年来国产AI芯片企业不断涌现,行业体系也在构建。你认为核心突破点在哪里?

杨龚轶凡:我认为当前国产AI芯片已在几个层面实现关键突破:

首先在硬件设计上,我们已经完成了从0到1的跨越。目前国内已涌现出多家具备大芯片设计能力的企业,均推出了第一代产品,这证明了我们拥有持续迭代的技术基础。更重要的是,经过近五六年的积累,我们已培养出一批能独立完成大芯片设计的硬件人才。

其次,在制造环节,国内晶圆厂的能力正在快速提升,已能够支撑我们芯片的国产化生产需求。

第三,在拥有自主芯片后,我们终于获得了与国际企业同台竞争的入场券。虽然目前在性能和性价比上仍存在差距,但随着产品迭代和软硬件生态的完善,预计再经过3到5年的发展,我们有望在性价比方面与国际领先企业正面竞争。到那时,国产替代将真正走向深化,甚至可能打开进入国际市场的新局面。

《科创板日报》:在人工智能方面,你如何看待中美之间的竞争演变趋势?

杨龚轶凡:首先,如前所述,中美在算力芯片采购量上存在巨大鸿沟,这导致基础设施差距明显,美国的性价比更高,其上层应用落地能力与算法开发能力也更强。当前我们必须承认这一现实。我认为至少在未来5到10年内,我们仍将长期处于美国领跑、我们追赶的状态。

直到算法成熟度越来越高、应用性越来越强,同时国产芯片性能迭代不断进步,性价比与海外芯片企业拉平,甚至国内模型落地成本更低时,我们的成本优势、人口优势与市场优势才能充分体现。那时才会出现新的突破口与拐点。长期来看,我们仍需保持追赶态势。

《科创板日报》:你如何评价谷歌这家公司?这段时间国内行业对其非常关注,甚至有人认为它是“十年磨一剑”、比英伟达更优秀的公司。

杨龚轶凡:作为TPU领域的实践者,我们非常认可谷歌的创新精神及其TPU技术的发展。谷歌的优势在于其强大的创新文化和鼓励探索的内部氛围。最初,TPU主要服务于谷歌自身的云服务和大模型能力,并非独立对外销售的产品。

然而,随着市场环境变化,谷歌近两年调整了策略,开始对外供应TPU。这一转变迅速获得市场积极反响,关键原因在于TPU具备显著的性价比优势,能为企业降低未来的算力部署成本。目前,我们已经看到来自Anthropic、Meta、苹果等企业的巨额订单,这反映出在AI迈向深化应用的阶段,算力性价比正成为产业界的核心考量。

从市场数据来看,TPU目前已占全球算力供给的30%以上。根据最新的产能规划,预计明年其全球市场份额有望与英伟达持平甚至实现反超。这进一步印证了TPU架构在效率与成本方面的竞争力,也说明针对AI计算特点进行定制化设计的路线正获得越来越广泛的认可。

成为推动算力发展的参与者

《科创板日报》:在你的设想中,中昊芯英未来想成为一家怎样的企业?

杨龚轶凡:正如之前所说,我们希望中昊芯英能成为推动算力发展的参与者,而不只是一家算力芯片设计企业。我们希望通过TPU芯片的设计,带动和促进整个人工智能赛道的发展、落地与高速迭代。

最终,我们希望中昊芯英成为未来赛道上的核心推动力之一,承载更多伙伴的创新与梦想,共同实现真正的人工智能时代。

《科创板日报》:我注意到在AI芯片行业中,中昊芯英是少数已盈利的企业。这是将盈利作为核心考核目标,还是业务模式自然带来的结果?

杨龚轶凡:并非将盈利作为考核目标,而是业务结构与发展业态逐步带来的结果。这主要有两个原因:首先,感谢国家对行业的支持与国产化进程。如果没有国产化要求与国家的支持,作为一家芯片企业,早期产品就能落地、量产并获得市场认可与盈利是不可能的。其次,我很赞赏谷歌的创新文化。对科技赛道而言,创新的本质是降低成本。只有投入足够、拥有完整的软硬件生态,才有可能盈利。

但我们做TPU或类似具有创新点的架构芯片设计有所不同:一方面,能在某种程度上降低部分研发投入;另一方面,有创新点的产品在进入市场时性价比更强。虽然市场接受度可能较难,商业化进程可能较慢,但在性价比高的情况下,毛利率水平会更好,研发投入也更小。本质上,正是通过创新迭代的过程,才自然带来了这样的财务表现。

《科创板日报》:公司运营发展主要关注哪些方向?

杨龚轶凡:我们主要看两个方向:一是生态的打入程度与完善程度,即市场渗透率;二是业务方向上,我们不仅卖芯片,还涉及“智算中心”共建。

《科创板日报》:为什么会考虑“智算中心”共建这种模式?

杨龚轶凡:中昊芯英希望构建完整的基础设施生态闭环,推动算力发展。这个过程必然需要算力平台与资源,以推动商业化落地、软件生态落地以及开发者生态落地。因此,我们肯定会协调合作许多算力平台或算力中心共建项目,最终形成大规模的TPU算力平台,与更多软件或算法公司合作,帮助它们完成算法落地与运营落地。

《科创板日报》:中昊芯英每年的技术研发投入占比保持在什么水平?

杨龚轶凡:我们希望将尽可能多的资金投入研发。这不仅涉及硬件的迭代升级,也包括软件栈的开发与软件生态的打造。这部分投入基本上是无底洞,所以我们拥有的资源都会向这个方向倾斜。

《科创板日报》:关于中昊芯英与天普股份的合作,未来希望为行业带来怎样的目标?

杨龚轶凡:当前我们还是一个大的框架性合作,希望中昊芯英与天普股份各取所长、携手共进,在人工智能浪潮中书写属于自己的篇章。

《科创板日报》:在产品规划上,中昊芯英是如何规划的?

杨龚轶凡:我们在2023年完成了第一代产品的落地,过程中软件栈持续迭代,衍生出多个产品系列。在与头部软硬件厂商完成全面适配后,第二代芯片目前正在测试,明年将进入市场。之后,我们将基本保持一年到一年半迭代一次的节奏。

《科创板日报》:你在美国的学习和工作经历,最大的感受是什么?

杨龚轶凡:在美国的经历带来两个重要价值:一是对创新的认可,更加崇尚创新;二是在创新过程中要不畏惧困难。在国内的学习生活环境有时会让人产生路径依赖,而我们这些海归团队则更自信,明白独立自主的开发能力至关重要。

《科创板日报》:你的职业经历从技术研发、产品到企业管理,有没有比较推崇的企业家或管理理念?

杨龚轶凡:在中昊芯英从0到1乃至从1到10的过程中,我们的管理团队也在不断变化与学习。我并非硬套某一家模式,但在公司成长中,我们赞赏许多老一辈企业家的决心、理念与方向。我们希望能博采众长,最终打造出属于中昊芯英自身的企业文化与管理运营模式。

从创始人角度,国内我们敬佩任正非先生,非常认可华为过去二三十年来对中国科技领域的贡献。海外企业中,我们非常喜欢并尊重已故的苹果创始人史蒂夫·乔布斯,认同他对创新的执着;同样也非常尊重埃隆·马斯克,认可他的极简理念与要求。

后记——

从硅谷核心研发到国产TPU架构实践,杨龚轶凡的创业历程并不追求短期爆发,而是注重技术体系的持续建设。他将芯片研发比作“在确定性与不确定性间寻找平衡”,将技术突破视为“架构创新与工程实践的双重挑战”。

五年来,杨龚轶凡坚持自主研发路线,使中昊芯英在AI算力领域逐渐形成差异化的技术路径,为国产芯片生态提供了另一种可能性。

这位兼具技术背景与商业视野的创业者,在学术研究向产业落地转化过程中,注重平衡技术创新与市场需求,通过架构层面的持续探索,中昊芯英正逐步构建起从芯片设计到软件生态的完整能力,为中国AI基础设施发展提供了一个务实的技术选项。

收藏
17.18W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
要闻
股市
关联话题
9.6W 人关注
6370 人关注
7654 人关注