ASIC具备高专用性和高性价比的特征。GPU拥有高并行计算能力,适用于多种计算任务,适用于AI训练和推理场景。而ASIC芯片为特定应用定制,因此可以在特定场景中实现低成本、高性能、低功耗,具备高专用性和高性价比特征。ASIC的限制同样明显,ASIC芯片设计的前期投入较高,一旦设计完成难以更改,这限制了其对于新算法、新任务的适用能力。所以,过往ASIC芯片大多适用于5G网络、挖矿等特定场景。
云厂商对AI算力的需求扩张,致使ASIC方案成为新宠。AI ASIC发展条件逐渐成熟:
①特定场景(AI推理)需求加速,以ChatGPT为代表的AI推理需求加速增长;
②头部云厂商AI资本开支持续加码,足以体现ASIC方案的性价比优势,25年头部CSP厂商的Capex已超3000亿。
从ASIC产业链来看,可以分为前端、后端、流片三个核心环节。前端(云厂商内部设计团队):云厂商对于更好性能、更低功耗、更低成本的AI芯片需求提升,因此CSP正在组建大型芯片设计工程师团队。云厂商内部的芯片设计团队主要负责对芯片功能、性能提出具体需求。
• 后端(博通、Marvell占据60%以上份额):由于云厂商没有能力完成独立的SoC设计,往往会寻求与半导体公司进行合作。ASIC公司拥有IP设计、芯片设计、先进封装集成能力。
目前全球两家最大的ASIC半导体公司为博通和Marvell。目前两家公司占据了超过60%的份额,博通以55%-60%份额位居第一,Marvell以13%-15%的份额位居第二。在流片环节,目前AI ASIC的流片仍由台积电主导。
博通预计27年定制化AI市场规模可达600-900亿美元。根据博通业绩会,公司预计2024年其SAM规模(包括ASIC和网络产品)将达到150-200亿美金之间,预计至2027年SAM规模将增长至600-900亿美元。
AI ASIC单价约为英伟达GPU的五分之一。根据半导体产业纵横,相较于OpenAI 仰赖的英伟达GPU(如H100、A100),Google 的TPU 成本只有其五分之一。
参考novita,H100售价在2.5万美金以上。我们预计,目前AI ASIC均价在5000美金左右。
随着Meta从2026年、微软从2027年开始大规模部署自研ASIC解决方案,ASIC总出货量有望在2026年某个时点超越英伟达GPU。
谷歌自研芯片的时间最早,目前已迭代到v7版本。亚马逊自2022年发布第一代Trainium芯片,进度相对较快,目前已有3代方案。
META、微软、OpenAI的自研芯片方案集中在23-24年发布,因此我们预计25-26年有望加速放量。
当前云厂商自研ASIC的算力性能指标基本对齐英伟达H系列,在能效比上具备一定优势,而在Scale-Up互联上仍存在一定差距。
首款谷歌TPU V1发布于2016年,语音搜索、图片搜索等功能的出现催生了大量计算需求,因此,TPU v1主要用于数据中心推理。
PU是目前ASIC当中最成熟的产品。2024年全球ASIC出货量达345万颗。谷歌TPU作为ASIC领域的代表性产品,其市占率从2023年的71%提升至2024年的74%。
除谷歌内部使用外,谷歌TPU也为企业客户的AI大模型提供支持。例如,自动驾驶汽车公司 Essential ,Nuro 致力于通过使用 Cloud TPU 训练机器人;
Deep Genomics 正在利用 TPU 推动药物发现;德勤将使用TPU通过生成式 AI 实现业务转型。
微软:2024年9月,微软公布了Maia 100设计。Maia 100芯片尺寸约为820mm²,采用台积电先进的N5工艺制造,采用COWOS-S技术。借助 Maia 100,微软旨在为管理大规模 AI 工作负载提供更具成本效益和效率的解决方案。
OpenAI:2024年9月,OpenAI首颗芯片曝光。将采用台积电最先进的A16埃米级工艺,专为Sora视频应用打造。
特斯拉:2025年5月,特斯拉CEO埃隆・马斯克在社交媒体上透露,特斯拉Dojo AI训练计算机项目正稳步推进,预计今年晚些时候将推出下一代AI芯片——Dojo 2。Dojo 2在性能上可能与bibo必博官网英伟达B200 AI训练系统相媲美,但真正的突破要等到Dojo 3。
CPO方案是长期发展趋势。CPO共封装光学(Co-Packaged Optics),指的是交换ASIC芯片和硅光引擎在同一高速主板上协同封装,从而降低信号衰减、降低系统功耗、降低成本和实现高度集成。CPO技术可以缩短交换芯片和光引擎之间的距离,以帮助电信号在芯片和引擎之间更快地传输。
博通积极拥抱CPO领域。博通深耕CPO环节,2021年开始布局CPO,经过4年多的研发,在2024年实现了第二代51.2T CPO交换机Baily的demo, 并相继与腾讯、字节等多家公司展开合作。在Tomahawk 6时代,博通通过领先的SerDes和光学生态系统实现全系统优化,基于Tomahawk 4/5已验证的CPO技术,博通新一代CPO版本将集成光学引擎与交换硅片(仅保留外部激光源),进一步降低功耗、延迟与链路波动,提升长期可靠性。
头部大厂在研发、生产和服务能力优势进一步凸显,市场份额向国内集中。头部公司紧跟客户研发节奏,新产品可率先进入客户供应链,提前锁定客户需求,市场份额有望持续向头部集中。
中际旭创:全球数通光模块龙头,深度绑定北美CSP客户,1.6T产品持续领先,技术前瞻性投入,先后布局了相干光模块以及光电共封装CPO等领域。
新易盛:全球数通光模块领军企业,800G出货量持续提升,有望充分受益于海外ASIC放量,1.6T产品持续推进,研发技术能力保持领先。
天孚通信:全球光器件一体化平台龙头服务商,通过内生外延不断扩展自身产品线,无源业务稳定增长,光引擎实现大批量交付,有源业务蓄势待发。
太辰光:全球MPO领军企业,受益于800G需求持续放量,MPO产品需求持续向好,公司产能稳步扩充,并进行CPO领域的前瞻布局。
长芯博创:子公司长芯盛深耕MPO跳线,海外客户需求持续放量,产能稳步提升,积极拓展AEC等产品。
AEC 电缆具有内置信号放大和调节功能。它们将电气传输的简单性与有源元件提供的额外距离优势相结合。AEC 通常支持长达 5 米的距离,具体取决于应用和数据速率。与传统铜缆相比,它们具有更好的灵活性和易于安装的特点。
• AEC主要用于机架方案的互联。参考AWS的Trn2机架组网方案,每个机架由4个16芯片服务器组成,配置类似于GB200 NVL36x2,每组服务器之间使用AEC连接。根据semianalysis,AWS方案中GPU与AEC的用量配比为1:2。
英维克:UQD快接头产品被列入英伟达MGX生态系统合作伙伴,海外市场有望持续拓展。 24年10月OCP大会期间,英伟达在官网发布 GB200系统开发成果的相关资讯新闻,提到目前全球40+家基础设施(DCI)提供商在Blackwell平台上进行构建和创新,其中包括英维克。英维克积极开拓海外市场,尤其在液冷算力领域加大海外合作与推广力度,预计将充分受益于AI数据中心需求持续增长、液冷渗透率提升以及海外市场突破。
• 科创新源:内生外延,拟收购导热界面材料公司,有望切入海外AI供应链。公司服务器液冷板产品采用协同制造+自主产销双轮驱动模式,积极切入头部企业供应链。同时公司拟收购东莞兆科51%股权,其主要产品为热界面材料,应用于产热端和散热端接触面之间以提高热量传递效率,与公司服务器散热器高度相关。东莞兆科已与海内外大客户深度合作,覆盖富士康、台达、奇宏、英特尔等AI产业链头部厂商,有望助力公司拓展客户关系及海外市场渠道。
张永超,1982年出生四川大竹,中国根雕美术协会会员,中国东方文化研究会,社会艺术专业委员会根雕研究院,四川省根雕奇石协会理事,大竹根雕奇石协会副会长,大竹县科普作家协会理事,木雕第五代传承人。
来源:【绿色四川】夏日炎炎