

记者 郑晨烨
6月1日,英伟达在台北电脑缓期间举办的GTC Taipei 2026大会上发布了Vera CPU,其同期发布的新一代AI超算平台Vera Rubin,首批客户包括OpenAI和Anthropic。
这是英伟达第一次推出安祥的CPU居品线,英伟达昔时20年的增长险些彻底成立在GPU之上。英伟达CEO黄仁勋在发布会上示意,在AI智能体时间,CPU也曾成为数据中心性能的重要瓶颈,不行让CPU拖慢AI工场的token(词元)分娩速率。
此前的5月份,AMD CEO苏姿丰在财报电话会上告示,将做事器CPU的市集界限预测从600亿好意思元翻倍上调至1200亿好意思元以上,对应2025至2030年的复合年增长率从18%提高到35%。
凭证IDC统计,2025年环球做事器市集界限达到4441亿好意思元,同比增长80.4%,其中AI做事器孝敬了大部分增量。瑞银在近期的半导体行业研报中预测,做事器CPU的潜在市集界限将从2025年的约300亿好意思元增长到2030年的约1700亿好意思元,5年增长近5倍。
市集调研机构 Mercury Research的数据清晰,2026年一季度AMD的做事器CPU收入份额达到46.2%,英特尔为53.8%。但AMD的出货量份额惟有33.2%,英特尔仍占到66.8%。也等于说,AMD用更少的芯片创造了更高的收入,高核数居品的溢价身手在这一个季度取得汇集体现。
芯片说ICTIME首席分析师林好意思炳告诉经济不雅察报,CPU是刻下这一轮AI周期里最超预期的变量。AI从对话走向Agent(智能体),推理对CPU的需求量也曾跳跃教师。
GPU在“等”CPU
英特尔与佐治亚理工学院在2025年11月集结发表了题为《以CPU为中心的智能体AI视角(A CPU-Centric Perspective on Agentic AI)》的论文。在这篇论文中,磋磨团队对五类典型的Agent使命负载进行了实测,舍弃清晰CPU端器具处理所占用的期间,达到总延伸的43.8%到90.6%。
一位长久追踪半导体板块的券商分析师称,在大模子教师阶段,CPU的使命量占比能够惟有一到三成,某些使命负载可能达到近四成,绝大部分野心由GPU承担。这是因为AI大模子教师的野心进程高度规整,数以亿计的参数在海量数据上反复作念矩阵乘法,GPU的并行架构等于为这类任务假想的,CPU在其中厚爱数据加载、通讯调整和舍弃拷贝,不触及中枢的矩阵运算。
但到了推理阶段,这个比例运转翻转。CPU承担的使命量占比高潮到七成以上,Agent场景下会更高。因为Agent任务需要多步推理、调用外部器具、推论代码、读写数据库、搜索网页,然后将中间舍弃编排成最终输出。
编程助手、数据分析器具、自动化磋磨Agent齐属于这一类,亦然现在大模子应用中增长最快的场景。这些使命的共同特征是适度流密集、分支复杂、输入输出频频,GPU面对这类串行、碎屑化的任务操纵率会昭彰着落。
多位业内东谈主士示意,在Agent任务中,GPU的举座操纵率广大不到50%,远低于传统推理做事的70%到85%。Agent形势下AI部署的token铺张量平凡是平常对话的20到30倍,因为一次用户交互背后频频包含数十次器具调用和中间推理。
据IDC展望,环球Agent年推论任务数将从2025年的约440亿次增长到2030年的跳跃400万亿次。
2026年世界杯中国官网英特尔处治层在2026年一季度财报电话会上示意,AI智能体时间每吉瓦功耗所需的CPU中枢数可能从刻下的约3000万增长到1.2亿。市集磋磨机构Gartner也预测,到2027年将有40%的Agent技俩因基础要领本钱超支而被缩小或取消,其中格外一部分超支来自CPU端执续产生的器具调用和高下文处治支拨。
Agent在处理长对话和复杂任务时会产生大批中间数据。AI系统在推理进程中需要记着之前统共的对话骨子和器具调用舍弃,行业术语叫KV Cache(键值缓存),它会跟着对话轮次不停扩张,但GPU自带的存储容量相称有限,英伟达H100惟有80GB,下一代B200也惟有192GB,一个复杂的Agent任务产生的中间数据很容易就跳跃这个上限。
现在,业界广大遴荐的主义是把这些中间数据从GPU蜕变到CPU一侧。CPU可除外挂DDR5内存,单颗容量达到数TB,比GPU存储大出一到两个数目级。
由英特尔、AMD、ARM等芯片厂商构成的CXL行业定约在2025年11月发布了CXL 4.0条约(Compute Express Link,一种用于芯片之间高速互联的怒放法度),允好多颗CPU分享归并个大容量内存池,减少数据在芯片之间搬运的支拨。
由此,CPU不再只负包袱务调整,还要厚爱AI推理进程中的数据存储和内存处治。
北京清微智能科技股份有限公司研发副总裁李彬称,当AI算力集群扩展到数千颗芯片直连的超节点界限时,芯片之间的互联和调整复杂度呈指数级增长,清微智能的决策也曾不错完毕4096颗芯片直连,互联本钱较传统决策大幅缩小。
李彬说,超节点时期本人并不新,是大模子的参数界限增长让这类架构有了用武之地,在这种界限的集群中,CPU承担的协统一处治使命量远超小界限部署。
另外,CPU本人在昔时几年也履历了密集的时期升级。做事器CPU的中枢数从2017年的28核,攀升到2026年的288核(英特尔Clearwater Forest) 和 256 核(AMD Venice),密度提高接近10倍。
英特尔在2023年引入了AMX(高等矩阵扩展)教唆集,让CPU第一次具备专用矩阵野心单位。凭证英特尔方面的测试数据,在深度学习推理场景下,搭载AMX的第四代至强处理器AI性能较前一代最高提高近10倍。内存子系统也从DDR4升级到DDR5,单平台带宽和容量均完毕翻倍。
中枢数和教唆集的升级,也对应着CPU与GPU配比的变化。英特尔CEO陈立武在2026年一季度财报电话会上说,教师场景下平凡是7到8颗GPU配1颗CPU,推理场景下拘谨到3到4颗GPU配1颗CPU,Agent场景下有望进一步拘谨至1:1。
英特尔CFO大卫·辛斯纳(David Zinsner)在归并场电话会上补充示意,行业举座的CPU与GPU配比已从昔时的1:8拘谨至约1:4。
十多年来初次大涨价
上述配比变化也曾传导到居品订价上。
深圳一家CPU经销商的市集厚爱东谈主贾彬告诉记者,从2026年2月起,英特尔和AMD不竭上调了全系列做事器CPU价钱,举座涨幅在10%到15%之间,部分高端AI做事器CPU的现货溢价更高,下半年可能会有新一轮价钱上调。
贾彬说,昔时十多年,做事器CPU基本是“加量不涨价”,性能随制程提高,但单价看护不变,本年的涨价幅度在行业里很零碎。英特尔主力产线的产能操纵率也曾从此前不及80%高潮到100%,多个型号处于缺货情状,交货周期在3到4个月。
AMD不异靠近产能垂死。贾彬说,2026年是他入行以来第一次看到英特尔和AMD的做事器CPU产能基本被一齐订满,“昔时CPU的供给一直是富饶的,本年反过来了”。
贾彬还端庄到,客户在采购AI做事器时对CPU的需求正在分化成两类。一类是机柜里面配合GPU运算的CPU,博亚体育(中国)2026世界杯官方app下载追求极限核数,128核以上,均价在4000好意思元以上,传统做事器CPU均价惟有2000多好意思元。另一类是机柜外部安祥部署的CPU,用于Agent的器具推论、沙箱运行和任务编排,不需要极限性能,64核足下就够,但数目要大得多。
贾彬说,每个Agent任务在理念念情状下独占一颗CPU,安祥部署比诬捏化分区后果更高,柜外CPU均价约3000好意思元,“核数越高单价涨幅越大,不是按比例增长的。是以,柜外用中档居品铺量,柜内用旗舰居品保性能,是现在客户的广大作念法”。
好意思银证券在6月11日发布的一份题为《智能体崛起(Rise of the Agents)》的半导体行业研报中,将2030年做事器CPU的总潜在市集界限(TAM)预测上调至1700亿好意思元以上,并初次将这个市集拆成三个部分:传统云野心CPU约300亿好意思元,AI集群头节点CPU约700亿好意思元,AI智能体安祥节点CPU约700亿好意思元。其中,第三个部分在2025年的界限接近于零,是2026年才运转出现的全新市集。
摩根士丹利在6月4日的一份研报中也预测,智能体AI将在2030年前为做事器CPU市集带来325亿至600亿好意思元的新增需求。中泰证券在6月7日发布的CPU深度研报中将2026年界说为“CPU受益AI放量的元年”。
上述好意思银证券研报还列出了一组出货量的历史对比:2022年AI CPU的出货量格外于AI加速器(GPU等)出货量的19%,到2025年这个比例升至51%,展望2030年将达到127%。按照这个预测,AI做事器中CPU的数目将在5年内跳跃GPU。
国产CPU的新需求
英伟达在台北电脑缓期间公布的信息清晰,其最新发布的Vera CPU基于ARM架构(一种以低功耗和高能效著称的CPU教唆集,与x86并排为两大主流架构),单机柜可部署256颗,遴荐液冷散热。
在Agent沙箱场景中,Vera的性能是x86处理器的1.8倍。在英伟达最新发布的Vera Rubin超等野心集群(英伟达下一代AI数据中心平台)中,一个40机架的POD(由多个机架构成的最小无缺野心单位)包含1152颗Rubin GPU和最多1088颗Vera CPU,两者配比接近1:1。
英伟达方面还提到,此前发布的Grace CPU已累计出货近250万颗,2026年CPU关系收入有望接近200亿好意思元。
贾彬觉得,上述200亿好意思元的统计口径较宽,涵盖了CPU在多种居品格局中的收入包摄,与传统真谛上单独销售CPU芯片的收入不彻底调换。但即便谈判口径各异,对一个2024年还莫得安祥CPU业务的公司来说,这个体量也曾不小。
林好意思炳觉得,英伟达作念CPU的信号真谛大于居品本人,昔时AI做事器以GPU为中枢,CPU仅仅配套,当环球最大的GPU公司亲身作念CPU并把首批客户锁定为OpenAI和Anthropic,CPU的市时势位也曾和两年前彻底不同。
凭证AMD2026年一季度财报,该公司数据中心业务收入达到57.75亿好意思元,初次跳跃英特尔同期的51亿好意思元。何况,苏姿丰在财报电话会上淡漠了一个五年方针:数据中心年营收迈向1000亿好意思元。
英特尔CEO陈立武也在多个公开场地示意,他对CPU在AI时间的中枢作用抱有刚烈信心。
这对中国的CPU产业链企业亦然一个契机。贾彬称,国内头部云厂商本年在加大做事器CPU的采购力度,一方面是为新建AI数据中心配套GPU采购CPU,另一方面是因为CPU与GPU的配比从昔时的1:8拘谨到1:4致使更高,归并个数据中心需要的CPU数目比昨年多出一倍以上。
事实上,在国内,围绕做事器CPU也曾造成了相对无缺的产业链。
海光信息(688041.SH)是现在国内x86架构做事器CPU出货量最大的厂商之一。凭证关系财报,海光信息2025年的营收为143.77亿元,同比增长 56.92%;2026年一季度营收为40.34亿元,同比增速进一步提高到68.06%。
海光信息副总裁应志伟告诉记者,AI算力竞争也曾从单一芯片的性能比拼转向系统级协同。海光是国内少数同期具备高端通用CPU和DCU(AI加速器)两条居品线的芯片假想公司,两条居品线的协同不错障翳AI教师和推理的全场景需求。海光C86系列CPU(兼容x86教唆集)现在也已构建起跳跃6000家配结伙伴的国产怒放生态。
应志伟示意,生意界限跳跃九成的存量应用基于x86架构开辟,这种生态兼容性是海光在信创替换中的中枢上风。另外,除了数据中心,旯旮推理和具身智能也正在成为x86 CPU的新增量场景。比如,优必选、宇树等机器东谈主厂商的主流决策现在仍以x86 CPU搭配GPU为主,x86的软件生态在具身智能界限的先发上风昭彰。
凭证公开信息,华为鲲鹏走ARM全栈自研阶梯,鲲鹏920/950与昇腾AI芯片深度协同,主要做事华为自有生态和信创市集。
在配套芯片方面,澜起科技(688008.SH)的主营居品是内存接口芯片(做事器CPU与内存条之间的信号中转芯片)。凭证公开信息,其内存接口芯片在2024年以36.8%的市集份额位居环球第一;另一条居品线PCIe Retimer芯片(用于高速数据传输中的信号放大和成立),2024年环球市集份额为10.9%,名次第二。
在封测制造要领,凭证公开信息,通富微电(002156.SZ)是AMD在环球范围内最热切的封测配结伙伴之一。
李彬告诉记者,国产芯片的软件生态正在接近一个临界点。他举了一个例子:DeepSeek V4发布今日,多家国产芯片厂商在归并天内完成了适配,而此前DeepSeek R1的适配周期需要1到2个月。适配速率的大幅加速施展国产芯片的软件器具链和驱动层正在快速锻练,这对通盘国产CPU和加速器产业链齐是利好。
在林好意思炳看来,国产CPU的受益逻辑分为两层:一层是环球做事器CPU需求增长带来的行业增长,另一层是信创计谋驱动的国产替代。
凭证国资委2022年下发的关系文献条目,央国企要在2027年底前完成信息化系统的国产化修订。记者在采访进程中也了解到,国内高端做事器CPU的国产化率现在仍较低,替代空间开阔。距离计谋节点还有不到2年期间,信创CPU的请托窗口正在收窄,这对海光信息、龙芯中科(688047.SH)等国产CPU厂商的居品锻练度和出货身手齐是一次汇集考研。
林好意思炳觉得,刻下这一轮CPU涨价周期和昔时不同,增量来自AI Agent对CPU的全新需求,而非制程升级带动的换代需求。
应志伟的判断访佛。他说博亚体育(中国)2026世界杯官方app下载,昔时几年市集的端庄力险些一齐汇集在GPU上,但当AI应用信得过投入大界限落地阶段,CPU承担的调整和处治职能只会越来越重。在他看来,这不是CPU要取代GPU,GPU依然热切,但接下来信得过拉开差距的是CPU和GPU之间的协同身手,而非单颗芯片的性能参数。

