行业动态更新:当Token成为新生产力,AI利润中心正在从基础设施转向大模型公司
如今,在 AI 行业度过的一天,几乎相当于其他行业的一年
业内人士指出,模型能力、推理软件以及硬件架构同时高速演进,让原本需要数年的技术周期,被压缩到几周甚至几天
业内人士指出,尤其是 2025 年以来,Agentic AI 开始真正进入生产场景,整个 AI 产业的价值结构也因此发生根本变化
值得关注的是,过去,AI 更多停留在聊天、搜索增强和内容生成阶段;而现在,AI 已经能够自主执行复杂工作流,直接参与企业运营
业内人士指出,这种变化带来的最核心结果是 Token 第一次具备了”劳动力”属性
业内人士指出,企业购买 Token,不再只是为了获得信息,而是为了替代真实的人力成本、缩短业务流程,并提高组织效率
值得关注的是,与此同时,生成Token的成本却在持续下降
值得关注的是,吞吐量提升、软件优化以及缓存机制成熟,使AI系统能够以更低成本生产更多Token
业内人士指出,结果是,终端用户投资回报率(ROI)快速提升,而大模型公司的利润率也开始同步扩张
从更深层次来看,从 2023 年至 2025 年,AI 产业最大的赢家一直是基础设施公司
从更深层次来看,NVIDIA 率先受益于 GPU 需求爆发,随后电力、存储、算力租赁等领域也迎来价值重估
业内人士指出,例如,NVIDIA 在 2023 年 5 月发布了其首次爆炸性财报,并在盘后上涨 25%,正式标志着 AI 交易热潮的开始
业内人士指出,市场逐渐意识到,AI 不仅是软件革命,更是一次全球算力基础设施重构
从更深层次来看,谁掌握 GPU、电力与先进制程,谁就掌握产业链中的核心利润
业内人士指出,但在这一阶段,大部分模型开发者和公司并未真正建立强盈利能力
值得关注的是,AI 虽然热度极高,但实际应用仍相对有限,很多用户对 AI 的使用,本质上只是”更聪明的搜索”
从更深层次来看,真正改变行业结构的,是 Agentic AI 的成熟
业内人士指出,随着 AI 开始承担研究、分析、编程、财务建模等复杂任务,Token 的价值迅速提升
值得关注的是,过去需要数小时完成的工作,如今只需要几分钟与少量 Token 即可实现
从更深层次来看,这意味着,AI 产业的利润池开始从”卖算力”逐渐转向”卖生产力”
值得关注的是,Agentic AI 让 Token 变成生产力 Agentic AI 最大的不同,在于它不再只是生成答案,而是能够完成完整任务
值得关注的是,例如,在金融研究、商业分析等场景中,AI 已经能够自动整理数据、生成图表、构建财务模型、分析公司财报,甚至协同多个工具完成复杂流程
从更深层次来看,过去,这类工作通常需要大量初级分析师或运营人员投入时间
从更深层次来看,而现在,AI 可以在极短时间内完成相当比例的重复性脑力劳动
业内人士指出,因此,企业开始重新计算 Token 的价值
从更深层次来看,衡量标准不再是”生成多少内容”,而是”节约了多少人工成本”
业内人士指出,SemiAnalysis 展示的一些真实案例表明,在部分工作流中,Token 支出相比对应的人力成本已经极具性价比
业内人士指出,这也是为什么许多高度依赖 AI 的团队,Token 消耗量正在呈指数级增长
从更深层次来看,一些企业内部的 Token 支出,甚至已经达到员工薪酬的重要比例
值得关注的是,例如,在 SemiAnalysis,按年化计算的 Token 支出已经达到员工薪酬的约 30%,而每位员工每月消耗接近 50 亿个 Token
值得关注的是,随着越来越多企业将 AI 嵌入核心工作流,Token 将逐渐成为新的数字生产力
业内人士指出,Token 越来越便宜,但模型公司越来越赚钱 Token 成本下降的核心驱动力来自推理效率提升
从更深层次来看,新一代 GPU 在单位时间内可生成的 Token 数量相比上一代提升数十倍,而软件优化进一步放大这一优势
从更深层次来看,通过调度优化、并行策略与解码改进,同一硬件可获得 10 倍以上吞吐差异
从更深层次来看,在硬件层面,最优化的 GB300 NVL72 配置在 FP8 精度下的吞吐量约为最优化 H100 配置的 17 倍;如果切换到 Hopper 原生不支持的 FP4 精度,这一差距将扩大至 32 倍
值得关注的是,需要注意的是,GB300 相较于 H100 的单 GPU 总拥有成本仅高出约 70%
业内人士指出,来源:SemiAnalysis InferenceX 这种”性能提升远快于成本增长”的结构,使推理服务商利润率快速扩张,并推动整体 Token 价格持续下降,但行业总利润反而上升
从更深层次来看,尽管部分模型降价,但大模型公司的整体利润率仍在上升,其核心原因是成本下降速度超过价格下降速度,同时需求从低端模型向高端模型迁移
业内人士指出,以 Anthropic 为例,其高端模型使用占比提升,使平均售价结构性上升
业内人士指出,此外,企业愿意为更高能力的模型支付溢价,因为其带来的生产力提升远超成本增长
从更深层次来看,目前,大模型公司已具备明显定价权,而开源模型尚未形成有效替代压力
从更深层次来看,同时,由于算力供给受限,大模型公司能够通过 SKU 分层进一步提升收益结构,使高端 Token 价格持续上移
业内人士指出,很多人认为,随着开源模型不断进步,大模型公司的利润最终会被竞争压缩
业内人士指出,首先,闭源模型在真实复杂工作中的能力,仍然明显领先于开源模型
值得关注的是,虽然开源模型在基准测试中不断追赶,但在长任务执行、复杂推理、工具调用和稳定性方面,依然存在明显差距
业内人士指出,当前,先进 GPU、HBM 内存以及先进制程产能仍然高度紧张,没有任何一家大模型公司能够服务整个市场
业内人士指出,即便市场需求持续增长,算力供给也很难在短期内同步跟上
业内人士指出,这意味着,大模型公司并不需要通过价格战争夺用户
从更深层次来看,只要企业能够通过 AI 获得远高于 Token 成本的收益,它们就愿意继续支付更高价格
从更深层次来看,因此,AI 行业正在从”成本定价”逐渐转向”价值定价”
值得关注的是,决定 Token 价格的,不再只是推理成本,而是 Token 究竟能创造多少经济价值
业内人士指出,NVIDIA 与 TSMC 为何没有”榨干”市场 一个非常有趣的现象是:虽然 AI 需求远远超过供给,但 NVIDIA(英伟达)与 TSMC(台积电)并没有完全按照稀缺性重新定价
业内人士指出,理论上,掌握先进 GPU、HBM 和 N3 制程的一方,完全有能力进一步提高价格,并获取更高利润
值得关注的是,因为无论是大模型公司、Neocloud 还是超大规模云厂商,目前都在不惜代价锁定算力资源
业内人士指出,但现实中,NVIDIA 与 TSMC 的定价策略仍然相对克制
从更深层次来看,一方面,如果它们过度提价,很可能引发更强烈反垄断压力;另一方面,它们更注重长期客户关系和生态系统稳定,而不是在短期内榨取最大利润
值得关注的是,来源:SemiAnalysis 晶圆代工模型 某种程度上,NVIDIA 正在扮演类似”中央银行”的角色
值得关注的是,它通过不断释放更强硬件、优化软件栈以及稳定供应链,推动整个 AI 生态扩张
业内人士指出,因为只有整个 AI 市场持续扩大,对 GPU 与基础设施的长期需求才会不断增长
业内人士指出,Rubin 时代:内存将成为新的利润核心 随着 NVIDIA Rubin 架构即将到来,AI 服务器的价值结构也正在发生变化
业内人士指出,过去,GPU 本身是系统中最核心的定价对象;但未来,内存的重要性将显著提升
业内人士指出,Rubin 系统引入 SOCAMM 模块化内存方案,使内存能够像独立资源一样进行单独定价
从更深层次来看,这意味着,NVIDIA 未来不仅可以出售 GPU 性能,还能够对高性能内存实施更灵活的利润管理
值得关注的是,来源:SemiAnalysis 内存模型 与此同时,HBM 与 LPDDR 供应仍然高度紧张,内存价格已经持续上涨
从更深层次来看,而 Rubin 架构又进一步增加了系统对高性能内存的依赖
业内人士指出,因此,内存正在从”辅助组件”逐渐变成新的价值中心
业内人士指出,相比 GPU,内存受到的反垄断关注也更少,因此 NVIDIA 在内存上的定价空间可能比 GPU 更大
业内人士指出,未来,SOCAMM 很可能成为 NVIDIA 新的利润杠杆
业内人士指出,AI 产业开始从”成本逻辑”转向”价值逻辑” 过去,GPU 租赁市场主要采用成本定价逻辑
业内人士指出,Neocloud 与云厂商通常只要确保项目内部收益率达到投资门槛,就会继续扩张 GPU 部署
值得关注的是,因此,GPU 租赁价格更多由硬件成本、融资成本以及折旧周期决定
从更深层次来看,但随着 Agentic AI 开始真正创造生产力,客户对算力的衡量方式也发生变化
从更深层次来看,如果新一代 GPU 能够显著降低每 Token 成本,并帮助企业创造更高利润,那么客户愿意支付的价格上限自然会上升
业内人士指出,换句话说,未来 GPU 的价值,不再由”它值多少钱”决定,而是由”它能帮助客户赚多少钱”决定
值得关注的是,这也是 SemiAnalysis 提出”One Chart to Rule Them All”框架的核心:AI 产业链中的利润分配,本质上取决于谁拥有更强的价值定价能力
从更深层次来看,来源:SemiAnalysis AI TCO 模型 大模型公司、Neocloud、超大规模云厂商以及 GPU 服务商之间,正在围绕这套新逻辑重新分配利润
从更深层次来看,AI 时代最大的赢家,正在从硬件转向模型 过去两年,市场普遍认为 AI 最大的赢家是 NVIDIA 等基础设施公司
从更深层次来看,但随着 Agentic AI 真正进入企业生产系统,行业利润中心已经开始转移
值得关注的是,没有 GPU、先进制程和高带宽内存,就不存在 AI 能力扩张
业内人士指出,但越来越多新增价值,已经开始由大模型公司直接获取
从更深层次来看,因为真正决定 AI 商业价值的,不再只是”拥有多少算力”,而是”能否让 Token 真正创造生产力”
值得关注的是,当 Token 能够替代劳动、提高组织效率并直接创造收入时,大模型公司就拥有了更强的定价权
业内人士指出,与此同时,硬件供应商虽然仍掌握关键资源,却在主动维持生态平衡,希望通过扩大整个 AI 市场来获得更长期收益
从更深层次来看,因此,AI 产业正在进入新的阶段:硬件定义能力上限,模型决定价值兑现,而未来竞争的核心,将从”谁拥有更多 GPU”,逐渐转向”谁能让 Token 创造更高经济价值”
值得关注的是,2026 中国智算产业生态发展年会将于 6 月 30 日在深圳盛大启幕
业内人士指出,本届大会以”AI 入场景,Token大时代”为主题,设置主论坛、供需交流会、年度评选、闪话:智算引力现场、创新成果展等多元环节,汇聚大模型企业、算力基础设施提供商(芯片、服务器等)、算力服务商、行业用户,共同探讨智算产业从建设走向应用、从技术走向生态的关键路径
可以预见,这一趋势将在未来深刻影响IDC行业格局
如果您正在寻找优质的服务器托管,欢迎访问 www.isclouder.com 了解更多
