3 12 月, 2025

AWS发布全球首款3nm AI芯片Trainium 3,挑战英伟达市场地位

aws-3nm-ai-trainium-3-

在2025年的re:Invent大会上,亚马逊云计算部门AWS正式发布了第四代自研AI训练芯片Trainium 3。这款芯片是全球首款采用3nm制程的AWS专用AI加速器,标志着AWS在AI硬件领域的重大突破。

根据www.Todayusstock.com的报道,Trainium 3单芯片提供高达2.52 PFLOPs的FP8算力,内存容量提升至144GB HBM3e,较前代产品增加了1.5倍,内存带宽达到4.9TB/s,提升了1.7倍。单台Trn3 UltraServer可搭载144颗Trainium 3芯片,总算力达到惊人的362 PFLOPs,聚合内存20.7TB、带宽706TB/s。官方数据显示,训练与推理速度提升超4倍,能效提升40%,性能功耗比提升4倍。

技术突破与市场影响

Trainium 3在Amazon Bedrock平台上已成为最快的加速器,每兆瓦token输出量增加超过5倍。AWS同时预告了正在研发的Trainium 4,将原生支持英伟达NVLink Fusion高速互联技术。这一兼容性设计将帮助客户在保留原有生态的同时享受亚马逊低成本硬件优势。

消息发布后,亚马逊股价一度逼近239美元创日内新高,涨幅扩大至2.2%,而英伟达早盘涨幅迅速收窄,AMD跌近2.1%。市场普遍认为,Trainium 3的高性价比与Trainium 4的NVLink兼容策略将进一步压缩英伟达在云端训练市场的溢价空间。

Nova 2家族与创新服务

AWS同步推出了Nova 2系列四款前沿模型,全面覆盖推理、多模态、语音与生成任务:

  • Nova 2 Pro:亚马逊迄今最智能推理模型,在多项基准测试中超越Claude Sonnet 4.5与GPT-5.1。
  • Nova 2 Omni:业界首款统一多模态推理+生成模型,可同时处理75万token文本、数小时音频与长视频。
  • Nova 2 Sonic:100万token上下文的语音到语音模型,支持实时类人对话。
  • Nova 2 Lite:高性价比轻量级模型,13/15项测试优于Claude Haiku 4.5。

此外,Nova Forge首次向企业开放全阶段模型检查点,允许客户将专有数据与亚马逊精选数据集混合训练,彻底解决“定制深度有限”与“从零训练成本高昂”两大痛点。Reddit、Booking.com、索尼等已采用该服务构建专属“Novellas”模型。

未来展望与行业影响

AWS通过Trainium 3硬件、Nova 2模型矩阵与Nova Forge/Nova Act两大创新服务,构建起从底层算力到上层应用的完整自研AI生态闭环。3nm制程带来的性能与能效双提升,加上对NVLink Fusion的兼容支持,标志着亚马逊已从“性价比挑战者”正式升级为可与英伟达正面竞争的云端AI算力提供商。

未来一年,Trainium生态的实际采用率与Anthropic等头部客户模型性能表现,将成为验证AWS战略成功与否的关键指标。短期来看,Trainium 3快速量产与高能效数据提振市场信心;中期来看,Trainium 4的NVLink兼容将加速大客户迁移,增厚AWS高利润率AI业务占比;长期来看,若2026年前Trainium市占率突破15%,有望为亚马逊贡献数百亿美元年收入,成为继Prime后的又一增长引擎。

常见问题解答:

Q1: Trainium 3相比英伟达当前主流芯片到底有多大优势?

A: 虽然AWS未直接公布与H200/B200的横向对比数据,但从能效提升40%、性能功耗比提升4倍、每兆瓦token输出增加超5倍来看,在同等功耗下Trainium 3的实际训练吞吐量已极具竞争力。加上AWS一贯的按需计费模式,总拥有成本(TCO)预计比英伟达GPU集群低30%-50%。

Q2: 为什么说Trainium 4支持NVLink Fusion是战略转折点?

A: 过去最大迁移阻力在于CUDA生态锁定。Trainium 4通过NVLink Fusion实现与英伟达GPU物理层互连后,客户可在同一集群混合使用两家芯片,极大降低切换风险。这相当于为英伟达生态“留了后门”,大幅提升企业上云谈判筹码。

Q3: Nova Forge的“开放式训练”对企业到底意味着什么?

A: 传统定制方案要么深度有限,要么需要从零训练成本数百亿美元。Nova Forge首次开放预训练+中期+后训练全阶段检查点,并允许企业注入专有数据混合训练,相当于把千亿美元级别的模型训练能力以服务形式开放,真正实现“企业专属大模型即服务”。

Q4: Anthropic同时用AWS和谷歌TPU,说明Trainium还不够强?

A: 多云策略是当前所有头部AI公司的通用做法。Anthropic今年已与AWS签订数百亿美元Trainium算力协议,同时年底前将获得100万颗Trainium芯片,实际使用规模远超谷歌TPU,表明其对Trainium性价比高度认可。

Q5: 普通投资者该如何看待本次发布对亚马逊股价的影响?

A: 短期看,Trainium 3快速量产与高能效数据提振市场信心;中期看,Trainium 4的NVLink兼容将加速大客户迁移,增厚AWS高利润率AI业务占比;长期看,若2026年前Trainium市占率突破15%,有望为亚马逊贡献数百亿美元年收入,成为继Prime后的又一增长引擎。

推荐阅读  博通财报创新高:AI芯片推动营收增长,四季度展望乐观