曦望发布启望 S3 GPU 芯片，推理成本大幅降低

1月27日消息，国产GPU厂商曦望（Sunrise）正式发布其新一代推理GPU芯片启望S3。这一发布标志着曦望在过去一年内完成约30亿元战略融资后的首次重大亮相。

据悉，启望S3是一款专为大模型推理设计的定制化GPGPU芯片。与上一代产品相比，启望S3在典型推理场景下的整体性价比提升超过10倍。该芯片支持从FP16到FP4的精度切换，并采用LPDDR6显存方案，其显存容量较前一代提升了4倍。

技术创新与应用场景

在应用层面，启望S3在DeepSeek V3/R1满血版等主流大模型推理场景中，单位Token成本较上一代降低约90%。这一突破性进展无疑将为大规模人工智能应用带来更高的效率和更低的成本。

曦望还同步推出了寰望SC3-256超节点方案，专为千亿、万亿级参数的多模态MoE推理场景设计。这一方案的推出，进一步巩固了曦望在高性能计算领域的领先地位。

与此同时，曦望宣布与商汤科技、第四范式等生态伙伴共同发起“百万Token一分钱”推理成本计划，旨在推动行业整体成本的降低。此外，曦望与浙江大学签署了战略合作协议，联合成立“智能计算联合研发中心”，以进一步推动技术研发和创新。

曦望的前身是商汤科技的大芯片部门，该公司不久前宣布在一年内完成了近30亿元的战略融资。根据数据显示，2025年曦望芯片的交付量已突破万片。

此次启望S3的发布，不仅展示了曦望在技术创新方面的实力，也为国内GPU市场注入了新的活力。随着人工智能应用的不断扩展，推理芯片的需求也在快速增长。曦望通过与多家行业巨头的合作，正积极推动推理成本的进一步降低，为更多企业和开发者提供支持。

业内专家指出，启望S3的推出可能会引发国内外市场的广泛关注，并对现有的GPU市场格局产生深远影响。未来，随着技术的不断进步和应用场景的拓展，曦望有望在全球市场上占据更大的份额。

曦望的这一举措不仅是其自身发展的重要一步，也为中国在全球半导体产业链中的地位提升提供了新的可能性。