1 10 月, 2025

DeepSeek发布新模型 大幅降低API调用成本

deepseek-api-

9月29日,DeepSeek正式发布了其最新实验性模型DeepSeek-V3.2-Exp,宣布API调用成本降低超过50%。这一消息引发了业内的广泛关注,尤其是在科技博客圈中,此前DeepSeek-V3.2模型曾短暂出现在HuggingFace官方页面,随后被删除,直到现在正式发布。

据DeepSeek介绍,V3.2-Exp模型是迈向新一代架构的重要中间步骤,基于V3.1-Terminus引入了一种名为DeepSeek Sparse Attention(DSA)的稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化和验证。目前,DeepSeek的官方App、网页端及小程序均已更新至该版本,API价格也相应下调。

稀疏注意力机制的突破

DeepSeek Sparse Attention首次实现了细粒度的稀疏注意力机制,在几乎不影响模型输出效果的前提下,大幅提升了长文本训练和推理的效率。为了严谨评估这一机制的影响,DeepSeek将V3.2-Exp的训练设置与V3.1-Terminus进行了严格对齐。在各领域的公开评测集上,V3.2-Exp的表现与V3.1-Terminus基本持平。

在新模型的研究过程中,DeepSeek设计并实现了许多新的GPU算子,使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。此次开源的主要算子包含TileLang与CUDA两种版本。

API价格大幅下调

得益于新模型服务成本的降低,DeepSeek宣布API价格大幅下调,开发者调用DeepSeek API的成本将降低50%以上。具体来说,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens。

“输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens。”

行业背景与竞争

除了DeepSeek,国内另一大模型厂商智谱也即将发布其新一代旗舰模型GLM-4.6。目前在Z.ai官网上,GLM-4.5被标识为上一代旗舰模型。这一竞争态势显示出国内AI模型领域的激烈竞争。

值得一提的是,9月18日,DeepSeek创始人梁文锋带着DeepSeek-R1的研究,登上了国际顶级期刊《自然》(Nature)的封面。今年1月,DeepSeek在预印本平台arxiv上公布了论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,这项研究揭示了如何在极少人工输入下训练一个能够进行推理的模型。

未来展望

《自然》杂志指出,如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但对人工智能而言是极大的挑战。DeepSeek通过强化学习的方式训练其模型,使其在正确解答数学问题时获得奖励,答错则受到惩罚。

随着DeepSeek-V3.2-Exp的发布及API价格的下调,DeepSeek在AI模型领域的影响力有望进一步扩大。未来,随着技术的不断进步,DeepSeek或将在更广泛的应用场景中展示其模型的优势。

推荐阅读  苹果首款可折叠iPhone屏幕细节曝光:7.8英寸内屏+5.5英寸外屏