9 10 月, 2025

IBM 发布 Granite 4.0 系列模型,混合架构大幅降低内存需求

ibm-granite-4-0-

IT之家 10 月 4 日消息,IBM 于当地时间 10 月 2 日宣布推出 Granite 4.0 系列企业级大语言模型(LLM)。新一代模型采用 Mamba-Transformer 混合架构,能够在不牺牲性能的前提下大幅降低内存需求,从而降低推理部署的成本。

Granite 4.0 系列模型的首发型号包括 Small、Tiny、Micro 规模的标准和指令变体。根据 IBM 的计划,未来其他参数规模版本和推理变体将在 2025 年底推出。IBM 表示,这种混合架构的设计能在长输入和多并发场景下减少 70% 的内存需求。

混合架构的创新与优势

Granite 4.0 的发布标志着 IBM 在人工智能领域的又一重大进展。Mamba-Transformer 混合架构的引入,使得即便是最小的 Granite 4.0 模型在基准测试中也明显优于其前代产品 Granite 3.3 8B。特别是 Granite-4.0-H-Small 模型,以较小的参数规模取得了开源模型中一流的表现。

IBM 的技术负责人指出,“这种架构不仅在性能上有显著提升,更重要的是它在资源利用率方面的优化。” 这意味着企业可以在降低硬件投入的同时,享受到更为强大的计算能力。

开源战略与行业影响

IBM 选择以标准 Apache 2.0 许可开源 Granite 4.0 系列模型,这一举措使得这些模型更易于被开发者和企业采用和改进。该系列模型已获得 ISO 42001 认证,并经过加密签名,确保了其在安全性和合规性方面的高标准。

行业分析师认为,IBM 的开源策略不仅能够促进技术的广泛应用,还可能引发其他科技巨头在开源领域的跟进。“这是一种双赢的局面,既能推动技术进步,也能增强企业的市场竞争力,” 一位业内专家评论道。

未来展望与市场竞争

随着 Granite 4.0 的推出,IBM 在大语言模型领域的竞争力得以进一步提升。未来,随着更多变体的发布,IBM 有望在市场上占据更大的份额。然而,面对谷歌、微软等竞争对手的强劲挑战,IBM 仍需不断创新,以保持其技术领先地位。

据悉,IBM 计划在未来几年内继续加大对人工智能技术的投资,尤其是在模型优化和节能方面。“我们相信,技术的进步将为各行各业带来深远的影响,” IBM 的一位高管表示。

总之,Granite 4.0 系列模型的发布不仅代表了技术的进步,也为企业在人工智能应用中提供了更多选择。随着技术的不断演进,未来的人工智能应用场景将更加广阔和多样化。

推荐阅读  OpenAI CEO 萨姆・奥尔特曼:AI 时代的辍学创业机遇