4 4 月, 2026

阿里巴巴千问3.5-Max-Preview亮相国际大模型竞技场

3-5-max-preview-

阿里巴巴旗下的千问大模型家族迎来了新的里程碑。3月20日,作为千问3.5系列的旗舰模型预览版,Qwen3.5-Max-Preview在全球大模型竞技平台LM Arena正式亮相,并获得了1464分的综合得分。这一成绩使阿里千问在LM Arena全球大模型公司排行榜中的排名上升至全球第五位,并成为中国公司中的佼佼者。

据阿里云介绍,LM Arena是由国际开源研究机构LMSYS组织的第三方大模型评测平台。其评测机制采用模型两两匿名对战,由全球开发者进行盲测投票,最终根据胜负结果形成模型分数与排名。由于采用开放式对战与人工评估相结合的方式,该榜单被业界视为当前最具参考价值的大模型性能评测之一。

千问3.5-Max-Preview的亮眼表现

在本次评测中,Qwen3.5-Max-Preview在没有风格控制的绝对胜率比拼中,整体性能排名全球第六。在细分任务层面,该模型的数学能力排名全球第五,专家级文本处理能力排名全球第十。此次亮相也是千问3.5系列首次以旗舰级模型身份参与国际第三方评测。

自除夕以来,阿里千问今年已陆续开源Qwen3.5系列的多款模型,覆盖从0.8B到397B共8种不同参数规模,各尺寸模型均在同参数量级上取得领先性能。其中,Qwen3.5-Plus采用总参数3970亿、激活参数170亿的架构设计,以较小的激活参数实现了优于部分参数量更大模型的性能表现。

LM Arena的评测机制与行业影响

LM Arena的评测机制因其开放性和公正性而备受瞩目。通过全球开发者的盲测投票,评测结果更能反映模型在实际应用中的表现。此种评测方式不仅提高了评测结果的可信度,也为全球大模型公司提供了一个公平竞争的平台。

这种评测机制的成功,也为其他科技公司提供了参考。随着人工智能技术的不断发展,类似的评测平台将成为衡量技术进步的重要标准。

未来展望与行业影响

Qwen3.5-Max-Preview的亮相标志着阿里巴巴在人工智能领域的又一次突破。随着模型的不断优化和迭代,阿里巴巴有望在全球大模型领域占据更重要的地位。

专家指出,随着人工智能技术的快速发展,各大科技公司纷纷加大对大模型的投入。阿里巴巴的这一成就不仅提升了其在国际市场的竞争力,也为中国科技公司在全球舞台上争取了更多话语权。

未来,随着更多大模型的问世,人工智能技术将进一步渗透到各行各业,为社会发展带来深远影响。

推荐阅读  月之暗面計劃新一輪融資 估值目標達100億美元