阿里巴巴千问3.5-Max-Preview亮相国际大模型竞技场

阿里巴巴旗下的千问大模型家族迎来了新的里程碑。3月20日，作为千问3.5系列的旗舰模型预览版，Qwen3.5-Max-Preview在全球大模型竞技平台LM Arena正式亮相，并获得了1464分的综合得分。这一成绩使阿里千问在LM Arena全球大模型公司排行榜中的排名上升至全球第五位，并成为中国公司中的佼佼者。

据阿里云介绍，LM Arena是由国际开源研究机构LMSYS组织的第三方大模型评测平台。其评测机制采用模型两两匿名对战，由全球开发者进行盲测投票，最终根据胜负结果形成模型分数与排名。由于采用开放式对战与人工评估相结合的方式，该榜单被业界视为当前最具参考价值的大模型性能评测之一。

千问3.5-Max-Preview的亮眼表现

在本次评测中，Qwen3.5-Max-Preview在没有风格控制的绝对胜率比拼中，整体性能排名全球第六。在细分任务层面，该模型的数学能力排名全球第五，专家级文本处理能力排名全球第十。此次亮相也是千问3.5系列首次以旗舰级模型身份参与国际第三方评测。

自除夕以来，阿里千问今年已陆续开源Qwen3.5系列的多款模型，覆盖从0.8B到397B共8种不同参数规模，各尺寸模型均在同参数量级上取得领先性能。其中，Qwen3.5-Plus采用总参数3970亿、激活参数170亿的架构设计，以较小的激活参数实现了优于部分参数量更大模型的性能表现。

LM Arena的评测机制与行业影响

LM Arena的评测机制因其开放性和公正性而备受瞩目。通过全球开发者的盲测投票，评测结果更能反映模型在实际应用中的表现。此种评测方式不仅提高了评测结果的可信度，也为全球大模型公司提供了一个公平竞争的平台。

这种评测机制的成功，也为其他科技公司提供了参考。随着人工智能技术的不断发展，类似的评测平台将成为衡量技术进步的重要标准。

未来展望与行业影响

Qwen3.5-Max-Preview的亮相标志着阿里巴巴在人工智能领域的又一次突破。随着模型的不断优化和迭代，阿里巴巴有望在全球大模型领域占据更重要的地位。

专家指出，随着人工智能技术的快速发展，各大科技公司纷纷加大对大模型的投入。阿里巴巴的这一成就不仅提升了其在国际市场的竞争力，也为中国科技公司在全球舞台上争取了更多话语权。

未来，随着更多大模型的问世，人工智能技术将进一步渗透到各行各业，为社会发展带来深远影响。

推荐阅读月之暗面計劃新一輪融資估值目標達100億美元

Tags: LM Arena, LMSYS, Qwen3.5-Max-Preview, Qwen3.5-Plus, 阿里巴巴

阿里巴巴千问3.5-Max-Preview亮相国际大模型竞技场

千问3.5-Max-Preview的亮眼表现

LM Arena的评测机制与行业影响

未来展望与行业影响

《怪物猎人：世界》Steam 史低促销引发玩家热议

英特尔Nova Lake-S处理器规格曝光：44核设计引领新性能标准

90后遗照修复师坚守手工技艺，拒绝AI技术

中国多部门联合发文：巩固脱贫成果，推动乡村就业振兴

李在明强硬推进战时指挥权收回，韩国军事自主迈出关键一步

韋斯咸與列斯聯英足盃對決：查洛保雲成關鍵人物

台北25歲女子腳痛揭罕見病瀨川氏症確診

骨科研讨会引入用户参与：科技赋能支具创新

2025全球最佳大学排名揭晓：美国13所高校跻身前20

美光2000亿美元投资推动芯片回流政策

中国多部门联合发文：巩固脱贫成果，推动乡村就业振兴

美国制裁中国公司及个人涉网络攻击基础设施

人权观察揭露全球汽车制造商铝供应链中的强迫劳动问题

中国多部门联合发文：巩固脱贫成果，推动乡村就业振兴

李在明强硬推进战时指挥权收回，韩国军事自主迈出关键一步

韋斯咸與列斯聯英足盃對決：查洛保雲成關鍵人物

台北25歲女子腳痛揭罕見病瀨川氏症確診

骨科研讨会引入用户参与：科技赋能支具创新

中国多部门联合发文：巩固脱贫成果，推动乡村就业振兴

李在明强硬推进战时指挥权收回，韩国军事自主迈出关键一步

韋斯咸與列斯聯英足盃對決：查洛保雲成關鍵人物

台北25歲女子腳痛揭罕見病瀨川氏症確診

骨科研讨会引入用户参与：科技赋能支具创新

千问3.5-Max-Preview的亮眼表现

LM Arena的评测机制与行业影响

未来展望与行业影响

More Stories

You may have missed