
智东西
智东西2月25日报谈,当天,阿里推出马年首批新模子——Qwen3.5中型模子系列,包括推出Qwen3.5-122B-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B(Dense)三款开源模子,同期Qwen3.5-Flash(Qwen3.5-35B-A3B坐蓐版块)API已上线阿里云百真金不怕火。
Qwen3.5最新三款中型模子在指示罢免、洽商生级推理、哈佛-MIT数学竞赛级数学、多说话常识、智能体用具使用等
12项能力测评中,在通用推理、数学、智能体、多模态等多个方面,举座推崇可与GPT-5 mini、Claude Sonnet 4.5等国际一流模子相失色。
▲Qwen3.5中型模子系列测评情况
模子也曾发布在成就者圈引起和蔼。多位成就者称这些模子尺寸是土产货推理的绝佳选拔,奖饰其“更小模子终了更强性能”,以致有东谈主称Qwen3.5-35B-A3B有望将其每月破耗从2000欧元(购买Gemini奇迹)降至50欧元,大大从简本钱。
▲酬酢平台X上的网友辩驳
具体来看,其中最受和蔼的Qwen3.5-35B-A3B,性能已卓绝参数范畴大数倍的Qwen3-235B-A22B-2507和Qwen3-VL-235B-A22B。正如一位国外网友所说:“架构+数据质料>原始参数。我一年来一直这样说。”

▲酬酢平台X上的网友辩驳
Qwen3.5-122B-A10B和Qwen3.5-27B进一步松开了中型模子与前沿模子之间的差距,尤其是在复杂智能体场景中推崇隆起。Qwen3.5-Flash是与35B-A3B版块一致的托管坐蓐版块,主打以较快速率提供强性能,每百万Token价钱低至0.2元,默许守旧1M超长荆棘文长度,满足长文档与复杂任务处理需求。
刻下,Qwen Chat上的模子均已更新为Qwen3.5系列,最新四款中型模子也已上线。智东西第一时间对这三款开源模子进行了初步体验,发现这三款中型模子已能满足多种昔日的多模态联接、常识解答、视觉编程等任务,达到匹敌Qwen3-235B-A22B-2507的后果,不外在SVG卡通场景绘图等场景仍有进步空间。

▲四款新模子已上线Qwen Chat
握续迭代的产物力有望让阿里千问占据更大商场。近期,国际商场调研机构沙利文论说败露,2025年下半年,中国企业级大模子日均调用量千问(Qwen)占比32.1%位列第一,相较上半年的17.7%险些翻倍,比较字节豆包(21.3%)、DeepSeek(18.4%)率先上风扩大。
Hugging Face地址:
https://huggingface.co/collections/Qwen/qwen35魔搭社区地址:https://modelscope.cn/collections/Qwen/Qwen35体验地址:https://chat.qwen.ai/一、实测多模态与常识能力出色,小躯壳编程强,SVG生成待进步在智东西的初步体验中,三款模子在多模态联接和常识能力上都后果可以。
比如当我上传一张“公鸡根雕”的图片,三款模子都能够准确识别其为根雕艺术品,能够说明神色和纹理准确识别材料为“崖柏”,能结合中国传统文化解读这一物件的意旨,以致能基于材质、工艺水平、尺寸大小等要素进行价钱评估,评估收尾基本相宜这一畛域的专科水平,令东谈主很惊喜。
如下图所示,Qwen3.5-122B-A10B和Qwen3.5-35B-A3B的输出谜底都基本接近事实,对“这是什么物件,用的什么原材料,有什么寓意,可能值几许钱?”四个问题进行了准确的联接作答。

▲Qwen3.5-122B-A10B生成的谜底
Qwen3.5-27B的输出内容在式样上愈加别出机杼,不仅对几个问题进行了准确回话,还通过图表、格式变化等方式,让内容呈现愈加要点分明,并最终给出了“5000-15000元”较为平直可参考的估价,体现了其“工程实费用高”的特色。

▲Qwen3.5-27B生成的谜底
此后智东西细心磨真金不怕火了Qwen3.5-27B(Dense)的编程能力,让其生成一个“造谣助手个东谈主智能体OpenQwen的官方主页”,并刻薄“该助手可援助编程、办公、购物等各样事务。生成高质料图片算作网站素材,包含智能体头像及功能使用场景演示”等特征。
如下图所示,Qwen3.5-27B能够比较好意思满地生成这一网站的页面,逻辑上基本与指示词刻画契合,展现其以较小参数范畴终明晰较强视觉编程能力的特征。不外比较Qwen3.5-397B-A17B的视觉编程能力,Qwen3.5-27B在视觉元素丰富经过、交互性等方面仍有一些差距。

▲Qwen3.5-27B生成的代码预览情况(部分)

▲Qwen3.5-397B-A17B生成的代码预览情况
而在SVG卡通场景绘图的场景中,智东西条件三款模子输出“阳光沙滩”的SVG卡通图,对尺寸、主题、元素、作风和细节条件具体,三款模子在复杂拘谨下输出的SVG基本结构廓清,但太阳、浪潮、遮阳伞、椰子树等物体的迫临经过仍推崇不及。

▲指示词
Qwen3.5-122B-A10B生成的SVG相对愈加准确,椰子树下的暗影更相宜物理司法,画面的弥散度愈加高。

▲Qwen3.5-122B-A10B生成的SVG

▲Qwen3.5-35B-A3B生成的SVG

▲Qwen3.5-27B生成的SVG
二、35B模子超235B,成就者喜迎降本,催更1B小版块2月16日,阿里崇拜推出原生视觉说话模子Qwen3.5,Qwen3.5系列的第一款模子Qwen3.5-397B-A17B初次以开源权重式样亮相,该模子在推理、编程、智能体能力与多模态联接等全方向基准评估中率先,引起产业和蔼。
只是一周多之后,阿里发布了Qwen3.5系列几款中型模子,进一步在海表里引起成就者的高热接头。
其中最受和蔼确当属领有350亿参数的Qwen3.5-35B-A3B。多位网友称Qwen3.5-35B-A3B打败2350亿参数的Qwen3-235B-A22B-2507是“要点”、“大新闻”。
有网友称:“更小的模子在更低廉的硬件上开动速率更快,同期还能达到以致卓绝大型模子的性能——这才是AI真的的民主化。”还有网友共享:“我刻下在一个容貌上每月要花2000欧元购买Gemini奇迹,要是这是真的,那费用就降到每月50欧元了。”

▲酬酢平台X上的网友辩驳
一位成就者共享了其部署Qwen3.5-35B-A3B的情况,称模子可以跑在16GB的显存机器上,处理32k荆棘文时,每秒处理数能达到60-70个任务;但他也提到,模子吞token的速率惊东谈主,一个短谜题就用了大要6k token,但最终谜底是正确的。

▲酬酢平台X上的网友辩驳
Qwen3.5-27B的模子参数更小,也作念到了“小范畴强性能”。一位网友称:“Qwen3.5-27B型号的得分为怎么此之高?GGUF版块何时发布?”另一位网友也称:“这次发布太棒了!我对27B参数模子十分感酷好,不外以后你们能不可把GGUF模子也和主版块扫数发布?这样用户就能更快地用上这个模子。”


▲酬酢平台X上的网友辩驳
也有网友开启了催更模式。有网友称:“有概念发布微型模子吗?比如1B/3B/7B?”,也有网友喊话:“我但愿翌日几周内也能推出2-4B参数的型号,Qwen3-4B-2507大致是迄今为止性能与体积比最高的型号,我但愿你们能陆续这一传统。”


▲酬酢平台X上的网友辩驳
不外也有网友抒发了更高的期待:“我真搞不懂为什么这张图表(测评图表)里莫得Claude Sonnet 4.6和Opus 4.5这两款在SWE认证评分等诀别高达79.6分和80.6分的机型。”

▲酬酢平台X上的网友辩驳
三、基准测试:122B大而全,35B强在智能体,27B工程实费用高看完本体体验,咱们再回偏执来望望具体的测评获利。从这三款模子的定位来看:
Qwen3.5-122B-A10B是一个相对大而全的模子,详尽能力最强,相对妥贴多模态、视频、多说话场景;
Qwen3.5-35B-A3B的上风聚首在智能体深度能力,适用于智能体策画、深度推理、任务转化,空间智能能力强;
Qwen3.5-27B(Dense)主打轻量化部署,工程实费用高,交互、编程、长文本、数学拔尖。
在常识维度,Qwen3.5-122B-A10B在专科畛域常识与推理(MMLU-Pro)、多说话与多畛域常识(MMLU-Redux)、洽商生级常识与推理(SuperGPQA)三项获得最高分。在指示伴随、长荆棘文处理和STEM推理三大维度,Qwen3.5全系列都获得率先的获利。
在编程能力上,Qwen3.5-27B在SWE-bench Verified(真实软件工程问题科罚能力)中获得最高分,Qwen3.5-122B-A10B在Terminal Bench 2(末端环境下的代码践诺与调试能力)和 FullStackBench en(英文全栈成就能力)中推崇最好。
在通用智能体维度,Qwen3.5系列呈“梯队式上风”,在BFCL-V4(通用智能体用具使用能力)、TAU2-Bench(智能体任务践诺与适配能力)、DeepPlanning(智能体深度策画与逻辑推演能力)等多项测评中获得最好获利。在搜索智能体维度,Qwen3.5-122B-A10B主导英文/汉文浏览检索,Qwen3.5-27B包揽复杂推理与详尽搜索最高分。


在多说话能力维度,Qwen3.5-122B-A10B推崇尤为隆起。在多模态能力维度,其在通用VQA畛域也推崇强势,拿下RealWorldQA(真实寰球场景下的视觉问答能力)、MMStar(多模态详尽联接与推理能力)等四项最高分;Qwen3.5-27B在HallusionBench(多模态幻觉扼制与事实一致性能力)、CharXiv(RQ)(学术文档的联接与检索能力)等评测中推崇最好。
在空间智能方面,Qwen3.5系列终了全维度领跑。在视频联接方面,Qwen3.5-122B-A10B成为本次测评的统管辖跑者,包揽带字幕的视频多模态联接能力、视频与说话结合的跨模态联接能力等6项单项最高分。
聚焦视觉智能体与专科视觉能力,Qwen3.5系列控制视觉智能体与医疗视觉中枢能力:在8项测评中,Qwen3.5系列包揽了6项最高分,仅在桌面系统交互(OSWorld-Verified)上逾期于GPT-5-mini,举座视觉智能体与医疗视觉能力率先。


按照千问研发团队的想路,智能逾越的关节,从来不是堆参数,而是更优架构+更高质料数据+强化学习(RL)的有用协同。
比较于阿里上一代旗舰模子Qwen3,Qwen3.5具有以下增强功能:
谐和视觉说话基础:在多模态标记上进行早期和会教练,终明晰与Qwen3的跨代平等,并在推理、编码、Agent和视觉联接基准测试中优于Qwen3-VL模子。
高效搀杂架构:门控Delta麇集与稀少搀杂大家相结合,可终了高微辞量推理,同期最大遗弃地减少蔓延和本钱支拨。
可彭胀的强化学习泛化:顽强化学习彭胀到百万智能体环境,并徐徐增多任务漫衍的复杂性,以终了弘大的推行寰球安妥性。
公共说话隐敝范围:彭胀守旧201种说话和方言,终了包容性的公共部署,并具备细密入微的文化和区域联接。
下一代教练基础步履:与仅文本教练比较,多模态教练遵循接近100%,异步RL框架守旧大范畴代理支架和环境编排。
结语:企业级大模子商场头部效应初显,产物迭代速率是关节通过这次发布Qwen3.5中型模子系列,阿里试图以“更优架构+更高质料数据+强化学习”,考证了“范畴法例”除外的另一条进化旅途。
三款模子的发布时间距离Qwen3.5-397B-A17B仅一周,诀别切入多模态、智能体深度推理与轻量化部署三大场景,在成就者圈激勉了模子本钱热议,也快速补皆了其产物矩阵。
从商场款式看,Qwen系列在国内企业级商场的日均调用量份额从17.7%跃升至32.1%,进一步拉大率先上风。这次发布通过分层产物矩阵赌钱赚钱app,有望进一步牢固其在企业级商场的头部地位。