化工仪器网手机版
移动端访问更便捷全新开源通义千问Qwen3,融合推理与非推理模式的最新模型来了
2025年07月28日 08:38:18
来源:化工仪器网 点击量:195

除了数学和代码能力,新模型在通用能力上也实现了飞跃。
Qwen3是通义千问系列的最新模型,融合推理与非推理模式,兼具QwQ和Instruct模型能力。提供多种尺寸,包括235B-A22B、30B-A3B及六个Dense模型,大幅提升数学、代码、逻辑推理和对话能力,达到业界领先水平。旗舰模型Qwen3-235B-A22B在多场景测试中表现优异,小型模型如Qwen3-4B性能媲美大模型。
Qwen3有效融合推理模式和非推理模式,一个模型同时兼具之前QwQ模型(推理模式,用于数学、代码、逻辑推理等场景)和instruct模型(非推理模式,通用对话等场景)的回复能力。
除了数学和代码能力,新模型在通用能力上也实现了飞跃。在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等评测中,Qwen3-30B-A3B-Thinking-2507均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。这意味着,无论是撰写文章、进行多轮对话,还是处理多语言任务,新模型都能表现得更加出色。
超多尺寸:两款MOE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参数)、Qwen3-30B-A3B(300亿总参数、30亿激活参数),以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B。
推理能力大幅提升:在数学、代码和逻辑推理等评测中,显著超过QwQ(推理模式)和Qwen2.5-Plus-Instruct(非推理模式),达到同规模业界SOTA水平。
模型人类偏好能力显著增强:创意写作、角色扮演、多轮对话、指令遵循能力均有明显提升,用户体验预期明显更佳,通用能力显著超过Qwen2.5-Plus-Instruct。
Agent能力显著增强:在上述两种模式下都达到目前业界领先水平,能够实现精准的外部工具调用。
相关阅读 Related Reading
查看更多+-
根据吉林省委、省政府关于科技创新的重大决策部署,吉林省科技厅现发布《吉林省科技发展计划2026年度项目申报工作有关事项通知》。2025-08-04 12:00:11
-
日前,经榜单凝练、项目申报、专家评审、会议审议等程序,湖南省科学技术厅拟对湖南农业大学牵头的“秸秆高效利用关键技术研发及应用示范”...2025-08-04 10:26:52
-
湖南科技大学的教学科研仪器(海洋、机电、资安及材料)项目预算2251万元,政府采购计划编号为湘财采计[2025]002064号。2025-08-04 09:12:35
-
8月2日,中国探月工程发布关于发放国内第九批月球科研样品的公告。2025-07-28 08:37:25
-
富满油田位于号称“死亡之?!钡乃死旮缮衬沟?,是我国目前油气资源量最大的超深油田。2025-07-28 08:37:08
-
项目申请人可以进入国家自然科学基金委的项目信息管理系统查询。2025-07-28 08:37:50
版权与免责声明
- ①凡本网注明“来源:化工仪器网”的所有作品,均为浙江兴旺宝明通网络有限公司-化工仪器网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其他方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:化工仪器网”。违反上述声明者,本网将追究其相关法律责任。
- ②本网转载并注明自其他来源(非化工仪器网)的作品,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。
- ③如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。