阿里巴巴开源新一代通义千问模型 Qwen3

AI资讯 410 天前

魔灵

1005 0

阿里巴巴开源新一代通义千问模型 Qwen3

一、Qwen3 开源背景与意义

2025年4月29日凌晨，阿里巴巴正式开源了新一代通义千问模型Qwen3。这一系列模型的开源不仅标志着中国在人工智能领域的一次重大突破，也引发了全球开源社区的广泛关注。Qwen3 的开源旨在推动全球开发者之间的交流与合作，加速技术进步，构建一个充满活力的技术生态圈。

二、Qwen3 的主要功能与特性

• 混合推理模式：Qwen3 是中国公司推出的首个混合推理模型，融合了“推理”和“非推理”模式。用户可以根据问题的复杂程度选择“快思考”或“慢思考”模式，从而在效率和准确性之间取得平衡。

• 多语言支持：Qwen3 支持119种语言和方言，相比前代的29种语言，语言能力大幅提升。这使得Qwen3能够更好地服务于全球用户，满足多样化的语言需求。

• 高效部署与成本控制：Qwen3 的部署成本仅为DeepSeek R1的三分之一。旗舰模型Qwen3-235B-A22B仅需4张H20显卡即可实现本地部署，显存占用仅为性能相近模型的三分之一。这大大降低了企业和开发者的使用门槛。

• 强大的Agent能力：Qwen3 优化了编码和Agent能力，支持MCP协议，能够更好地与外部工具和数据源集成。这使得Qwen3能够更高效地完成复杂任务。

• 大规模数据训练：Qwen3 的预训练数据量达到约36万亿个token，是Qwen2.5的两倍。这为模型提供了更丰富的知识基础，提升了其在各种任务中的表现。

• 多模型选择：Qwen3 系列包括8款不同参数规模的模型，从0.6B到235B。这为不同场景和需求的用户提供了广泛的选择。

三、Qwen3 的性能表现

Qwen3 在多个基准测试中表现出色，例如：

• 在AIME25测试中，Qwen3获得了81.5分，刷新开源纪录。

• 在LiveCodeBench测试中，Qwen3超过70分，表现甚至超过Grok3。

• 在ArenaHard测试中，Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。

四、Qwen3 的开源与应用

Qwen3 系列模型已在Hugging Face、ModelScope和GitHub等平台上开源。全球开发者、研究机构和企业均可免费下载并商用。此外，阿里巴巴还提供了API接入服务，方便开发者将Qwen3集成到自己的应用中。

资讯标签：Qwen3

0 0

版权声明：魔灵发表于 2025-05-05 21:38:24。
转载请注明：阿里巴巴开源新一代通义千问模型 Qwen3 | 快灵

评论[0]条

暂无评论...

阿里巴巴开源新一代通义千问模型 Qwen3

一、Qwen3 开源背景与意义

二、Qwen3 的主要功能与特性

三、Qwen3 的性能表现

四、Qwen3 的开源与应用

o3 深度解读：OpenAI 终于发力 tool use，agent 产品危险了吗？

苹果 Safari 浏览器将引入 AI 搜索功能

相关文章

人形机器人成功登顶海拔6200米火山：基于宇树G1改装目标挑战珠峰

渐冻症患者植入脑机接口2年用意识说出了196万个单词

谷歌DeepMind研究员诺姆沙泽尔将加入OpenAI

消息称阿里将推出“千问输入法”APP

具身智能的“大平行理论”会成真吗？

支持中文：Claude语音模式酝酿升级，新图标暗示通话式AI交互

评论[0]条

阿里巴巴开源新一代通义千问模型 Qwen3

一、Qwen3 开源背景与意义

二、Qwen3 的主要功能与特性

三、Qwen3 的性能表现

四、Qwen3 的开源与应用

o3 深度解读：OpenAI 终于发力 tool use，agent 产品危险了吗？

苹果 Safari 浏览器将引入 AI 搜索功能

相关文章

人形机器人成功登顶海拔6200米火山：基于宇树G1改装 目标挑战珠峰

渐冻症患者植入脑机接口2年 用意识说出了196万个单词

谷歌DeepMind研究员诺姆沙泽尔将加入OpenAI

消息称阿里将推出“千问输入法”APP

具身智能的“大平行理论”会成真吗？

支持中文：Claude语音模式酝酿升级，新图标暗示通话式AI交互

评论[0]条

人形机器人成功登顶海拔6200米火山：基于宇树G1改装目标挑战珠峰

渐冻症患者植入脑机接口2年用意识说出了196万个单词