优德266 阿里最新开源推理模子发布：性能并列DeepSeek-R1

发布日期：2025-03-16 16:18 点击次数：113

阿里通义发布最新开源推理模子优德266，称其性能并列DeepSeek-R1。

3月6日凌晨，阿里巴巴认真发布最新的开源推理模子通义千问QwQ-32B。据先容，通过大领域强化学习，千问QwQ-32B在数学、代码及通用才略上收场质的飞跃，举座性能并列DeepSeek-R1，同期大幅缩小了部署使用资本，在消费级显卡上也能收场土产货部署。QwQ-32B选择了Apache 2.0开源左券，当今，通盘东说念主齐可免费下载及商用QwQ-32B模子，或通过网页版Qwen Chat进行体验，该模子也将免费上架通义APP。

阿里通义团队暗示，QwQ-32B模子领有320亿参数，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1比好意思。在冷运转的基础上，模子针对数学和编程任务、通用才略分手进行了两轮大领域强化学习，在32B的模子尺寸上得到了令东说念主惊喜的推理才略进步，印证了大领域强化学习可显耀提高模子性能。

此外，QwQ-32B模子中还集成了与智能体（Agent）臆度的才略，使其粗略在使用器用的同期进行批判性念念考，并凭证环境响应退换推理经由。

千问QwQ-32B既能提供极强的推理才略，又能得志更低的资源耗尽需求，这背后的奥妙便在于强化学习（Reinforcement Learning）。阿里通义团队暗示：“咱们但愿，咱们的少许奋勉粗略证明宏大的基础模子重复大领域强化学习也许是一条通往通用东说念主工智能（AGI）的可行之路。”

在一系列泰斗基准测试中，千问QwQ-32B模子齐发扬出色，险些完满卓绝了OpenAI客岁9月发布的尺寸左近的o1-mini模子，并列最强开源推理模子DeepSeek-R1：在测试数学才略的AIME24评测集上，以及评估代码才略的LiveCodeBench中，千问QwQ-32B发扬与DeepSeek-R1相当，远胜于o1-mini及相易尺寸的R1蒸馏模子。

QwQ-32B模子和R1、OpenAI-o1-mini等知名模子的评分比拟。开头：阿里通义

阿里通义团队暗示，改日将延续探索将智能体与强化学习的集成，以收场万古推理，探索更高智能进而最终收场AGI的缱绻。

3月6日早盘，阿里巴巴集团（09988.HK）港股大幅高开涨超6%，戒指午盘涨超7%。

此前，2月25日，阿里通义Qwen发布基于旗舰模子Qwen2.5-Max构建的推理模子QwQ-Max-Preview预览版，缓助联网搜索，会和DeepSeek以及Kimi的推理模子同样展现念念考经由优德266，当今用户可在通义千问网页版进行体验。

优德266 阿里最新开源推理模子发布：性能并列DeepSeek-R1

热点资讯