Published
- 2 min read
[AI]QwQ-32B:32b小参数推理新星,媲美尖端模型

QwQ-32B:320亿参数推理新星,媲美尖端模型
昨天,千问团队发布 QwQ-32B,这是一款全新的推理模型,它拥有 320 亿个参数,性能足以媲美 DeepSeek-R1 等尖端推理模型。
-
博客文章 📰 深入了解 QwQ-32B 背后的技术细节与设计理念。
-
Hugging Face 模型 🤗 在 Hugging Face 上获取 QwQ-32B 模型。
-
ModelScope 模型 📦 在 ModelScope 社区找到 QwQ-32B 模型。
-
Demo 演示 🚀 亲自体验QwQ-32B的强大功能
-
Qwen Chat 💬 直接与Qwen模型进行对话交流。
强化学习驱动性能飞跃
本次,千问团队深入探索了扩展强化学习(RL)的方法,并在 Qwen2.5-32B 的基础上取得了显著成果。研究表明,RL 训练能够持续提升模型性能,特别是在数学和编程方面。更令人振奋的是,持续扩展 RL 可以帮助中等规模的模型达到与大型 MoE 模型相媲美的性能。
最新动态:价格更新 & OpenRouter 上线
价格更新:
OpenRouter 上线,免费体验: QwQ-32B 已在 OpenRouter 上线,现在可以免费体验。