Q*项目公开发布！研究团队并非OpenAI(团队研究项目公开发布)「项目研究团队介绍」

文章目录 [+]

量子位 | 公众号 QbitAI

Q项目公开发布，可让小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力。

自去年11月伴随着OpenAI内讧，其神秘Q项目被爆出后，业内对OpenAI Q的讨论和猜测就没停过，而OpenAI这边一直避而不谈。

（图片来自网络侵删）

在当时，一些人就从名字猜测Q可能与Q-Learning有关，例如Meta科学家田渊栋提出Q可能是Q-learning和A的结合：

而现在，一项名为Q的项目突然公开发布，而且真的和Q-Learning、A有关。

不过，研究团队并非OpenAI，更不是DeepMind（相传，OpenAI的Q项目前身是GPT-Zero，由Ilya Sutskever发起，名字致敬了DeepMind的Alpha-Zero）。

而是来自国内昆仑万维颜水成团队与新加坡南洋理工大学的一项新工作。

团队表示，希望Q算法能够打破OpenAI的封锁，提升现有开源模型的推理能力。
实验中，Q算法的表现也很给力：

在GSM8K数据集上，Q帮助Llama-2-7b提升至80.8%的准确率，超越了ChatGPT；在MATH数据集上，Q帮助DeepSeek-Math-7b提升至55.4%的准确率，超越了Gemini Ultra；在MBPP数据集上，Q帮助CodeQwen1.5-7b-Chat提升至77.0%的准确率，缩小了与GPT-4的编程水平差距。

网友看到这项工作后一时间炸开了锅，研究命名无疑成为了讨论的一大焦点，网友的评论却很一致：

这就是Q。

虽然不是那个Q，但却是真正的Q：

谁让OpenAI至今不发布任何名为Q的工作：

抛开命名，从研究本身来讲，有网友看过论文后感叹这项研究真不简单：

越思考，就越觉得Q的这个方法是正确的。

甚至有网友认为有种AGI的感觉：

那么，Q到底长啥样？

复杂推理任务全盘规划

最后利用A搜索算法对状态进行最佳优先搜索，实现了对复杂推理任务的全盘规划，从而提升开源模型在推理任务上的性能。

随后，研究团队通过一系列实验，证实了Q框架可以显著提升LLM的推理能力。

如开头所述，在GSM8K数据集上，Q帮助Llama-2-7b提升至80.8%的准确率，超越了ChatGPT；在MATH数据集上，Q帮助DeepSeek-Math-7b提升至55.4%的准确率，超越了Gemini Ultra; 在MBPP数据集上，Q帮助CodeQwen1.5-7b-Chat提升至77.0%的准确率，缩小了与GPT-4的编程水平差距。

具体结果见下图：

Q能够帮助参数量仅为7b的小模型达到参数量比其大数十倍甚至百倍模型的推理能力，大幅提升模型的性能，并显著降低了计算资源的需求。

不过，昆仑万维团队也表示，Q的研究尚在初级阶段，算法在各个环节还有进一步的改进空间。

未来，会继续深入此项研究，不断提升国产开源模型推理能力，打破OpenAI闭源封锁，为AI前沿技术发展带来全新可能。

更多细节，感兴趣的家人们可以查看原论文～

论文链接：https://arxiv.org/abs/2406.14283

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

标签：准确率推理

Q*项目公开发布！研究团队并非OpenAI(团队研究项目公开发布)「项目研究团队介绍」

相关文章

色标与代码色标色彩在信息传递中的重要作用，色标法的色码含义。

详细剖析JSP删除代码技术与实际应用，jsp删除页面代码。

色彩的力量颜色代码对人类心理的深远影响，色彩代码表。

详细剖析OpenStack开源云平台的创新与方法，详细剖析openstack开源云平台的创新与方法研究。

色彩密码三位数字背后的无尽魅力，三位数颜色代码。

舱位代码“a”航空业中的神秘符号，什么是舱位代码。

热门文章

标签列表