低成本模型挑战巨头：仅50美元，研究人员打造出媲美OpenAI o1推理神器

以低成本模型挑战巨头：仅50美元，研究人员打造出媲美OpenAI o1推理神器

随着人工智能技术的飞速发展，越来越多的研究者致力于开发更强大、更灵活的模型。近期，一份研究报告显示，斯坦福大学和华盛顿大学的人工智能研究人员仅花费不到50美元的云计算费用，就成功训练出一个具备“推理”能力的人工智能模型。这一成果引发了业界的广泛关注，让我们对未来的技术发展充满了期待。

这个模型名为s1，其在数学和编程能力测试中的表现与OpenAI的o1和DeepSeek的r1等顶尖推理模型相似。值得一提的是，s1模型及其训练所用的数据和代码已在GitHub上开源，这一举措充分展现了研究人员对公开、共享的追求。

s1模型的训练过程并不复杂，研究人员使用了名为“蒸馏”的技术。该技术旨在通过训练模型来学习另一个人工智能模型的答案，从而提取其“推理”能力。研究人员透露，s1模型是通过对谷歌的推理模型Gemini 2.0 Flash Thinking Experimental进行蒸馏得到的。上个月，加州大学伯克利分校的研究人员也使用了相同的蒸馏方法，以约450美元的成本创建了一个人工智能推理模型。

类似s1模型的诞生，也引发了关于人工智能模型商品化的问题。如果有人可以用相对较低的成本就能复制一个价值数百万美元的模型，那么大型科技公司的“护城河”在哪里呢？这一问题值得深思。

然而，s1的研究团队表示，他们希望找到实现强大推理性能和“测试时扩展”的最简单方法，这些是OpenAI的o1中的一些突破。他们强调，使用一种名为监督微调（SFT）的方法，可以使用相对较小的数据集来蒸馏推理模型。在SFT中，人工智能模型会被明确指示在数据集中模仿某些行为。这种方法相较于DeepSeek用于训练其R1模型的大规模强化学习方法更具成本效益。

尽管s1模型的成功令人瞩目，但其背后的研究人员并未满足于现状。他们选择了一种免费的、小型、现成的免费人工智能模型作为基础，并对其进行了一定程度的修改和优化。为了训练s1，研究人员创建了一个仅包含1000个精心策划的问题的数据集，以及这些问题的答案，以及谷歌Gemini 2.0 Flash Thinking Experimental给出的每个答案背后的“思考”过程。这一过程充分展示了研究人员对数据集的精心策划和细致入微的处理。

在训练完成后，s1在某些人工智能基准测试中取得了良好的表现。参与该项目的斯坦福大学研究员Niklas Muennighoff告诉TechCrunch，目前租用这些计算资源的成本约为20美元。这一成本远低于市场平均水平，使得更多的人能够接触和使用这些高级技术。

为了进一步优化s1的性能，研究人员还使用了一个巧妙的技巧：他们让s1“等待”。在s1的推理过程中添加“等待”一词，有助于模型获得稍微更准确的答案。这一技巧的实施，无疑为人工智能领域带来了新的思考方向。

总的来说，s1模型的诞生无疑为人工智能领域带来了新的可能性。它以低成本实现了强大的推理能力，展示了人工智能技术的无限潜力。这一成果不仅对研究者具有重要意义，也为未来的技术发展指明了方向。我们期待着s1模型在未来能够取得更多的突破性成果，为人类社会带来更多的便利和进步。

本文由「aiuc」编辑整理，文章链接：https://www.aiuc.net/25542

该文观点仅代表作者本人，平台仅提供信息存储空间服务。

低成本模型挑战巨头：仅50美元，研究人员打造出媲美OpenAI o1推理神器

相关推荐

发表回复