智源研究院发布代码生成训练数据集 TACO

[db:摘要]

智源研究院发布了名为 TACO 的代码生成训练集,旨在为代码生成模型提供更具挑战性的训练数据和评测基准。TACO 在数据规模、质量和评测方案上具有优势,包括更大规模的训练集和测试集,多样化的解题答案,以及细粒度的标签。实验结果显示,当前流行的代码生成模型在 TACO 评测中与 GPT-4 存在显著差异,说明该领域仍有提升空间。TACO 不仅是一个挑战性的测试方法,还可用作改进模型性能的训练数据,促进代码生成领域的发展。

本文由「aiuc」编辑整理,文章链接:https://www.aiuc.net/21782

该文观点仅代表作者本人,平台仅提供信息存储空间服务。

(0)
aiucaiuc
上一篇 2023年12月25日
下一篇 2023年12月25日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注