智源发布全球最大中英文语义向量模型训练数据集 MTP

[db:摘要]

智源研究院发布了全球最大的中英文语义向量模型训练数据集 MTP,数据规模达 3 亿对。该数据集包含来自不同来源的中英文文本对,为训练中英文语义向量模型提供了重要基础。智源研究院表示,数据对大模型训练起着至关重要的作用,并将推动人工智能协同创新。该数据集的发布有望解决中文模型训练数据集缺乏的问题。

本文由「aiuc」编辑整理,文章链接:https://www.aiuc.net/23400

该文观点仅代表作者本人,平台仅提供信息存储空间服务。

(0)
aiucaiuc
上一篇 2023年9月18日
下一篇 2023年9月18日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注