苹果和哥伦比亚大学联手开发Ferret多模态语言模型

[db:摘要]

苹果和哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型,旨在实现高级图像理解和描述。该模型拥有强大的全局理解能力,可以同时处理自由文本和引用区域,性能优于传统模型。研究人员创建了GRIT数据集,用于指导模型训练,并评估Ferret在多项任务中的性能,表现出引用和定位能力,有望在人机交互、智能搜索等领域取得重大突破。

本文由「aiuc」编辑整理,文章链接:https://www.aiuc.net/22700

该文观点仅代表作者本人,平台仅提供信息存储空间服务。

(0)
aiucaiuc
上一篇 2023年10月30日
下一篇 2023年10月30日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注