多模态大型语言模型
-
上海AI实验室开源InternVL3系列多模态大型语言模型
[db:摘要]
-
阿里巴巴达摩院推出电商场景多模态大模型Valley 2
[db:摘要]
-
清华大学、腾讯联合推全开源多模态架构Oryx 支持超长视频输入
[db:摘要]
-
Apple 旨在利用 UI-JEPA 模型来理解设备上的用户意图
[db:摘要]
-
NVIDIA推全新视觉语音模型NVEagle,可以看图跟你聊天
[db:摘要]
-
清华与北大合作发布长视频理解基准测试:LVBench
[db:摘要]