Jina Embeddings V4 发布,全球首个多模态、多向量、多语种的开源向量模型

Jina Embeddings V4 发布,全球首个多模态、多向量、多语种的开源向量模型

Jina Embeddings V4 正式发布——一款拥有 38 亿参数的多模态嵌入(embedding)模型。它通过一种全新架构,将文本与图像表示进行了统一,同时支持单向量与多向量的“晚期交互式(late interaction)”嵌入方式,兼顾效率与表达能力。

为了进一步提升模型在不同检索任务中的表现,Jina Embeddings V4 引入了针对任务的低秩适配器(LoRA, Low-Rank Adaptation),可根据场景灵活调优。在全面评测中,Jina Embeddings V4 在单模态与跨模态的多种检索任务上均达到了 SOTA(当前最优)水平,尤其在处理视觉内容密集型数据方面表现出色,例如表格、图表、、结构图、及混合媒体格式等复杂数据结构,准确性与鲁棒性明显优于以往模型。

原创文章,作者:网站编辑,如若转载,请注明出处:https://www.devcn.xin/149.html

(0)
网站编辑的头像网站编辑
上一篇 4小时前
下一篇 4小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注