Snowflake公司最近推出了一个名为 Arctic 嵌入模型家族的开源项目,旨在彻底改变文本嵌入任务,并为各类组织提供尖端的检索能力。这个家族包括不同大小和上下文窗口的模型,以满足多样化的文本嵌入需求。从超小型到大型,这些模型承诺为检索增强生成(RAG)应用提供最先进的性能。
Neeva 是一个无广告和追踪器的搜索引擎,最近被Snowflake收购。Snowflake 的首席执行官 Sridhar Ramaswamy 强调了 Neeva 团队在开发这些新模型中的关键作用。去年 Snowflake 收购 Neeva 的举措,对于将专业知识和创新注入 Arctic嵌入模型家族,提升其至新高度至关重要。
在 Arctic 嵌入模型家族中,最大的模型拥有 3.3 亿参数,在大规模文本嵌入基准(MTEB)检索排行榜上脱颖而出。它在效率和效果上超越了同类产品,平均检索性能超过 55.9。
Snowflake的 Arctic 嵌入模型已经在 Hugging Face 等平台上可用,并且计划整合到 Snowflake Cortex 嵌入功能中。这种可访问性凸显了 Snowflake 致力于使高级 AI 解决方案民主化,并赋予各种规模的组织力量。