在当今的数字时代,企业数据的复杂性日益增加,包括电子邮件、发票、简历、支持票据、日志和表格等。这些数据如同一个巨大的未被充分挖掘的宝藏,其中蕴含着宝贵的信息。然而,传统的搜索方法往往难以充分发挥其潜力,因为这些数据通常涉及多个概念和关系,使得检索变得困难。
传统的搜索方法要求开发者创建一个复杂的分类层,这个层级能够识别和匹配搜索查询中的特定方面到指定的文档字段。这是一个繁琐的过程,仅限于分类器能够理解的预定义值。即使是现有的嵌入模型,如Cohere Embed v3,也有其局限性。它们将文档转换为语义空间中的单个向量。这对于专注于单一属性的数据来说效果很好,但在处理多方面数据时,情况就变得复杂了。
例如,如果搜索“红色T恤”返回了“蓝色和黄色牛仔裤”由于共享颜色嵌入,那么它就失去了相关性。Cohere Compass通过将数据转换为一种特殊格式,促进了精确搜索。
Cohere Compass旨在打破这些障碍。它使用户能够轻松地搜索他们的多方面数据。以下是它的工作原理:
无需复杂转换即可轻松处理数据:只需将数据作为JSON文档输入到Compass中。该模型将其转换为一种特殊格式,准备存储在向量数据库中。
捕捉细微差别:Compass超越了单一向量。它捕获多方面表示,保留了数据中各种概念之间的关系。
简化工作流程:忘掉复杂的解析。Compass SDK处理所有细节,将数据转换为JSON格式,实现无缝嵌入。