博查推出Rerank模型,升级RAG及企业搜索

Ava的硅谷新视界 4个月前 (12-20) 阅读数 3 #推荐

博查公司近日发布了其最新的基础模型——Rerank模型 Bocha Semantic Reranker,专为提升企业搜索和检索增强生成(RAG)系统而设计。该模型兼容任何数据库或搜索索引,并且可以轻松插入到任何具有原生搜索功能的旧版应用程序中。仅需一行代码,Bocha Semantic Reranker便能显著提升搜索性能或降低运行RAG应用的成本,同时对延迟的影响微乎其微。

划重点

Bocha Semantic Reranker 以 80M 参数实现接近于世界一线 280M、560M参数模型的排序效果。

- 由于模型参数比同类模型小3~6倍,推理速度更快、成本更低、性价比更高。

- 基于博查搜索引擎的技术积累,排序效果在搜索场景表现更好。

- 提供官方API,国内用户无需自行部署模型,可以直接通过调用,免去推理服务器和维护成本。

博查Rerank模型的评分原理

博查语义排序模型的评分过程是基于查询语句(用户的输入问题)以及与之匹配的文档内容(通常是最高512个tokens的文本)进行的。评分的过程如下:

1. 评估语义相关性:bocha-semantic-reranker会评估查询语句与每个文档的语义相关性,判断文档是否能够有效回答用户的查询或与查询意图高度匹配。

2. 分配@BochaSemanticRerankScore:根据语义相关性,bocha-semantic-reranker为每个文档分配一个rerankScore,分数的范围从0到1。分数越高,表示文档与查询的语义相关性越强,越符合用户需求。通常,分数接近1表示高度相关,分数接近0表示不相关或低相关。

博查Rerank模型的BEIR Benchmark

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Ava的硅谷新视界

Ava的硅谷新视界

我是Ava,带你发现最前沿的AI创新和科技趋势