RAG 检索算法:TF-IDF 和 BM25

推荐算法机器学习数据库

TF-IDF和BM25是信息检索中常用的技术。 TF代表 Term-FrequencyIDF代表 Inverse Document FrequencyBM代表 Best Match。BM后的数字 25表示BM算法的迭代次数 。它经过了25次迭代才被广泛采用和接受,尽管我们有BM25+和其他变体。

在深入讨论之前,让我们记住,所有这些都是用于检索最“匹配”用户查询的信息的排名算法

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动云原生降本增效实践
本次分享主要介绍字节跳动如何利用云原生技术不断提升资源利用效率,降低基础设施成本;并重点分享字节跳动云原生团队在构建超大规模云原生系统过程中遇到的问题和相关解决方案,以及过程中回馈社区和客户的一系列开源项目和产品。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论