RAG 检索算法:TF-IDF 和 BM25

推荐算法机器学习数据库

TF-IDF和BM25是信息检索中常用的技术。 TF代表 Term-FrequencyIDF代表 Inverse Document FrequencyBM代表 Best Match。BM后的数字 25表示BM算法的迭代次数 。它经过了25次迭代才被广泛采用和接受,尽管我们有BM25+和其他变体。

在深入讨论之前,让我们记住,所有这些都是用于检索最“匹配”用户查询的信息的排名算法

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
CloudWeGo白皮书:字节跳动云原生微服务架构原理与开源实践
本书总结了字节跳动自2018年以来的微服务架构演进之路
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论