RAG 检索算法:TF-IDF 和 BM25

推荐算法机器学习数据库

TF-IDF和BM25是信息检索中常用的技术。 TF代表 Term-FrequencyIDF代表 Inverse Document FrequencyBM代表 Best Match。BM后的数字 25表示BM算法的迭代次数 。它经过了25次迭代才被广泛采用和接受,尽管我们有BM25+和其他变体。

在深入讨论之前,让我们记住,所有这些都是用于检索最“匹配”用户查询的信息的排名算法

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
云原生环境下的日志采集存储分析实践
云原生场景下,日志数据的规模和种类剧增,日志采集、加工、分析的多样性也大大增加。面对这些挑战,火山引擎基于超大规模下的 Kubernetes 日志实践孵化出了一套完整的日志采集、加工、查询、分析、消费的平台。本次主要分享了火山引擎云原生日志平台的相关实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论