4.9K Star!开源 AI 搜索引擎本地搭建,全程免费,邀你围观体验

picture.image

猴哥的第 120 期分享,欢迎追看

为了让 AI 零距离触达到更多朋友,前段时间,搞了个微信 AI 小助理-小爱(AI)

随着小爱(AI)的不断迭代,大家也更愿意跟他互动了。

小爱(AI)的底层大模型来自下面这篇文章:

当然,所有大模型都免不了一个通病:没见过的问题,通通一本正经地胡说八道

比如下面这位朋友问它:

picture.image

picture.image

原因无它,大模型没有外界信息输入!

怎么搞?

接入搜索能力呗~

今日分享,带大家实操一个丝滑的 AI搜索引擎解决方案 - MindSearch,全程免费,欢迎白嫖。

  1. MindSearch 是什么

和 Perplexity.ai Pro / SearchGPT 等闭源AI 搜索引擎框架不同,MindSearch 是开源的,基于搜索引擎返回的结果来回答你的问题,从而让大模型不再胡说八道!

其核心逻辑是:采用多智能体框架来模拟人类思维过程,包括两个关键组件:WebPlanner(计划者 )和 WebSearcher(执行者 )。

  • WebPlanner 将用户的问题分解,并构建有向无环图(DAG)来引导搜索;
  • WebSearcher 则从互联网上检索并筛选有价值的信息给到 WebPlanner;
  • WebPlanner 最终给出结论。

picture.image

既然这么强,必须本地搭起来试试!

有朋友说,本地配置环境实在太麻烦,更别说部署大模型了,分分钟 C 盘爆满!

那,强烈推荐你试试免费开发机-GitHub CodeSpace ,不过国内访问,偶尔需备梯子!

  1. GitHub CodeSpace 初体验

CodeSpace 主页:https://github.com/codespaces

进来后,选择一个空白模板就行:

picture.image

免费的配置是 2C 8G RAM + 32G 磁盘,每个月可使用 60 小时,跑个 Demo,妥妥够用了。

picture.image

进来后,和你本地使用 VS code 毫无区别,随开随用,磁盘永久保存。

picture.image

  1. MindSearch 部署实战

3.1 环境准备

首先准备 MindSearch 环境:

  
git clone https://github.com/InternLM/MindSearch.git  
conda create -n mindsearch python=3.10 -y  
conda activate mindsearch  
cd MindSearch  
pip install -r requirements.txt  

MindSearch 底层大模型支持本地部署和云端 API,推荐大家使用硅基流动提供的免费 InternLM2.5-7B-Chat 服务。

picture.image

所以先去 硅基流动官网 申请一个 Key,下面会用到。

3.2 启动后端服务

把刚才申请的 key 放到环境变量中,一键启动后端服务:

  
export SILICON_API_KEY=xxx  
python -m mindsearch.app --lang cn --model_format internlm_silicon --search_engine DuckDuckGoSearch  

默认启动在 8002 端口:

picture.image

3.3 启动前端页面

官方仓库中提供了 3 种前端实现,这里我们以 Gradio 为例,重新打开一个终端:

  
conda activate mindsearch  
python frontend/mindsearch_gradio.py  

如果你是在 codespace 中部署,它会提示你打开 gradio 提供的 public url,是不是很友好?

picture.image

当然,网页端的 vscode 还会自动进行端口转发,因此你可以看到下图的前端地址:

picture.image

上面两个任意一个点开,就可以看到 Gradio 启动的前端界面。

还是前文的那个问题:请分析今天娱乐圈有什么瓜

picture.image

首先,WebPlanner 会构建搜索图,并添加子节点开启搜索功能:

picture.image

WebSearcher 会调用搜索引擎获取相关内容,并返回:

picture.image

最后,WebPlanner 会基于搜索内容,进行汇总回答:

picture.image

中间结果给大家展示一下:

  
今天娱乐圈的热门话题和事件主要集中在以下几个方面:  
  
1. **萧敬腾与妻子的婚礼**:  
   37岁的金曲歌王萧敬腾与年长14岁的经纪人妻子林有慧在1013日举行了婚礼。这场婚礼的亮点之一是新娘头纱上绣了两只已逝世的流浪猫狗,白灰和弟弟,象征着对动物的爱心和对生命的尊重[[0]]2. **秦岚与魏大勋分手传闻**:  
   近日有狗仔爆出秦岚和魏大勋这对姐弟恋的情侣已经分手的消息。这一消息引发了网友的热烈讨论,许多人猜测他们分手的原因可能与魏大勋求婚被拒有关[[1]]3. **范晓萱惊喜现身萧敬腾婚禮**:  
   久未露面的“音乐小魔女”范晓萱以一头的绿色长发出现在萧敬腾的婚禮上,并登台演唱了60年代的老歌《Dream a Little Dream of Me》,引起了广泛关注[[2]]4. **郭雪芙海外游学收获恋情**:  
   女星郭雪芙在海外游学期间收获了一段恋情,被目击到十指紧扣一位斯文洋男出行。尽管她没有正面回应绯闻,但这一消息仍然引发了媒体和粉丝的关注[[3]]5. **微博热搜榜热门话题**:  
   根据微博热搜榜的信息(如网页678),今天的娱乐热点包括檀健次戴头纱、黄晓明自曝增肥30斤等话题。这些内容展示了娱乐圈内艺人的最新动态和生活状态变化[[6]][[7]][[8]]。  
  
综上所述,今天娱乐圈的热门话题涵盖了艺人的个人生活事件、明星之间的传闻以及社交媒体上的热门讨论点等各个方面。这些信息不仅反映了艺人的日常生活状态变化,也展示了公众对他们生活的高度关注度和社会影响力的大小  

如果只是自己玩,看到这里就够了。

下面,我们将把这个功能接入到微信机器人-小爱(AI)

  1. 接入小爱

注意:服务端部署,因为需大量请求搜索引擎,所以对网络带宽有一定要求哦。

微信前端,无需中间过程的冗余信息,因此只需返回最终的结论即可。

后端,如果用户输入中,添加触发词搜索,则调用 AI搜索引擎 进行回答:

  
if '搜索' in content:  
   bot_answer = generate_search_result(content.replace('搜索', ''))  

截取部分日志给大家看下:

picture.image

可以发现,对问题的理解还是相当到位的~

  1. 效果展示

最后,让我们 @小爱 试试看,记得添加触发词 搜索,否则它无法识别你的搜索意图哦。

picture.image

picture.image

写在最后

本文介绍了 MindSearch 的本地部署,带大家实操了 AI搜索引擎 的实现流程。

有了它,还担心大模型胡说八道?

如果对你有帮助,不妨点赞收藏 备用。


为方便大家交流,新建了一个 AI 交流群,欢迎感兴趣的小伙伴加入。

小爱(AI)也在群里,公众号后台「联系我」,拉你进群。

picture.image

👇 关注猴哥,快速入门AI工具

picture.image

# AI 工具:

本地部署大模型?看这篇就够了,Ollama 部署和实战

盘点9家免费且靠谱的AI大模型 API,统一封装,任性调用!

# AI应用** :**

弃坑 Coze,我把 Dify 接入了个人微信,AI小助理太强了

我把「FLUX」接入了「小爱」,微信直接出图,告别一切绘画软件!

202K 下载!最强开源OCR:本地部署,邀你围观体验

0
0
0
0
评论
未登录
暂无评论