点击
蓝色
字体关注我们
本文为大家剖析一个 通过多智能体协作来完成的AI研究助理 ,可以用来帮助进行各种综合的在线研究任务并输出报告。该应用基于 LangGraph 以及开源的 GPT-Researcher 项目而构建,我们将为大家介绍与剖析这个应用,你可以在此基础上做简单改造(如修改分析数据源、提示词等),以适应自身需要。
业务场景
通常,如果需要从头开始一个主题(比如“生成式人工智能中的伦理偏见与公平性")的深入研究,我们最期望的是能够快速的获取多个来源的值得信赖的信息,这可能需要在多个网站之间不断点击与浏览,通过一系列检索、聚合、细化、整理等工作来完成任务。当然,现在你可以借助大模型,但是简单的模型输出或者RAG(检索增强生成)会面临这样的问题:
- 大模型训练的信息过时,容易产生幻觉
- 受限于上下文限制,不太适合输出长篇研究报告
- 网络搜索获得的参考资源不足,导致不全面与偏见
- RAG系统更适合回答问题而不是编写长篇报告
所以期望有一个设计合理的AI智能体,能够自主的完成这样的研究任务:
- 对输入的研究主题进行细分,生成研究提纲与子课题
- 对子课题来获取相关的参考信息(本地或网络)
- 对获取的信息整理、汇总、分析,得出研究结论或报告
- 对报告进行自我反省与审核,并提出问题与指出不足
- 根据审核结果修订研究报告,并能获得人类反馈
- 结合研究的中间成果,输出最终的全面研究报告
架构设计
随着AI Agent理论与框架的演进, 多智能体系统(Multi-Agent System) 以其更灵活的架构,以及更接近人类社会组织与分工形式的设计而获得广泛关注。
多智能体系统相对单智能体展现出了一些独有的特点与优势:
- 通过多个相互独立但协作的智能体来完成复杂任务,每个智能体拥有不同的视角或能力,可以更全面地理解和处理复杂问题
- 任务可以被分解并分配给不同的智能体,并行处理后再综合结果。能够加速任务完成,并提高系统的整体效率和准确性
- 可以根据任务需求动态地调整各智能体的角色与职责,更好地适应变化的环境,通过调整智能体之间的互动模式,应对不同的挑战
多智能体更适用于需要多角度、多角色参与,需要分工协作、任务分解的场景与复杂任务。
这个项目中设计的多智能体研究助理架构如下:
图中展示出涉及的角色(智能体)包括:
- Researcher :研究员。针对研究主题采集网络资源,做自主研究
- Editor :编辑。负责初期规划研究大纲和整体结构
- Reviewer :审阅。根据设定的标准对研究结果进行检查验证
- Revisor :修订。根据审阅结果对研究结果进行修订
- Writer :撰写。根据研究输出撰写最终报告内容
- Publisher :发布。负责用不同的格式发布最终研究报告
除了智能体以外,也支持人类( Human )角色参与到流程,并在适当的时机给出反馈。这在多智能体系统中也很常见,通常用于审核或给出额外任务指令。
这里的基本工作流程为:
- 根据给定的研究主题,参考互联网资源进行初步研究
- 根据初步研究结果制定报告提纲(子课题)
- 对每个子课题做深入研究、审阅与修改,直到满意为止
- 汇总子课题的研究结果撰写最终报告,并输出多格式文档er q
基于LangGraph的实现
LangGraph是大模型应用开发框架LangChain的扩展包。 LangGraph通过把一个Single-Agent或Multi-Agent系统的工作流用Graph(图结构)来设计与表示,从而能够支持最复杂的任务节点与关系,以支持构建更强大、能支持循环流的Agent应用。
如果对LangGraph不熟悉,请参考以下两篇:
彻底搞懂LangGraph:构建强大的Multi-Agent多智能体应用的LangChain新利器
彻底搞懂LangGraph:构建一个可自我纠正的增强知识库RAG应用
【Graph设计】
这里对上面的AI研究助理设计Graph图如下:
【State设计】
LangGraph中需要定义的State对象是用来保存在各个节点之间传递的必需信息,这样每个节点可以访问这个统一的数据对象实现数据共享。这个项目中的State的结构设计如下:
class ResearchState(TypedDict):
#研究任务
task: dict
initial\_research: str
sections: List[str]
research\_data: List[dict]
human\_feedback: str #人类反馈
#输出的报告结构
title: str
headers: dict
date: str
table\_of\_contents: str
introduction: str
conclusion: str
sources: List[str]
report: str
State中的信息分成研究任务相关(比如任务内容、子课题、参考数据、人类反馈等)与输出报告相关(标题、简介、内容等)两个部分。
【基于LangGraph的主流程】
现在,假设已经准备好所有的Agent及其行为(比如研究、审核等),就可以根据上面的Graph图开发Workflow。步骤是:
- 创建多个agent
- 创建主workflow
- 增加workflow中的节点(agent及其动作)
- 增加workflow中的边(节点之间的关系)
......初始化研究团队(LangGraph)......
def init\_research\_team(self):
# 声明多个独立Agent
writer\_agent = WriterAgent(self.websocket, self.stream\_output, self.headers)
editor\_agent = EditorAgent(self.websocket, self.stream\_output, self.headers)
research\_agent = ResearchAgent(self.websocket, self.stream\_output, self.tone, self.headers)
publisher\_agent = PublisherAgent(self.output\_dir, self.websocket, self.stream\_output, self.headers)
human\_agent = HumanAgent(self.websocket, self.stream\_output, self.headers)
# 创建一个LangGraph的workflow
workflow = StateGraph(ResearchState)
# 增加Graph中的节点(参考Graph设计图)
workflow.add\_node("browser", research\_agent.run\_initial\_research)
workflow.add\_node("planner", editor\_agent.plan\_research)
workflow.add\_node("researcher", editor\_agent.run\_parallel\_research)
workflow.add\_node("writer", writer\_agent.run)
workflow.add\_node("publisher", publisher\_agent.run)
workflow.add\_node("human", human\_agent.review\_plan)
# 增加Graph中的边
workflow.add\_edge('browser', 'planner')
workflow.add\_edge('planner', 'human')
workflow.add\_edge('researcher', 'writer')
workflow.add\_edge('writer', 'publisher')
# 设定开始和结束
workflow.set\_entry\_point("browser")
workflow.add\_edge('publisher', END)
# 条件边:基于人类反馈决定是否要重新设计研究提纲
workflow.add\_conditional\_edges('human',
(lambda review: "accept" if review['human\_feedback'] is None else "revise"),
{"accept": "researcher", "revise": "planner"})
return workflow
注意到这里有个 条件边(conditional_edge) ,用来根据人类的不同反馈决定下一步的动作(继续还是重新做初步研究)。
【并行子流程:子课题研究】
在规划完任务研究提纲后,需要对提纲中的每个子课题进行深入研究。这可以 通过并行的方式启动多个子研究任务来完成,以提升速度与效率 。为了能够实现并行,需要设计并开发一个独立的 子Workflow ,且其运行时不会相互影响,也不会影响到主流程。这个子Workflow创建如下:
...并行运行的子workflow...
async def run_parallel_research(self, research_state: dict): # 创建agent research_agent = ResearchAgent(self.websocket, self.stream_output, self.headers) reviewer_agent = ReviewerAgent(self.websocket, self.stream_output, self.headers) reviser_agent = ReviserAgent(self.websocket, self.stream_output, self.headers) # 创建子workflow workflow = StateGraph(DraftState) # 增加node workflow.add_node("researcher", research_agent.run_depth_research) workflow.add_node("reviewer", reviewer_agent.run) workflow.add_node("reviser", reviser_agent.run) # 增加边 workflow.set_entry_point("researcher") workflow.add_edge('researcher', 'reviewer') workflow.add_edge('reviser', 'reviewer') #条件边:根据审核结果决定是继续修订还是结束研究 workflow.add_conditional_edges('reviewer', (lambda draft: "accept" if draft['review'] is None else "revise"), {"accept": END, "revise": "reviser"}) chain = workflow.compile()...
需要注意的是为了让每个子任务运行时具有独立的状态,必须设计一个用于子Workflow的State(即代码中的DraftState)对象,用来保存子任务运行过程中的子课题、草稿内容、审查结果、修订说明等。
【Agent设计】
在这个多智能体系统中,AI的职责被设计与分工到不同的Agent,因此单个Agent的功能其实是比较简单的,而且这里除了browser与researcher这两个Agent(这两个借助了现成的GPT-Researcher库),不需要借助外部的Tools,只需要借助大模型提示来完成即可。以上面的planner这个agent的实现为例,其动作提示词如下(翻译成中文):
...
prompt = [{
"role": "system",
"content": "你是一名研究编辑。你的目标是监督研究项目从开始到完成。你的主要任务是根据初步的研究总结来规划文章的章节布局。\n"
}, {
"role": "user",
"content": f"今天的日期是 {datetime.now().strftime('%d/%m/%Y')}\n."
f"研究总结报告: '{initial\_research}'\n"
f"{f'人工反馈: {human\_feedback}。你必须基于人工反馈规划章节。' if include\_human\_feedback else ''}\n"
f"你的任务是根据上述研究总结报告生成研究项目的章节标题大纲。\n"
f"你最多只能生成 {max\_sections} 个章节标题。\n"
f"你必须只关注相关的研究主题作为子标题,并且不要包括引言、结论和参考文献。\n"
f"你必须仅返回一个包含以下字段的JSON:'title' (字符串类型的研究标题) 和 "
f"'sections' (最多 {max\_sections} 个章节标题),结构如下:"
f"'{{title: string 研究标题, date: 今天的日期, "
f"sections: ['章节标题 1', '章节标题 2', '章节标题 3' ...]}}。\n"
}]
而对于“人类”这个特殊的角色,无需借助大模型,简单的获得人类反馈信息即可,并保存到State对象即可:
async def review\_plan(self, research\_state: dict):
layout = research\_state.get("sections")
user\_feedback = None
user\_feedback = input(f"Any feedback on this plan? {layout}? If not, please reply with 'no'.\n>> ")
if user\_feedback and "no" in user\_feedback.lower():
user\_feedback = None
return {"human\_feedback": user\_feedback}
其他的Agent可以参考项目的详细代码,这里不再做一一介绍。
最后,在完成Agent与Workflow的创建后,就可以运行已经创建好的Workflow,输入任务信息即可启动一个自主运行的AI研究助理,等待最终输出即可(中间需要给出人类的确认反馈)。
...
#创建主workflow
research\_team = init\_research\_team()
chain = research\_team.compile()
result = await chain.ainvoke({"task": "研究任务"})
以上介绍了一个基于LangGraph与GPT-Researcher项目构建的多智能体AI研究助理,用来根据输入的任务自主的借助互联网进行规划、研究、反思、修订并最终输出研究报告。这个项目很好地演示了多智能体系统的应用场景,以及LangGraph与GPT-Researcher项目的应用。有兴趣的朋友可以参考源项目做进一步探索:
https://github.com/assafelovic/gpt-researcher/tree/master/multi\_agents
END
点击下方关注我,不迷路
交流请识别以下名片并说明来源