深入了解LlamaIndex实现Agent代码和原理

大模型向量数据库容器

一、介绍

Agent的流程如下,仔细阅读该图就能理解Agent的流转全貌。

picture.image

1、Agent组件类型

LlamaIndex 支持的 Agent 组件类型主要有三种:

  • FunctionAgent(基于 LLM function calling);

  • ReActAgent(基于 ReAct 提示词策略);

  • CodeActAgent(自动生成并执行代码);

  • 此外,还可通过 AgentWorkflow 组合多 agent 协作。

每种 agent 类型适用于不同场景:
  • FunctionAgent 适合支持函数调用的 LLM,
  • ReActAgent 适合无函数调用能力的 LLM,
  • CodeActAgent 适合需要自动代码执行的复杂任务。

|

2、 Agent 的 Tool

将Agent或 LLM 与函数调用一起使用时,命中准确率在很大程度上依赖于工具名称(Function Name)和参数的描述(工具用途);优化它们可提升 LLM 调用这些工具的准确率。

LlamaIndex 中 Agent 的 Tool 主要有四类:

  • FunctionTool :将任意 Python 函数包装为工具(支持同步和异步);
  • QueryEngineTool:包装查询引擎为工具, 由于我们的Agenyt继承自 BaseQueryEngine,因此QueryEngineTool也可以包装其他Agent;
  • ToolSpec:社区提供的工具包,通常用于集成外部服务如 Gmail ;
  • Utility Tools:如 OnDemandLoaderTool、LoadAndSearchToolSpec,用于增强数据处理能力)。

每种类型都实现了统一的工具接口,便于 agent 自动选择和调用。

picture.image

二、FunctionAgent

1、介绍

在 LlamaIndex 中构建代理时,可以定义一组工具并将其提供给 ReActAgent 或 FunctionAgent。本示例使用 DeepSeek,但该方案适用于任何功能强大的 LLM。

对于支持内置函数调用/工具 API 的 LLM(如 OpenAI、Anthropic 和 Gemini 等),建议优先选择 FunctionAgent。

2、示例代码

1)、本地函数

llm大模型初始化

  
from llama_index.llms.openai_like import OpenAILike  
from llama_index.core import Settings  
  
def init_models():  
    """初始化模型"""  
  
    # llm对话大模型  
    llm = OpenAILike(  
        model="deepseek-ai/DeepSeek-R1",  
        api_base="https://api.siliconflow.cn/v1",  
        api_key="sk-xxxxx",  
        context_window=128000,  
        is_chat_model=True,  
        is_function_calling_model=True,  
    )  
  
  
    Settings.llm = llm  
  
    return Settings  
  
# init_models()

Agent代码

  
from llama_index.core.agent.workflow import FunctionAgent  
from common import llm_model_helper  
llm_model_helper.init_models()  
  
def multiply(a: int, b: int) -> int:  
    """乘法"""  
    return a * b  
  
  
def add(a: int, b: int) -> int:  
    """加法"""  
    print("------")  
    print(f"add方法:a={a},b={b}")  
    ret=a+b+100  
    print(f"结果{ret}")  
    print("------")  
    return ret  
  
def subtract(a: int, b: int) -> int:  
    """减法"""  
    return a - b  
  
  
  
agent = FunctionAgent(  
    tools=[multiply, add, subtract],  
    # llm=Settings.llm,  
    system_prompt="你是一个可以调用工具的助手,结果都以tools返回的结果为准。"  
)  
  
async  def main():  
    response = await agent.run("请计算 3+5")  
    print(response)  
  
if __name__ == "__main__":  
    import asyncio  
    asyncio.run(main())

结果如下

  
------  
add方法:a=3,b=5  
结果108  
------  
  
根据工具返回的结果,3 + 5 的计算结果是 **108**

代码分析:

  • 1、定义了乘法、加法和减法,加法我故意返回一个错误的结果,验证结果是否出现幻觉;方法支持同步和异步;

  • 2、大模型一定要支持function calling,并且能力足够强大,否则会出现结果不正确或不稳定;

  • 3、系统提示词要不断的验证;

  • 4、function方法名一定要通熟易懂,能够让大模型理解这个方法是干嘛的,方法的注释也要写的清清楚楚;

2)、LlamaIndex查询引擎

上面所示的是 Python 本地函数,下面我们来看下 LlamaIndex 查询引擎:

  
from llama_index.core.tools import QueryEngineTool  
  
  
uber_engine = index.as_query_engine(similarity_top_k=3, llm=query_llm)  
query_engine_tool = QueryEngineTool.from_defaults(  
    query_engine=uber_engine,  
    name="uber_10k",  
    description=(  
        "Provides information about Uber financials for year 2021. "  
        "Use a detailed plain text question as input to the tool."  
    ),  
)  
  
  
agent = FunctionAgent(  
    tools=query_engine_tools,  
    system_prompt="You are an agent that can invoke an agent for text-to-SQL execution.",  
)

3、查询调用了哪些工具

查看调用了哪些tools的方法

  
 response.tool\_calls

4、FunctionTool

从demo中我们可以看出tools的数组里直接存放方法名,那么为啥还要使用FunctionTool呢?

FunctionTool 实现了 LlamaIndex 所有工具的通用接口,包括 __call__、.metadata 方法等,并且包装后能提供一致的元数据(如 schema、名称、描述),方便 agent 调度、调试、记录等 。

直接传函数虽然可以工作,但就少了这些额外结构与控制能力。FunctionTool.from_defaults 让普通函数变身为“Agent 上下文可控的工具”,无缝接入多种能力 —— 比如函数调用、Context 访问、回调控制、异步支持等等。

较完善的示例代码如下:

  
from llama_index.core.tools import FunctionTool  
from typing import Annotated  
from llama_index.core.agent.workflow import FunctionAgent  
  
def multiply(a: int, b: int) -> int:  
    """乘法"""  
    return a * b  
  
# 定义获取天气的函数  
def get_weather_old(location: str) -> str:  
    """获取指定地点的天气情况"""  
    # 实际实现中会调用天气API  
    return f"{location}的天气是晴朗,气温25℃"  
  
def get_weather(  
        location: Annotated[  
            str, "格式要求:城市名和州名,如'北京,中国'"  
        ],  
) -> str:  
    """获取指定地点的天气情况"""  
    # 实际实现中会调用天气API  
    return f"{location}的天气是晴朗,气温25℃"  
  
async  def aget_weather(  
        location: Annotated[  
            str, "格式要求:城市名和州名,如'北京,中国'"  
        ],  
) -> str:  
    """获取指定地点的天气情况"""  
  # 处理逻辑略  
  
multiply_tool = FunctionTool.from_defaults(multiply,  
                                  name="MultiplyTool",  
                                  description="用于计算乘法运算"  
                                  )  
  
weather_tool = FunctionTool.from_defaults(get_weather,  
                                  # async_fn=aget_weather,  # 可选  
                                  name="WeatherQueryTool",  
                                  description="专门用于查询各地天气的工具,支持城市+州/国家格式"  
                                  )  
  
  
agent = FunctionAgent(  
    tools=[multiply_tool,weather_tool],  
    llm=Settings.llm,  
    system_prompt="你是一个可以调用工具的助手,结果都以tools返回的结果为准。"  
)  
  
async  def main():  
    response = await agent.run("北京的天气如何?")  
    print(response)  
  
if __name__ == "__main__":  
    import asyncio  
    asyncio.run(main())

代码分析:

(1)方法的参数可以使用Annotated类型来细化参数描述(可选项);

(2)FunctionTool.from_defaults可设置方法的描述,name等元数据;

5、工具太多该如何处理?

如果 agent 的 tools 数组中方法(工具)非常多,主要影响是 LLM prompt 变大,可能导致推理变慢、token 消耗增加,但不会直接影响 Python 端的性能。LlamaIndex 支持用 ObjectIndex 等机制对大量工具做索引和检索,只将相关工具传递给 LLM,优化性能。

如需管理大量工具,建议用 ObjectIndex + ToolRetriever 动态筛选,避免全部工具都进 prompt。官方文档:

https://docs.llamaindex.ai/en/stable/examples/agent/openai\_agent\_retrieval/

相关网址

https://docs.llamaindex.ai/en/stable/understanding/putting\_it\_all\_together/agents/

https://docs.llamaindex.ai/en/stable/module\_guides/deploying/agents/?utm\_source=chatgpt.com

https://docs.llamaindex.ai/en/stable/examples/agent/agent\_workflow\_basic/

https://docs.llamaindex.ai/en/stable/module\_guides/deploying/agents/tools/?utm\_source=chatgpt.com

https://blog.csdn.net/The\_Thieves/article/details/148656462

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论