论文题目:Understanding the planning of LLM agents: A survey
论文链接:https://arxiv.org/pdf/2402.02716.pdf
文章系统地审视和分析大型语言模型(LLMs)作为自主Agents规划模块的研究进展。 随着LLMs在多个领域展现出显著的智能,将它们作为Agents规划模块的研究受到了越来越多的关注。 本文提供了 LLM Agents规划的首个系统性视图 ,涵盖了旨在提高规划能力的最新研究工作。
研究者们提出了一个 LLM Agents 规划的分类法 ,将其分为 任务分解 、 计划选择 、 外部模块辅助规划 、 反思与优化 以及 记忆增强规划 五个主要方向。 对每个方向进行了全面的分析,并讨论了该领域的进一步挑战。
LLM Agents规划的分类法
- 任务分解 :将复杂任务分解为多个子任务,然后依次规划每个子任务。这包括分解优先(Decomposition-First)和交错分解(Interleaved Decomposition)两种方法。
- 计划选择 : 生成多个计划并选择最优计划。 这涉及多计划生成和最优计划选择两个主要步骤。
- 外部规划器辅助规划 : 结合LLMs与外部规划器,以提高规划过程的效率和可行性。 这包括基于符号的规划器和基于神经网络的规划器。
- 反思与优化 : 通过反思和优化来增强规划过程的容错能力和错误修正能力。 这包括自我反思、错误检测和基于外部工具的自我修正。
- 记忆增强规划 : 通过记忆机制来增强规划能力,包括基于检索增强生成(RAG)的记忆和基于微调(Fine-tuning)的记忆。
论文还对这些方法在四个基准测试上进行了评估,包括交互式游戏环境、交互式检索环境和交互式编程环境。实验结果表明,性能随着计算成本的增加而提高,并且对于复杂任务,反思在提高成功率方面发挥了关键作用。
尽管这些工作在规划能力上取得了提升,但仍存在一些重大挑战,如幻觉问题、生成计划的可行性、计划效率、多模态环境反馈以及细粒度评估等。未来的研究方向可能包括解决这些挑战,以及开发更真实的评估环境和更高效的规划策略。
推荐阅读
- • TinyGPT-V:小而强大,轻量级骨架打造高效多模态大语言模型
- • 2024:ToB、Agent、多模态
- • TA们的RAG真正投产了吗?(上)
- • 2023年最新LLM发展时间线一览(ChatGPT、LLaMA等)
欢迎关注我的公众号“ PaperAgent ”, 每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。