本课程旨在介绍如何将大语言模型构建为能够自主感知、规划、行动并学习的通用智能体。课程将围绕“感知-规划-行动-记忆”的核心框架,深入剖析关键技术:包括以ReAct框架为代表的任务规划,通过示范学习、教程学习与探索学习实现的工具学习,以及结合短期、长期和反思机制的记忆系统。我们还将探讨Agentic RL等前沿智能体学习范式。最后,介绍通用计算机控制、自动化科学研究等应用案例,展示大模型智能体的广阔前景与未来方向。
大语言模型
林衍凯
问答