从 LLM 到 Agentic LLM:研究者文档站

面向研究者的精炼综述 · 方法对比 · 可核实论文链接 · 含框图 · 移动端友好
检索时间窗 2017–2026 · 编制 2026 年 6 月
LLM 基础 推理 工具 / MCP Agent 多智能体 评测与安全 小模型 Agent

本站把"大语言模型如何一步步演化为能自主规划、调用工具、与环境交互的 Agentic LLM"拆解为七个章节,按"基础 → 适配 → 推理 → 工具 → 单/多 Agent → 评测与系统"的主线组织。每章均为原创综述 + 方法对比表 + 可核实论文链接,并配框图;并把小模型 Agent 作为专题深度报告并入。内容沿用并标注了 MIT/Apache 等开源课程的结构脉络(见学习资源与署名),并以《综述与延伸阅读》按主题汇总权威与最新综述、课程与评测基准(含可核实 arXiv 链接)收尾。

学习路径:从 LLM 到 Agentic LLM ①LLM基础 ②适配提示/RAG/微调 ③推理CoT/o1/R1 ④工具调用 & MCP ⑤AgentReAct/记忆/规划 ⑥多智能体协作/框架 ⑦评测系统/安全 贯穿能力 提示工程 · 检索增强(RAG) · 推理 · 工具调用 · 记忆 · 编排(orchestration) · 评测 · 安全护栏
图 0 全站学习路径:从 LLM 基础到 Agentic LLM

章节导航

1 · LLM 基础与适配

Transformer 与注意力、预训练与 Scaling Law、后训练(RLHF/DPO);提示/上下文学习、PEFT(LoRA/QLoRA)、RAG;三者如何取舍。

基础
2 · 推理与工具 / MCP

CoT、Self-Consistency、ToT、ReAct;测试时计算与推理模型(o1/R1);函数调用、Toolformer/Gorilla、Model Context Protocol。

推理 · 工具
3 · Agent 架构与多智能体

感知-决策-行动-记忆闭环;ReAct/Reflexion/规划;Anthropic 五种模式;多智能体协作、辩论 vs 投票、主流框架对比。

Agent
4 · 评测、系统与安全

GAIA/AgentBench/τ-bench/SWE-bench;长程、可复现、成本(CPS);编排/记忆/可观测;prompt injection、沙箱、HITL、护栏。

评测 · 安全
5 · 小模型 Agent(专题)

SLM 作为 agent 的四方向:蒸馏/微调、多智能体协作、端侧部署、领域专用;含 10 张框图的深度报告并入。

专题
6 · 学习资源与署名

精选开源课程/综述/官方指南索引;许可(MIT/Apache/CC)核对一览;本站的署名与合规说明。

资源
7 · 综述与延伸阅读

经 Chrome 实时检索 arXiv/GitHub 汇编:按主题的权威综述 + 课程教程 + 评测基准 + 聚合清单,可持续跟踪。

综述索引

如何使用本站

左侧目录可跨页导航;进入某章后,该章会展开其小节并随滚动高亮当前位置。顶栏/侧栏的"筛选目录"可快速定位章节。右上角「🖨 PDF」可把当前页打印或存为 PDF。移动端会自动折叠为单栏,点左上角 ☰ 展开目录。部署方法见 资源页 与随附的 README

定位:本站偏"研究者参考"——精炼但密集,强调方法脉络、对比与可核实出处,而非逐步教学。若需从零入门,建议先读资源页中标注为"入门"的开源课程,再回到本站做体系化梳理。
下一章:LLM 基础与适配 →