从 LLM 到 Agentic LLM:研究者文档站
面向研究者的精炼综述 · 方法对比 · 可核实论文链接 · 含框图 · 移动端友好
检索时间窗 2017–2026 · 编制 2026 年 6 月
LLM 基础
推理
工具 / MCP
Agent
多智能体
评测与安全
小模型 Agent
本站把"大语言模型如何一步步演化为能自主规划、调用工具、与环境交互的 Agentic LLM"拆解为七个章节,按"基础 → 适配 → 推理 → 工具 → 单/多 Agent → 评测与系统"的主线组织。每章均为原创综述 + 方法对比表 + 可核实论文链接,并配框图;并把小模型 Agent 作为专题深度报告并入。内容沿用并标注了 MIT/Apache 等开源课程的结构脉络(见学习资源与署名),并以《综述与延伸阅读》按主题汇总权威与最新综述、课程与评测基准(含可核实 arXiv 链接)收尾。
章节导航
1 · LLM 基础与适配
Transformer 与注意力、预训练与 Scaling Law、后训练(RLHF/DPO);提示/上下文学习、PEFT(LoRA/QLoRA)、RAG;三者如何取舍。
基础2 · 推理与工具 / MCP
CoT、Self-Consistency、ToT、ReAct;测试时计算与推理模型(o1/R1);函数调用、Toolformer/Gorilla、Model Context Protocol。
推理 · 工具4 · 评测、系统与安全
GAIA/AgentBench/τ-bench/SWE-bench;长程、可复现、成本(CPS);编排/记忆/可观测;prompt injection、沙箱、HITL、护栏。
评测 · 安全如何使用本站
左侧目录可跨页导航;进入某章后,该章会展开其小节并随滚动高亮当前位置。顶栏/侧栏的"筛选目录"可快速定位章节。右上角「🖨 PDF」可把当前页打印或存为 PDF。移动端会自动折叠为单栏,点左上角 ☰ 展开目录。部署方法见 资源页 与随附的 README。
定位:本站偏"研究者参考"——精炼但密集,强调方法脉络、对比与可核实出处,而非逐步教学。若需从零入门,建议先读资源页中标注为"入门"的开源课程,再回到本站做体系化梳理。