从 LLM 到 Agentic LLM：研究者文档站

面向研究者的精炼综述 · 方法对比 · 可核实论文链接 · 含框图 · 移动端友好

检索时间窗 2017–2026 · 编制 2026 年 6 月

LLM 基础推理工具 / MCP Agent 多智能体评测与安全小模型 Agent

本站把"大语言模型如何一步步演化为能自主规划、调用工具、与环境交互的 Agentic LLM"拆解为十个章节，按"基础 → 适配 → 推理 → 工具 → 单/多 Agent → 评测与系统"的主线组织。每章均为原创综述 + 方法对比表 + 可核实论文链接，并配框图；并把小模型 Agent 作为专题深度报告并入。内容沿用并标注了 MIT/Apache 等开源课程的结构脉络（见学习资源与署名），并以《综述与延伸阅读》按主题汇总权威与最新综述。此外设《编程 Agent》聚焦各类 coding agent（Claude Code/Cursor/Devin/SWE-bench…）、《每日新论文》由定时任务每日自动追加 arXiv 速递、《面试题与求职》汇总高频面试题与答案，便于实战与求职。

图 0　全站学习路径：从 LLM 基础到 Agentic LLM

章节导航

1 · LLM 基础与适配

Transformer 与注意力、预训练与 Scaling Law、后训练（RLHF/DPO）；提示/上下文学习、PEFT(LoRA/QLoRA)、RAG；三者如何取舍。

基础

2 · 推理与工具 / MCP

CoT、Self-Consistency、ToT、ReAct；测试时计算与推理模型(o1/R1)；函数调用、Toolformer/Gorilla、Model Context Protocol。

推理 · 工具

3 · Agent 架构与多智能体

感知-决策-行动-记忆闭环；ReAct/Reflexion/规划；Anthropic 五种模式；多智能体协作、辩论 vs 投票、主流框架对比。

Agent

4 · 评测、系统与安全

GAIA/AgentBench/τ-bench/SWE-bench；长程、可复现、成本(CPS)；编排/记忆/可观测；prompt injection、沙箱、HITL、护栏。

评测 · 安全

5 · 小模型 Agent（专题）

SLM 作为 agent 的四方向：蒸馏/微调、多智能体协作、端侧部署、领域专用；含 10 张框图的深度报告并入。

专题

6 · 学习资源与署名

精选开源课程/综述/官方指南索引；许可(MIT/Apache/CC)核对一览；本站的署名与合规说明。

资源

7 · 综述与延伸阅读

经 Chrome 实时检索 arXiv/GitHub 汇编：按主题的权威综述 + 课程教程 + 评测基准 + 聚合清单，可持续跟踪。

综述索引

8 · 每日新论文

每天 08:00 定时任务自动抓取 arXiv 的 Agent/LLM 新论文并追加到此页（最新在最上），随时间增长。

每日更新

9 · 编程 Agent（Coding）

从补全到自主改代码；工作流闭环、agentic vs agentless、Claude Code/Cursor/Devin/OpenHands 等工具全景、SWE-bench 评测与关键论文。

实战

10 · 面试题与求职

覆盖 LLM/推理/RAG/Agent/工具/多智能体/评测/安全/Coding Agent/系统工程的高频面试题 + 精炼答案，含行为面与求职 tips。

求职

如何使用本站

左侧目录可跨页导航；进入某章后，该章会展开其小节并随滚动高亮当前位置。顶栏/侧栏的"筛选目录"可快速定位章节。右上角「🖨 PDF」可把当前页打印或存为 PDF。移动端会自动折叠为单栏，点左上角 ☰ 展开目录。部署方法见资源页与随附的 README。

定位：本站偏"研究者参考"——精炼但密集，强调方法脉络、对比与可核实出处，而非逐步教学。若需从零入门，建议先读资源页中标注为"入门"的开源课程，再回到本站做体系化梳理。