从 LLM 到 Agentic LLM:研究者文档站
本站把"大语言模型如何一步步演化为能自主规划、调用工具、与环境交互的 Agentic LLM"拆解为十个章节,按"基础 → 适配 → 推理 → 工具 → 单/多 Agent → 评测与系统"的主线组织。每章均为原创综述 + 方法对比表 + 可核实论文链接,并配框图;并把小模型 Agent 作为专题深度报告并入。内容沿用并标注了 MIT/Apache 等开源课程的结构脉络(见学习资源与署名),并以《综述与延伸阅读》按主题汇总权威与最新综述。此外设《编程 Agent》聚焦各类 coding agent(Claude Code/Cursor/Devin/SWE-bench…)、《每日新论文》由定时任务每日自动追加 arXiv 速递、《面试题与求职》汇总高频面试题与答案,便于实战与求职。
章节导航
Transformer 与注意力、预训练与 Scaling Law、后训练(RLHF/DPO);提示/上下文学习、PEFT(LoRA/QLoRA)、RAG;三者如何取舍。
基础CoT、Self-Consistency、ToT、ReAct;测试时计算与推理模型(o1/R1);函数调用、Toolformer/Gorilla、Model Context Protocol。
推理 · 工具GAIA/AgentBench/τ-bench/SWE-bench;长程、可复现、成本(CPS);编排/记忆/可观测;prompt injection、沙箱、HITL、护栏。
评测 · 安全从补全到自主改代码;工作流闭环、agentic vs agentless、Claude Code/Cursor/Devin/OpenHands 等工具全景、SWE-bench 评测与关键论文。
实战如何使用本站
左侧目录可跨页导航;进入某章后,该章会展开其小节并随滚动高亮当前位置。顶栏/侧栏的"筛选目录"可快速定位章节。右上角「🖨 PDF」可把当前页打印或存为 PDF。移动端会自动折叠为单栏,点左上角 ☰ 展开目录。部署方法见 资源页 与随附的 README。