“我知道它能用,但我真的不理解它为什么能做到。”

学了 Prompt、Token、Embedding、RAG、ReAct、Agentic Loop……术语一堆,做项目时却还是”一知半解”。如果你也有这种感觉,这个系列就是为你写的。

过去一年,LLM 和 Agent 从写代码、自动化测试到知识问答、流程自动化,各种 Demo 层出不穷。但很多教程只讲”怎么用”,不讲”为什么能这样用”——底层机制拆得不够,实践心法也给得不够。

所以我做了这个面向新手到进阶开发者的学习路径(沿用原主线系列 《🧠 LLM/Agent 从入门到精通:告别浅尝辄止》 的阅读顺序;相关内容现按主题拆到博客分类:📚 大模型基础 · 🤖 Agent 系统 · 🔌 LLM 工程集成,便于查阅)。每篇聚焦两个问题:

  • Why? —— 这些机制为什么重要?解决了什么问题?
  • How? —— 实际开发中该怎么正确使用?

目标是帮你从”会用”走到”理解原理”,从”能跑 Demo”走到”能做项目”。


📘 系列起点

想快速过一遍概念?可以先看《LLM 与智能体(Agent)知识记录》,当作本系列的知识地基。想直接开啃原理?从下面 Part I 第 1 篇开始即可。


🚀 系列展望:核心主题规划

下面是本系列计划覆盖的核心主题,它们构成了 LLM / Agent 理解体系的完整地图。

说明:以下主题为初步规划,在实际写作过程中可能会根据内容需要、读者反馈进行调整(如拆分、合并、新增主题)。但核心知识体系会保持完整,确保你能系统掌握 LLM 和 Agent 的关键概念。

我会通过图示、例子、类比、真实项目经验,将这些看似”玄学”的内容拆得足够简单和清晰。


Part I: LLM 基础认知与 Prompt 工程(模型是大脑)

新手建议从第 1 篇开始,按顺序读效果更好。

# 主题 核心拆解方向
1 ChatGPT 几秒出千字?背后只做了一件事 Token、Embedding、Transformer —— LLM 底层三件事。
2 模型答非所问?理解 Prompt、上下文与 In-Context Learning 大模型记忆的本质是什么?上下文限制怎么影响效果?
3 想要 JSON 却得到废话?Prompt 工程的三大核心技巧 如何让模型稳定产生 JSON/YAML/Markdown。
4 模型一本正经地胡说八道?RAG 如何让 LLM 有据可查 检索 → 分块 → 重排 → 融合的完整流程。
5 GPT-4、Claude、Llama 怎么选?模型选型避坑指南 参数量、推理速度、成本如何权衡?

Part II: Agent 核心架构与决策机制(模型是大脑,Agent 是身体)

# 主题 核心拆解方向
6 只会聊天不够用?Agent 如何让 LLM 能做事、会思考、能修正 感知、规划、行动 → Agentic Loop 的全流程。
7 Agent 怎么”想”和”做”?ReAct 决策引擎代码级拆解 ReAct Prompt 模板与真实调用示例。
8 复杂任务 Agent 怎么拆?任务规划与 Self-Correction 推理链、子任务分解、Self-Correction。
9 Agent 聊着聊着就忘了?记忆管理如何突破 Context Window 为什么 Agent 需要”记忆”?怎么设计高质量记忆?
10 LangChain、LlamaIndex、AutoGPT 怎么选?Agent 框架对比 如何快速搭建一个可靠的 Agentic System。

Part III: 实践、治理与进阶应用(落地、可控、可观测)

# 主题 深度聚焦
11 Agent 输出飘忽不定?用 Schema 锁死格式 如何设计结构化规范(JSON Schema、Pydantic)。
12 Agent 怎么查数据库、调 API?Function Calling 与工具封装 安全、幂等、工具自描述(Tool Description)。
13 Agent 失控了怎么办?日志、审计与可观测性 如何避免 Agent”失控”?如何复盘 Agent 行为?
14 一个 Agent 不够用?多 Agent 协作像团队一样干活 角色设定、话术设计、协作协议、消息流。
15 Agent 好不好怎么衡量?评估指标体系与避坑指南 减少工具滥用、避免无限循环、提高成功率。

🎯 这个系列适合谁?

  • 希望从零入门 LLM/Agent 的新手
  • 已经做过 Demo,希望系统提升的人
  • 做知识库问答、自动化测试、业务流自动化的开发者
  • AI 产品经理 / QA / 技术 Leader
  • 想把”碎片化知识 → 体系化理解”的任何人

如果你在工作中想:

  • 构建自己的 Agent
  • 为公司做 AI 赋能
  • 做 LLM 测试或知识库问答
  • 更深入理解大模型机制
  • 不再只是”调调 Prompt”

那么,这个系列会非常适合你。


🔔 从这里开始

ChatGPT 几秒出千字?背后只做了一件事 —— 搞懂 Token、Embedding、Transformer 三件事,你就搞懂了 LLM 的底层逻辑。