完整项目：用 LLM Wiki 从 0 到 1 学一个新领域

完整项目

前面几篇讲了零件：目录、AGENTS.md、ingest、query、lint、Obsidian、Git、搜索。现在把它们合成一个完整项目。

目标：

用 LLM Wiki 在 7 天内入门一个新领域，并产出一个可继续维护的知识库。

你可以选任何主题。

为了贴合这个博客，我们用：

AI Coding Agent

作为示例。

先说结论

这个项目最终应该产出：

20 个 raw sources；
20 个 source summaries；
15-30 个 concept pages；
5-10 个 project / people pages；
10 个 question pages；
3-5 个 synthesis pages；
1 个 lint report；
1 个最终 overview。

如果你完成这些，你就不是“看过一些资料”，而是真的建立了一个可以继续学习的系统。

1. 项目结构

建目录：

ai-coding-agent-wiki/
├── AGENTS.md
├── index.md
├── log.md
├── raw/
│   ├── articles/
│   ├── papers/
│   ├── docs/
│   └── assets/
└── wiki/
    ├── sources/
    ├── concepts/
    ├── people/
    ├── projects/
    ├── questions/
    └── synthesis/

初始化 Git：

git init
git add .
git commit -m "init ai coding agent wiki"

2. 第 0 天：写研究边界

先新建：

wiki/synthesis/research-scope.md

内容：

# Research Scope: AI Coding Agent

## 我想搞懂什么

- Coding Agent 和 Copilot 的区别是什么？
- Cursor、Claude Code、Codex、Devin、OpenHands 各自定位是什么？
- 一个 Coding Agent 的核心 loop 是什么？
- 企业使用时风险在哪里？
- 我应该如何把 Coding Agent 接入真实项目？

## 不研究什么

- 不做所有模型 benchmark 的完整复现。
- 不追每个产品的最新价格。
- 不讨论泛泛的 AI 是否会取代程序员。

## 最终产物

- 一篇 overview。
- 一张产品对比表。
- 一篇 agent loop 分析。
- 一篇团队落地建议。
- 一组 open questions。

这是项目边界。

没有边界，Wiki 会越长越散。

3. 第 1 天：收集第一批 raw sources

先收 5 篇，不要一口气收 100 篇。

建议类型：

类型	数量
官方文档	2
产品发布文	1
深度分析	1
benchmark / eval	1

命名：

raw/articles/2026-04-25-openai-codex-overview.md
raw/articles/2026-04-25-anthropic-claude-code.md
raw/articles/2026-04-25-cursor-background-agents.md
raw/articles/2026-04-25-swe-bench-agent.md
raw/articles/2026-04-25-openhands.md

每篇加 frontmatter。

4. 第 1-2 天：逐篇 ingest

不要批量。

对每篇运行：

请 ingest raw/articles/<file>.md。

要求：
1. 逐篇处理，不要跳到其他 raw。
2. 创建 source summary。
3. 更新已有 concept / project 页面。
4. 如果有新产品，创建 wiki/projects/ 页面。
5. 如果出现新问题，创建 wiki/questions/ 页面。
6. 更新 index.md 和 log.md。
7. 最后列出修改文件。

5 篇资料后，你应该看到：

wiki/sources/
  openai-codex-overview.md
  anthropic-claude-code.md
  cursor-background-agents.md
  swe-bench-agent.md
  openhands.md

wiki/concepts/
  coding-agent.md
  agent-loop.md
  plan-edit-test.md
  tool-use.md
  repository-context.md

wiki/projects/
  codex.md
  claude-code.md
  cursor.md
  openhands.md

wiki/questions/
  what-makes-coding-agent-reliable.md

5. 第 3 天：第一次 query

问：

基于当前 Wiki，回答：
Coding Agent 和 Copilot 的本质区别是什么？

要求：
1. 先读 index.md。
2. 读相关 wiki 页面。
3. 给对比表。
4. 列出依据页面。
5. 如果值得保存，写入 wiki/synthesis/coding-agent-vs-copilot.md。
6. 更新 index.md 和 log.md。

预期 synthesis：

# Coding Agent vs Copilot

## 结论摘要

Copilot 更像实时辅助，Coding Agent 更像接收任务后自主推进一段工作流。

## 对比表

| 维度 | Copilot | Coding Agent |
| --- | --- | --- |
| 交互单位 | 行 / 函数 / 小段代码 | issue / task / PR |
| 上下文 | 当前文件为主 | 仓库、工具、测试、历史 |
| 行动能力 | 建议为主 | 可编辑、运行、修复 |
| 验证闭环 | 人执行 | Agent 可跑测试 |

## 依据

- [[wiki/concepts/coding-agent]]
- [[wiki/concepts/agent-loop]]
- [[wiki/projects/codex]]
- [[wiki/projects/claude-code]]

6. 第 4 天：扩展到 20 个 sources

现在可以继续收资料。

但这次带着问题收。

从 wiki/questions/ 里挑 5 个问题：

what-makes-coding-agent-reliable.md
how-to-evaluate-coding-agent.md
how-to-secure-coding-agent.md
when-to-use-cloud-agent.md
how-to-handle-large-repos.md

每个问题找 2-3 篇资料。

这比无脑收藏更有效。

7. 第 5 天：第一次 lint

20 个 sources 后，必须 lint。

请对当前 Wiki 做 lint。

要求：
1. 不直接修改文件。
2. 检查孤岛页面、重复概念、缺引用、冲突、index 漏项、log 漏项。
3. 输出 wiki/synthesis/wiki-lint-2026-04-25.md。
4. 按 P0/P1/P2 分类。

然后只修 P0：

请根据 lint report，只修 P0。
更新 index.md 和 log.md。
不要处理 P1/P2。

再 commit：

git status
git diff
git add .
git commit -m "lint ai coding agent wiki p0"

8. 第 6 天：写最终 overview

让 Agent 写：

请基于当前 Wiki，生成 wiki/synthesis/ai-coding-agent-overview.md。

要求：
1. 不直接读 raw，除非 wiki 信息不足。
2. 先读 index.md。
3. 覆盖：
   - 定义；
   - 核心架构；
   - 主流产品；
   - 适用任务；
   - 风险；
   - 评估方式；
   - 团队落地建议；
   - open questions。
4. 每个重要结论列出依据页面。
5. 更新 index.md 和 log.md。

最终 overview 应该像一篇小白也能读懂的入门文章。

不是资料堆砌。

9. 第 7 天：复盘和下一步

新建：

wiki/synthesis/project-retrospective.md

Prompt：

请基于 log.md 和当前 Wiki，写一份项目复盘。

回答：
1. 这 7 天新增了哪些知识资产？
2. 哪些问题已经解决？
3. 哪些问题还没解决？
4. 哪些页面最重要？
5. 下一轮应该读什么资料？
6. AGENTS.md 需要怎么改？

这一步非常关键。

因为你不只是学了 AI Coding Agent。

你还学会了怎么用 LLM Wiki 学一个领域。

10. 最终验收清单

检查项	是否完成
有 `AGENTS.md`	[ ]
有 `index.md`	[ ]
有 `log.md`	[ ]
有 20 个 raw sources	[ ]
每个 source 有 summary	[ ]
有 concept pages	[ ]
有 project pages	[ ]
有 question pages	[ ]
有至少 3 篇 synthesis	[ ]
做过一次 lint	[ ]
修过 P0	[ ]
Git 至少 5 个 commit	[ ]
能基于 Wiki 回答问题	[ ]

如果这些都完成，这个项目达标。

11. 可复制的最终 master prompt

你是我的 LLM Wiki 维护者。

当前项目主题是：AI Coding Agent。

请按照 AGENTS.md 工作。

本轮目标：
1. 基于 index.md 理解当前 Wiki；
2. 检查 log.md 最近进展；
3. 告诉我当前最重要的 5 个概念；
4. 告诉我当前最重要的 5 个未解决问题；
5. 建议下一篇应该 ingest 的资料类型；
6. 不要修改文件，先给计划。

这个 prompt 以后可以作为每次学习开始前的 warm-up。

小结

这个完整项目把 LLM Wiki 的全部能力串起来：

目录；
规则；
ingest；
query；
lint；
Obsidian；
Git；
搜索；
synthesis；
复盘。

真正学会以后，你可以把主题换成任何东西：

AIOps；
Claude 生态；
Codex；
投资研究；
读一本书；
做竞品分析；
个人健康；
团队知识库。

LLM Wiki 的本质不是“整理资料”。

它是一种学习新领域的方法：

让资料、问题、结论和维护动作都留在一个可演化的系统里。

参考资料

Karpathy: LLM Wiki