完整项目:用 LLM Wiki 从 0 到 1 学一个新领域

LLM Wiki 系列收官项目:选一个主题,收集 20 篇资料,完成 ingest、query、lint、Obsidian 浏览、Git 管理和搜索升级,最终形成一个可长期维护的知识库。

5 min read Part of LLM Wiki · Ch. 10

完整项目

前面几篇讲了零件:目录、AGENTS.md、ingest、query、lint、Obsidian、Git、搜索。现在把它们合成一个完整项目。

目标:

用 LLM Wiki 在 7 天内入门一个新领域,并产出一个可继续维护的知识库。

你可以选任何主题。

为了贴合这个博客,我们用:

AI Coding Agent

作为示例。


先说结论

这个项目最终应该产出:

  • 20 个 raw sources;
  • 20 个 source summaries;
  • 15-30 个 concept pages;
  • 5-10 个 project / people pages;
  • 10 个 question pages;
  • 3-5 个 synthesis pages;
  • 1 个 lint report;
  • 1 个最终 overview。

如果你完成这些,你就不是“看过一些资料”,而是真的建立了一个可以继续学习的系统。


1. 项目结构

建目录:

ai-coding-agent-wiki/
├── AGENTS.md
├── index.md
├── log.md
├── raw/
│   ├── articles/
│   ├── papers/
│   ├── docs/
│   └── assets/
└── wiki/
    ├── sources/
    ├── concepts/
    ├── people/
    ├── projects/
    ├── questions/
    └── synthesis/

初始化 Git:

git init
git add .
git commit -m "init ai coding agent wiki"

2. 第 0 天:写研究边界

先新建:

wiki/synthesis/research-scope.md

内容:

# Research Scope: AI Coding Agent

## 我想搞懂什么

- Coding Agent 和 Copilot 的区别是什么?
- Cursor、Claude Code、Codex、Devin、OpenHands 各自定位是什么?
- 一个 Coding Agent 的核心 loop 是什么?
- 企业使用时风险在哪里?
- 我应该如何把 Coding Agent 接入真实项目?

## 不研究什么

- 不做所有模型 benchmark 的完整复现。
- 不追每个产品的最新价格。
- 不讨论泛泛的 AI 是否会取代程序员。

## 最终产物

- 一篇 overview。
- 一张产品对比表。
- 一篇 agent loop 分析。
- 一篇团队落地建议。
- 一组 open questions。

这是项目边界。

没有边界,Wiki 会越长越散。


3. 第 1 天:收集第一批 raw sources

先收 5 篇,不要一口气收 100 篇。

建议类型:

类型数量
官方文档2
产品发布文1
深度分析1
benchmark / eval1

命名:

raw/articles/2026-04-25-openai-codex-overview.md
raw/articles/2026-04-25-anthropic-claude-code.md
raw/articles/2026-04-25-cursor-background-agents.md
raw/articles/2026-04-25-swe-bench-agent.md
raw/articles/2026-04-25-openhands.md

每篇加 frontmatter。


4. 第 1-2 天:逐篇 ingest

不要批量。

对每篇运行:

请 ingest raw/articles/<file>.md。

要求:
1. 逐篇处理,不要跳到其他 raw。
2. 创建 source summary。
3. 更新已有 concept / project 页面。
4. 如果有新产品,创建 wiki/projects/ 页面。
5. 如果出现新问题,创建 wiki/questions/ 页面。
6. 更新 index.md 和 log.md。
7. 最后列出修改文件。

5 篇资料后,你应该看到:

wiki/sources/
  openai-codex-overview.md
  anthropic-claude-code.md
  cursor-background-agents.md
  swe-bench-agent.md
  openhands.md

wiki/concepts/
  coding-agent.md
  agent-loop.md
  plan-edit-test.md
  tool-use.md
  repository-context.md

wiki/projects/
  codex.md
  claude-code.md
  cursor.md
  openhands.md

wiki/questions/
  what-makes-coding-agent-reliable.md

5. 第 3 天:第一次 query

问:

基于当前 Wiki,回答:
Coding Agent 和 Copilot 的本质区别是什么?

要求:
1. 先读 index.md。
2. 读相关 wiki 页面。
3. 给对比表。
4. 列出依据页面。
5. 如果值得保存,写入 wiki/synthesis/coding-agent-vs-copilot.md。
6. 更新 index.md 和 log.md。

预期 synthesis:

# Coding Agent vs Copilot

## 结论摘要

Copilot 更像实时辅助,Coding Agent 更像接收任务后自主推进一段工作流。

## 对比表

| 维度 | Copilot | Coding Agent |
| --- | --- | --- |
| 交互单位 | 行 / 函数 / 小段代码 | issue / task / PR |
| 上下文 | 当前文件为主 | 仓库、工具、测试、历史 |
| 行动能力 | 建议为主 | 可编辑、运行、修复 |
| 验证闭环 | 人执行 | Agent 可跑测试 |

## 依据

- [[wiki/concepts/coding-agent]]
- [[wiki/concepts/agent-loop]]
- [[wiki/projects/codex]]
- [[wiki/projects/claude-code]]

6. 第 4 天:扩展到 20 个 sources

现在可以继续收资料。

但这次带着问题收。

wiki/questions/ 里挑 5 个问题:

what-makes-coding-agent-reliable.md
how-to-evaluate-coding-agent.md
how-to-secure-coding-agent.md
when-to-use-cloud-agent.md
how-to-handle-large-repos.md

每个问题找 2-3 篇资料。

这比无脑收藏更有效。


7. 第 5 天:第一次 lint

20 个 sources 后,必须 lint。

请对当前 Wiki 做 lint。

要求:
1. 不直接修改文件。
2. 检查孤岛页面、重复概念、缺引用、冲突、index 漏项、log 漏项。
3. 输出 wiki/synthesis/wiki-lint-2026-04-25.md。
4. 按 P0/P1/P2 分类。

然后只修 P0:

请根据 lint report,只修 P0。
更新 index.md 和 log.md。
不要处理 P1/P2。

再 commit:

git status
git diff
git add .
git commit -m "lint ai coding agent wiki p0"

8. 第 6 天:写最终 overview

让 Agent 写:

请基于当前 Wiki,生成 wiki/synthesis/ai-coding-agent-overview.md。

要求:
1. 不直接读 raw,除非 wiki 信息不足。
2. 先读 index.md。
3. 覆盖:
   - 定义;
   - 核心架构;
   - 主流产品;
   - 适用任务;
   - 风险;
   - 评估方式;
   - 团队落地建议;
   - open questions。
4. 每个重要结论列出依据页面。
5. 更新 index.md 和 log.md。

最终 overview 应该像一篇小白也能读懂的入门文章。

不是资料堆砌。


9. 第 7 天:复盘和下一步

新建:

wiki/synthesis/project-retrospective.md

Prompt:

请基于 log.md 和当前 Wiki,写一份项目复盘。

回答:
1. 这 7 天新增了哪些知识资产?
2. 哪些问题已经解决?
3. 哪些问题还没解决?
4. 哪些页面最重要?
5. 下一轮应该读什么资料?
6. AGENTS.md 需要怎么改?

这一步非常关键。

因为你不只是学了 AI Coding Agent。

你还学会了怎么用 LLM Wiki 学一个领域。


10. 最终验收清单

检查项是否完成
AGENTS.md[ ]
index.md[ ]
log.md[ ]
有 20 个 raw sources[ ]
每个 source 有 summary[ ]
有 concept pages[ ]
有 project pages[ ]
有 question pages[ ]
有至少 3 篇 synthesis[ ]
做过一次 lint[ ]
修过 P0[ ]
Git 至少 5 个 commit[ ]
能基于 Wiki 回答问题[ ]

如果这些都完成,这个项目达标。


11. 可复制的最终 master prompt

你是我的 LLM Wiki 维护者。

当前项目主题是:AI Coding Agent。

请按照 AGENTS.md 工作。

本轮目标:
1. 基于 index.md 理解当前 Wiki;
2. 检查 log.md 最近进展;
3. 告诉我当前最重要的 5 个概念;
4. 告诉我当前最重要的 5 个未解决问题;
5. 建议下一篇应该 ingest 的资料类型;
6. 不要修改文件,先给计划。

这个 prompt 以后可以作为每次学习开始前的 warm-up。


小结

这个完整项目把 LLM Wiki 的全部能力串起来:

  • 目录;
  • 规则;
  • ingest;
  • query;
  • lint;
  • Obsidian;
  • Git;
  • 搜索;
  • synthesis;
  • 复盘。

真正学会以后,你可以把主题换成任何东西:

  • AIOps;
  • Claude 生态;
  • Codex;
  • 投资研究;
  • 读一本书;
  • 做竞品分析;
  • 个人健康;
  • 团队知识库。

LLM Wiki 的本质不是“整理资料”。

它是一种学习新领域的方法:

让资料、问题、结论和维护动作都留在一个可演化的系统里。


参考资料