# 三个系统培训资料三天学习与报告产出方案

## 改写后的需求

我有 3 个系统的 Markdown 培训资料，分别放在 3 个目录中，目录下可能有多级子目录。我希望用 Trae 这类编码 AI 工具，在 3 天内快速完成资料梳理、知识库搭建、学习路线图生成和学习报告输出。请给我一个可执行方案，包括目录结构、AI 提示词、每日计划、产出物和验证标准。

我主要把原需求里的“学习完”“建立知识库”“学习路线图”等抽象目标，改成了可交付成果：资料索引、分层摘要、知识库、学习路线图、学习报告、验证问题集。

## 结论

不要先“认真读完”，要先让 AI 帮你做“结构化压缩”。执行时建议全程使用 Trae 的 Builder 模式，而不是普通 Chat 模式，让它能读取本地工作区、运行终端命令、写入 Markdown 文件。

三天内最有效的做法是：

1. 第 1 天：把所有 Markdown 文档变成可导航知识库。
2. 第 2 天：基于知识库生成学习路线图、重点概念、问答题。
3. 第 3 天：按路线图快速学习，并产出学习报告。

核心不是让 Trae 替你“看一遍”，而是让它帮你完成：

- 文档盘点
- 内容去重
- 系统模块拆解
- 重点概念提取
- 学习路径排序
- 交叉对比
- 报告生成
- 自测题生成

## 一、推荐目录结构

假设你有三个系统目录：

```text
training-materials/
├── system-a/
│   ├── README.md
│   └── xxx.md
├── system-b/
│   └── ...
└── system-c/
    └── ...
```

建议让 Trae 帮你生成一个学习工作区：

```text
learning-workspace/
├── source/
│   ├── system-a/
│   ├── system-b/
│   └── system-c/
├── output/
│   ├── 00-document-inventory.md
│   ├── 01-system-overview.md
│   ├── 02-knowledge-base/
│   │   ├── system-a.md
│   │   ├── system-b.md
│   │   ├── system-c.md
│   │   ├── shared-concepts.md
│   │   └── glossary.md
│   ├── 03-learning-roadmap.md
│   ├── 04-qa-bank.md
│   ├── 05-risk-and-unknowns.md
│   └── 06-learning-report.md
└── scripts/
    ├── scan_markdown.py
    ├── split_markdown.py
    └── build_index.py
```

如果资料量不是特别大，甚至可以不用复杂 RAG，先做静态 Markdown 知识库就够了。

## 二、让 Trae 先做文档盘点

最快方式有两种：

- 优先方案：在 Trae Builder 中直接让它使用终端命令扫描目录，例如 `find`、`tree`、`wc`。
- 稳定方案：让 Trae 生成一个 Python 脚本，后续可重复运行。

如果只是一次性学习，优先用 Builder 直接扫描；如果资料后续会持续更新，再写脚本。

### Prompt 1A：用 Builder 直接扫描资料目录

```text
请在 Trae Builder 模式下处理当前工作区。

请使用终端命令扫描 ./source/ 目录，要求：

1. 递归列出所有 .md 文件；
2. 统计每个文件的字数或字符数；
3. 按 system-a、system-b、system-c 三个系统分组；
4. 生成目录树；
5. 估算每个系统的阅读时间，按每分钟 500 中文字估算；
6. 将结果写入 output/00-document-inventory.md。

注意：只扫描和统计，不要总结正文内容。
```

### Prompt 1B：生成可重复运行的扫描脚本

```text
你是一个资深技术文档分析助手。

我有三个系统的培训资料，都是 Markdown 文件，目录如下：

- ./source/system-a/
- ./source/system-b/
- ./source/system-c/

请帮我写一个 Python 脚本 scripts/scan_markdown.py，要求：

1. 递归扫描三个目录下所有 .md 文件；
2. 输出每个文件的：
   - 系统名
   - 相对路径
   - 一级标题
   - 二级标题列表
   - 字数
   - 预估阅读时间，按每分钟 500 中文字估算；
3. 生成 output/00-document-inventory.md；
4. 不引入第三方依赖，只使用 Python 标准库；
5. 代码需要有类型注解；
6. 脚本运行命令为：

python scripts/scan_markdown.py

请直接生成完整代码。
```

先用这个脚本知道资料规模。

你需要看到类似结果：

```text
系统 A：23 篇，约 8.5 万字，预计阅读 170 分钟
系统 B：15 篇，约 5.1 万字，预计阅读 102 分钟
系统 C：31 篇，约 12.3 万字，预计阅读 246 分钟
总计：69 篇，约 25.9 万字，预计阅读 518 分钟
```

这一步很关键，因为它决定你后面是“通读”还是“压缩学习”。

## 三、让 Trae 建立知识库，不要直接让它写报告

不要一上来就说“帮我写学习报告”。那样容易得到空泛总结。

正确顺序是：

```text
文档清单 → 单文档摘要 → 系统级摘要 → 跨系统对比 → 学习路线图 → 自测题 → 学习报告
```

## 四、知识库生成 Prompt

### Prompt 2：生成系统级知识库

```text
你是企业培训资料分析助手。

请基于 ./source/system-a/ 下的 Markdown 文档，生成 output/02-knowledge-base/system-a.md。

重要限制：不要一次性读取整个系统目录后直接生成最终文档。请分批次处理：

1. 先读取 README、目录说明、概览类文档，生成系统大纲；
2. 再按子目录逐批读取文档，提取模块、流程、操作步骤、风险点；
3. 每批处理后先更新中间笔记；
4. 全部批次完成后，再按下面模板生成最终 system-a.md；
5. 如果某个系统超过 5 万字，必须按子目录分批处理，不要强行压缩。

要求：

1. 不要逐篇堆砌摘要，要按知识结构重新组织；
2. 输出结构如下：

# System A 知识库

## 1. 系统定位
说明这个系统解决什么问题，面向什么用户或业务场景。

## 2. 核心模块
按模块列出：
- 模块名
- 作用
- 输入
- 输出
- 关键流程
- 涉及文档路径

## 3. 核心业务流程
用步骤描述主要流程。

## 4. 关键概念
以术语表形式列出：
- 概念
- 解释
- 出现在哪些文档

## 5. 操作步骤 / 使用方法
整理所有可执行操作流程。

## 6. 常见问题
整理文档中出现的问题、限制、注意事项。

## 7. 学习优先级
按 P0/P1/P2 分类：
- P0：必须先掌握
- P1：正常掌握
- P2：了解即可

## 8. 未明确或需要人工确认的问题
列出文档中表达不清、互相矛盾、缺少上下文的地方。

要求：
- 每个重要结论都标注文档来源路径；
- 不要编造文档中没有的信息；
- 如果资料不足，明确写“资料未说明”；
- 如果内容过长，请分步骤写入文件，不要为了单次输出而压缩关键细节；
- 生成后抽样选择 1 篇 P0 原文，与知识库对应段落比对，检查是否遗漏关键参数、边界条件或操作步骤。
```

分别对三个系统执行：

```text
system-a.md
system-b.md
system-c.md
```

## 五、生成跨系统对比

### Prompt 3：三个系统横向对比

```text
请基于以下三个知识库文件：

- output/02-knowledge-base/system-a.md
- output/02-knowledge-base/system-b.md
- output/02-knowledge-base/system-c.md

生成 output/02-knowledge-base/shared-concepts.md。

要求输出：

# 三个系统横向对比

## 1. 三个系统分别解决什么问题

## 2. 三个系统的共同概念
例如：用户、权限、任务、流程、配置、数据同步、审批、告警等。

## 3. 三个系统的差异点
从以下角度对比：
- 业务目标
- 使用角色
- 核心流程
- 数据对象
- 操作方式
- 风险点

## 4. 三个系统之间可能的上下游关系
如果文档未明确说明，请标记为“推测”，不要当成事实。

## 5. 最适合的学习顺序
说明为什么先学哪个，再学哪个。

## 6. 学习时最容易混淆的概念
用列表说明。
```

## 六、生成三天学习路线图

### Prompt 4：学习路线图

```text
请基于 output/02-knowledge-base/ 下的知识库文档，生成 output/03-learning-roadmap.md。

目标：让我在 3 天内快速掌握三个系统，并能写出学习报告。

要求：

1. 每天安排上午、下午、晚上三个阶段；
2. 每个阶段明确：
   - 学习目标
   - 需要阅读的知识库章节
   - 需要回看哪些原始文档
   - 输出物
   - 自测问题
3. 不要平均分配时间，要按重要性排序；
4. 优先学习：
   - 系统定位
   - 核心流程
   - 操作步骤
   - 关键概念
   - 风险点
5. 输出最后要包含：
   - 三天后应该掌握什么
   - 哪些内容可以暂时跳过
   - 哪些问题需要向业务或系统负责人确认
```

## 七、三天实际执行计划

### Day 1：建立全局地图

目标：不是深入学习，而是知道“有哪些内容、系统怎么分层”。

产出：

- `00-document-inventory.md`
- `01-system-overview.md`
- `system-a.md`
- `system-b.md`
- `system-c.md`

你当天应该完成：

1. 扫描所有 Markdown 文件；
2. 让 Trae 生成三个系统的知识库；
3. 人工快速检查：
   - 有没有漏文件；
   - AI 是否乱编；
   - 核心模块是否合理；
   - 重要结论是否带原文路径；
4. 抽样校验：每个系统至少挑 1 篇 P0 长文，对照 AI 知识库，确认没有漏掉关键参数、边界条件、字段定义、操作步骤；
5. 标出 P0 内容。

Day 1 验收标准：

```text
我能用 5 分钟说清楚：
- 三个系统分别是什么；
- 每个系统的核心模块是什么；
- 哪些文档必须读；
- 哪些文档可以后读。
```

### Day 2：按路线图学习核心内容

目标：掌握主流程、关键概念和操作方法。

产出：

- `03-learning-roadmap.md`
- `04-qa-bank.md`
- `05-risk-and-unknowns.md`

Day 2 做法：

1. 按 P0 内容学习；
2. 每学完一个系统，让 Trae 生成 10 个自测题；
3. 自己先答，再让 Trae 对照知识库批改；
4. 对不懂的内容回到原始 Markdown；
5. 把不明确的地方放进 `05-risk-and-unknowns.md`。

### Prompt 5：生成自测题

```text
请基于 output/02-knowledge-base/system-a.md 生成 10 道自测题。

要求：
1. 包含：
   - 3 道概念题
   - 3 道流程题
   - 2 道场景题
   - 2 道风险/注意事项题
2. 每道题给出标准答案；
3. 答案必须引用知识库中的章节或原始文档路径；
4. 不要出文档中没有依据的问题。
```

Day 2 验收标准：

```text
我能不看原文回答：
- 每个系统的核心流程；
- 每个系统的关键术语；
- 常见操作步骤；
- 哪些地方容易出错。
```

### Day 3：输出学习报告

目标：不是复述文档，而是形成“我已经理解了什么、还能怎么用”。

产出：

- `06-learning-report.md`

报告建议结构：

```markdown
# 三个系统培训资料学习报告

## 1. 学习背景

## 2. 学习资料范围
- 系统 A
- 系统 B
- 系统 C
- 文档数量
- 总体阅读范围

## 3. 三个系统总体认识

## 4. 系统 A 学习总结
### 4.1 系统定位
### 4.2 核心模块
### 4.3 核心流程
### 4.4 关键操作
### 4.5 风险点和注意事项

## 5. 系统 B 学习总结

## 6. 系统 C 学习总结

## 7. 三个系统横向对比

## 8. 我已经掌握的内容

## 9. 仍需确认的问题

## 10. 后续学习计划
```

### Prompt 6：生成最终学习报告

```text
请基于以下文件生成 output/06-learning-report.md：

- output/00-document-inventory.md
- output/02-knowledge-base/system-a.md
- output/02-knowledge-base/system-b.md
- output/02-knowledge-base/system-c.md
- output/02-knowledge-base/shared-concepts.md
- output/03-learning-roadmap.md
- output/04-qa-bank.md
- output/05-risk-and-unknowns.md

要求：

1. 这是正式学习报告，不是简单摘要；
2. 语气专业、简洁；
3. 报告要体现我已经完成了系统性学习；
4. 每个系统都要包含：
   - 系统定位
   - 核心模块
   - 核心流程
   - 关键操作
   - 风险点
5. 必须包含“三个系统横向对比”；
6. 必须包含“仍需确认的问题”；
7. 不要编造资料中没有的信息；
8. 对资料未说明的内容明确写“文档未说明”；
9. 输出 Markdown 格式。
```

## 八、Trae 使用策略

你应该把 Trae 当成“文档处理流水线生成器”，而不是单纯聊天工具。

推荐用法：

### 1. 先让 Trae 写脚本

让它帮你：

- 扫描 Markdown
- 提取标题
- 统计字数
- 拆分大文件
- 生成文档索引
- 检查断链
- 合并摘要

### 2. 再让 Trae 基于文件生成知识库

不要一次性塞所有文档，让它按系统处理。

### 3. 所有 AI 输出必须带来源路径

否则学习报告容易虚。

要求它统一使用：

```text
来源：source/system-a/xxx/yyy.md
```

### 4. 所有“不确定内容”单独沉淀

不要让 AI 把推测写成事实。

统一放入：

```text
output/05-risk-and-unknowns.md
```

### 5. 使用 Builder 模式而非普通 Chat 模式

请全程在 Trae 的 Builder 模式下操作，并允许它读取和写入当前工作区文件。Builder 可以直接执行终端命令、扫描目录、读取 Markdown、生成输出文件，比单纯聊天更适合这个任务。

### 6. 防输入截断：按目录分批处理

当某个系统的资料超过 5 万字，或者 Markdown 文件超过 20 个时，不要一次性要求 Trae “读取全部文件并总结”。改用递进式提示词：

```text
现在开始处理系统 A。请先读取 source/system-a/核心架构/ 下的文档并总结备用，完成后写入 output/tmp/system-a-核心架构-notes.md。不要生成最终知识库。
```

然后逐个子目录处理，最后再让 Trae 基于 `output/tmp/` 的中间笔记生成 `system-a.md`。

### 7. 防输出截断：要求分步写入文件

执行大模块生成时，例如 `system-a.md` 或 `06-learning-report.md`，在 Prompt 末尾追加：

```text
如果内容过长，请分步骤写入目标 Markdown 文件。不要为了单次输出完整而压缩关键细节。每完成一部分，请说明已写入哪些章节和下一步继续写哪些章节。
```

### 8. 快速纠偏：先审一个样本再批量生成

不要等三个系统知识库都生成完才检查。每个系统先选一个 P0 文档做样本，让 Trae 生成局部摘要，然后人工检查：

- 是否保留了关键字段、参数、限制条件；
- 是否引用了原文路径；
- 是否把推测当成事实；
- 是否遗漏操作步骤。

样本通过后，再批量处理该系统的其他目录。


## 九、最小可行方案：如果时间很紧

如果只有三天，别做复杂系统。

最低限度只做 6 个文件：

```text
output/
├── 00-document-inventory.md
├── system-a-summary.md
├── system-b-summary.md
├── system-c-summary.md
├── 03-learning-roadmap.md
└── 06-learning-report.md
```

流程：

```text
扫描文档 → 三个系统摘要 → 路线图 → 自测题 → 报告
```

不要一开始就搞：

- 向量数据库
- Web UI
- 复杂 RAG
- 多 Agent 自动化
- 知识图谱
- 数据库检索系统

三天目标是“快速掌握并形成报告”，不是建设长期知识平台。

## 十、最终验收标准

三天结束时，你至少应该有这些成果：

```text
必须有：
- 文档清单
- 三个系统知识库
- 三天学习路线图
- 自测题库
- 学习报告

最好有：
- 术语表
- 横向对比
- 待确认问题清单
- 原文引用路径
```

真正要达到的能力是：

```text
1. 能说清三个系统分别干什么；
2. 能说清每个系统的核心模块和主流程；
3. 能完成基础操作说明；
4. 能识别关键风险点；
5. 能写出结构化学习报告；
6. 能列出还需要向负责人确认的问题。
```

建议：第一天不要读细节，先用 Trae 把资料压缩成结构化知识库；第二天按 P0/P1 学；第三天写报告和查缺补漏。