写给工程师的 PRD

好的 PRD 不是写给老板看的汇报，而是写给工程师用的行动指南。

你将学到

AI 产品 PRD 与传统 PRD 的 5 个关键差异
完整的 AI 功能 PRD 模板（6 个必填章节）
让工程师抓狂的 4 种反面写法及改进方案
可直接复用的 PRD Checklist

为什么 AI 产品的 PRD 不一样

传统 PRD 的问题：只说"做什么"，不说"怎么判断做好了"。
AI 产品额外需要：

模型选型约束：用什么模型、允许多大的成本
输入/输出规格：精确定义用户输入格式 + 期望的 AI 输出结构
质量标准：什么叫"回答好"，用什么指标衡量
降级方案：AI 不可用/回答差时，产品如何兜底
Prompt 草稿：PM 写初稿，工程师优化（而不是让工程师从零猜）

检查理解

如果你的 PRD 里只有"用户输入问题，AI 生成回答"，工程师会问你哪 3 个问题？

点击查看答案

输入规格：最多多少字？支持什么格式？有没有必填字段？
输出规格：返回什么格式？有没有长度限制？必须包含什么内容？
质量标准：什么叫"回答好"？用什么指标衡量？上线标准是什么？

完整 PRD 模板（可直接复用）

一、背景与目标

markdown

## 背景
[用 1-2 句话说清楚：为什么要做这个功能？当前用户的什么痛点？]

## 目标
- 用户目标：[用户通过这个功能能做到什么]
- 业务目标：[对应什么业务指标，如留存率 / 完成率 / 收入]
- 不做什么：[明确排除的范围，防止 scope creep]

二、功能描述

markdown

## 用户旅程
1. 用户进入 [页面/入口]
2. 触发条件：[用户做了什么操作]
3. AI 处理：[调用什么能力，预期耗时]
4. 呈现结果：[以什么形式展示给用户]
5. 后续操作：[用户可以对结果做什么]

## 输入规格
- 最大长度：[X Token / X 字]
- 支持格式：[纯文本 / Markdown / 带附件]
- 必填/选填字段：[列清楚]

## 输出规格
- 格式：[纯文本 / Markdown / 结构化 JSON]
- 最大长度：[限制或不限制]
- 必须包含的内容：[如"必须包含来源引用"]
- 不能包含的内容：[如"不能包含品牌名称"]

三、技术约束（⚠️ AI 产品必填）

markdown

## 模型要求
- 推荐模型：[如 Claude 3.5 Sonnet / GPT-4o-mini]
- 备选模型：[如主模型不可用时]
- 禁用模型：[如某些合规要求禁用特定供应商]

## 性能要求
- 首字响应时间（TTFT）：< X 秒
- 完整响应时间：< X 秒
- 并发量：峰值 X QPS

## 成本约束
- 单次调用 Token 上限：[输入 X + 输出 Y]
- 月度 API 成本预算：[￥X / $X]
- 超出预算时的降级策略：[切换小模型 / 限流 / 关闭功能]

## 上下文长度
- 需要保留多少轮历史对话：[X 轮 / X Token]
- 超出时如何截断：[删最早 / 压缩摘要 / 提示用户]

四、Prompt 草稿（⚠️ PM 必须提供）

markdown

## System Prompt 草稿
你是一个 [角色描述]。你的任务是 [核心任务]。

规则：
1. [必须遵守的规则]
2. [输出格式要求]
3. [边界情况处理]

## 输出格式示例
[给出 1-2 个期望的输出示例，越具体越好]

## 反面示例（不希望输出的）
[给出 1-2 个不希望出现的输出，说明原因]

五、质量标准与评估

markdown

## 成功标准
| 指标 | 当前基线 | 目标值 | 衡量方法 |
|------|---------|--------|---------|
| 用户满意度（👍 率） | - | > 80% | 功能内反馈按钮 |
| 完成率（生成结果不为空） | - | > 95% | 后端日志 |
| 平均响应时间 | - | < 5s | APM 监控 |

## AB 测试方案
- 实验组：[新功能]
- 对照组：[现有体验 / 不做 AI]
- 流量比例：[10% / 50%]
- 观测周期：[2 周]
- 成功判定：[指标 A 提升 X%，指标 B 不下降]

六、降级与边界处理

markdown

## 降级方案
| 场景 | 触发条件 | 处理方式 |
|------|---------|---------|
| API 不可用 | 连续失败 3 次 | 展示静态兜底文案，报警 |
| 响应超时 | > 30s | 提示"生成失败，请重试" |
| 内容安全拦截 | 敏感词触发 | 提示"无法处理此请求" |
| Token 超限 | 输入过长 | 提示用户缩短输入 |
| 质量过差 | 置信度 < X | 展示"AI 不确定，建议人工确认" |

反面案例：让工程师抓狂的 PRD 写法

❌ 案例 1：模糊的质量要求

错误写法：

"AI 回答要准确、有用、符合用户期望"

工程师的困惑：不知道怎么测试、不知道上线标准是什么。

正确写法：

"对于用户输入的产品相关问题，AI 回答的正确率（与人工标注答案对比）> 85%，通过 100 道测试集验证后上线"

为什么这样写更好：

✅ 有明确的指标（正确率 > 85%）
✅ 有验证方法（100 道测试集）
✅ 有上线标准（通过测试集验证）

❌ 案例 2：没有输出格式规定

错误写法：

"AI 生成一份简历优化建议"

工程师实现后的问题：有时候输出是 Markdown，有时候是纯文本，前端展示一团乱。

正确写法：

"输出固定为 Markdown 格式，包含以下 3 个段落：
整体评价（3 句话）
改进建议（3-5 条 bullet）
修改示例（1 个完整段落的修改前后对比）"

为什么这样写更好：

✅ 明确格式（Markdown）
✅ 明确结构（3 个段落）
✅ 明确每部分的长度和形式

实战建议

在 PRD 里直接给出 2-3 个输出示例，比文字描述更清楚。工程师可以直接用示例做测试。

❌ 案例 3：让工程师猜 Prompt

错误写法：

"做一个 AI 面试官，能模拟真实面试场景"

工程师的困惑：面试官是什么类型的？问什么问题？怎么追问？评分标准是什么？

正确写法：提供完整 System Prompt 草稿 + 3 个对话示例 + 明确说明几种面试官风格的差异

示例：

markdown

## System Prompt 草稿
你是一位资深的前端工程师面试官，正在面试候选人的 React 技能。

面试流程：
1. 先问 1-2 个基础概念题（如 React Hooks 原理）
2. 根据回答质量，追问 1-2 个深入问题
3. 最后给出评分（1-5 分）和改进建议

评分标准：
- 5 分：概念清晰 + 能举实际案例 + 知道最佳实践
- 3 分：概念基本正确但不够深入
- 1 分：概念错误或答非所问

## 对话示例
[提供 3 个完整的面试对话示例]

为什么这样写更好：

✅ PM 承担了 Prompt 设计的初稿工作
✅ 工程师可以直接测试和优化
✅ 减少了来回沟通的成本

❌ 案例 4：没有降级方案

错误写法：

"API 调用失败的情况工程师处理"

上线后的问题：API 挂了，工程师不知道展示什么，临时写了一行"系统错误"，用户投诉率飙升。

正确写法：在 PRD 里明确每种失败场景的用户侧文案和处理逻辑

场景	触发条件	用户看到的文案	后续操作
API 不可用	连续失败 3 次	"AI 服务暂时不可用，请稍后重试"	展示静态兜底内容 + 报警
响应超时	> 30s	"生成时间过长，请重试或简化输入"	允许用户重试
内容安全拦截	敏感词触发	"抱歉，无法处理此请求"	不展示任何 AI 输出

为什么这样写更好：

✅ 工程师知道每种情况该展示什么
✅ 用户体验一致
✅ 减少上线后的紧急修复

常见误区

不要把降级方案留给工程师"自由发挥"。降级文案是产品体验的一部分，必须由 PM 定义。

互动练习

场景：你要做一个"AI 生成周报"功能。

请用上面的模板，写出以下 3 个关键部分：

输入规格
输出规格
质量标准

查看参考答案

输入规格

格式：纯文本，支持换行
长度：最少 50 字，最多 2000 字
必填字段：本周完成的工作（至少 1 项）
选填字段：遇到的问题、下周计划

输出规格

格式：Markdown
结构：
1. 本周工作总结（3-5 句话）
2. 关键成果（3-5 条 bullet）
3. 问题与解决方案（如果输入中有问题，则生成此部分）
4. 下周计划（3 条 bullet）
长度：500-1000 字
禁止内容：不能包含"我觉得"、"可能"等不确定表述

质量标准

指标	目标值	衡量方法
用户满意度（👍 率）	> 75%	功能内反馈按钮
完成率（生成结果不为空）	> 98%	后端日志
平均响应时间	< 8s	APM 监控
人工修改率	< 30%	用户编辑行为埋点

快速参考：AI 功能 PRD Checklist

在提交 PRD 给工程师之前，用这个清单检查：

基础信息

[ ] 背景和目标（包含不做什么）
[ ] 完整用户旅程（5 步以上）

输入输出规格

[ ] 输入规格（格式、长度限制、必填/选填字段）
[ ] 输出规格（格式、长度、必含/禁含内容）
[ ] 输出示例（至少 2 个正面示例 + 1 个反面示例）

技术约束

[ ] 模型选型（首选 + 备选 + 禁用）
[ ] 性能要求（TTFT < X 秒、完整响应时间 < Y 秒）
[ ] 成本约束（Token 上限、月度预算）
[ ] 上下文长度（保留多少轮历史、如何截断）

Prompt 设计

[ ] System Prompt 草稿（包含角色、任务、规则）
[ ] 输出格式示例（具体到段落结构）
[ ] 边界情况处理（如何拒绝不当请求）

质量与评估

[ ] 质量指标（至少 3 个可量化指标）
[ ] 评估方案（测试集 / AB 测试）
[ ] 上线标准（明确的通过条件）

降级与兜底

[ ] 完整降级方案（至少覆盖 API 不可用、超时、内容安全 3 种场景）
[ ] 每种场景的用户侧文案
[ ] 降级触发条件和恢复机制

经验法则

如果你的 PRD 少于 3 页，很可能遗漏了关键信息。AI 功能的 PRD 通常需要 5-8 页才能写清楚。

检查点

在继续之前，确保你能回答：

[ ] 能说出 AI 产品 PRD 与传统 PRD 的 5 个关键差异
[ ] 能用模板写出一个完整的 AI 功能 PRD（包含 6 个章节）
[ ] 能识别并改进 4 种常见的错误写法
[ ] 能用 Checklist 检查自己的 PRD 是否完整

写给工程师的 PRD ​

你将学到 ​

为什么 AI 产品的 PRD 不一样 ​

完整 PRD 模板（可直接复用） ​

一、背景与目标 ​

二、功能描述 ​

三、技术约束（⚠️ AI 产品必填） ​

四、Prompt 草稿（⚠️ PM 必须提供） ​

五、质量标准与评估 ​

六、降级与边界处理 ​

反面案例：让工程师抓狂的 PRD 写法 ​

❌ 案例 1：模糊的质量要求 ​

❌ 案例 2：没有输出格式规定 ​

❌ 案例 3：让工程师猜 Prompt ​

❌ 案例 4：没有降级方案 ​

互动练习 ​

输入规格 ​

输出规格 ​

质量标准 ​

快速参考：AI 功能 PRD Checklist ​

基础信息 ​

输入输出规格 ​

技术约束 ​

Prompt 设计 ​

质量与评估 ​

降级与兜底 ​

检查点 ​

延伸阅读 ​

写给工程师的 PRD

你将学到

为什么 AI 产品的 PRD 不一样

完整 PRD 模板（可直接复用）

一、背景与目标

二、功能描述

三、技术约束（⚠️ AI 产品必填）

四、Prompt 草稿（⚠️ PM 必须提供）

五、质量标准与评估

六、降级与边界处理

反面案例：让工程师抓狂的 PRD 写法

❌ 案例 1：模糊的质量要求

❌ 案例 2：没有输出格式规定

❌ 案例 3：让工程师猜 Prompt

❌ 案例 4：没有降级方案

互动练习

输入规格

输出规格

质量标准

快速参考：AI 功能 PRD Checklist

基础信息

输入输出规格

技术约束

Prompt 设计

质量与评估

降级与兜底

检查点

延伸阅读