写给工程师的 PRD
好的 PRD 不是写给老板看的汇报,而是写给工程师用的行动指南。
你将学到
- AI 产品 PRD 与传统 PRD 的 5 个关键差异
- 完整的 AI 功能 PRD 模板(6 个必填章节)
- 让工程师抓狂的 4 种反面写法及改进方案
- 可直接复用的 PRD Checklist
为什么 AI 产品的 PRD 不一样
传统 PRD 的问题:只说"做什么",不说"怎么判断做好了"。
AI 产品额外需要:
- 模型选型约束:用什么模型、允许多大的成本
- 输入/输出规格:精确定义用户输入格式 + 期望的 AI 输出结构
- 质量标准:什么叫"回答好",用什么指标衡量
- 降级方案:AI 不可用/回答差时,产品如何兜底
- Prompt 草稿:PM 写初稿,工程师优化(而不是让工程师从零猜)
检查理解
如果你的 PRD 里只有"用户输入问题,AI 生成回答",工程师会问你哪 3 个问题?
点击查看答案
- 输入规格:最多多少字?支持什么格式?有没有必填字段?
- 输出规格:返回什么格式?有没有长度限制?必须包含什么内容?
- 质量标准:什么叫"回答好"?用什么指标衡量?上线标准是什么?
完整 PRD 模板(可直接复用)
一、背景与目标
## 背景
[用 1-2 句话说清楚:为什么要做这个功能?当前用户的什么痛点?]
## 目标
- 用户目标:[用户通过这个功能能做到什么]
- 业务目标:[对应什么业务指标,如留存率 / 完成率 / 收入]
- 不做什么:[明确排除的范围,防止 scope creep]二、功能描述
## 用户旅程
1. 用户进入 [页面/入口]
2. 触发条件:[用户做了什么操作]
3. AI 处理:[调用什么能力,预期耗时]
4. 呈现结果:[以什么形式展示给用户]
5. 后续操作:[用户可以对结果做什么]
## 输入规格
- 最大长度:[X Token / X 字]
- 支持格式:[纯文本 / Markdown / 带附件]
- 必填/选填字段:[列清楚]
## 输出规格
- 格式:[纯文本 / Markdown / 结构化 JSON]
- 最大长度:[限制或不限制]
- 必须包含的内容:[如"必须包含来源引用"]
- 不能包含的内容:[如"不能包含品牌名称"]三、技术约束(⚠️ AI 产品必填)
## 模型要求
- 推荐模型:[如 Claude 3.5 Sonnet / GPT-4o-mini]
- 备选模型:[如主模型不可用时]
- 禁用模型:[如某些合规要求禁用特定供应商]
## 性能要求
- 首字响应时间(TTFT):< X 秒
- 完整响应时间:< X 秒
- 并发量:峰值 X QPS
## 成本约束
- 单次调用 Token 上限:[输入 X + 输出 Y]
- 月度 API 成本预算:[¥X / $X]
- 超出预算时的降级策略:[切换小模型 / 限流 / 关闭功能]
## 上下文长度
- 需要保留多少轮历史对话:[X 轮 / X Token]
- 超出时如何截断:[删最早 / 压缩摘要 / 提示用户]四、Prompt 草稿(⚠️ PM 必须提供)
## System Prompt 草稿
你是一个 [角色描述]。你的任务是 [核心任务]。
规则:
1. [必须遵守的规则]
2. [输出格式要求]
3. [边界情况处理]
## 输出格式示例
[给出 1-2 个期望的输出示例,越具体越好]
## 反面示例(不希望输出的)
[给出 1-2 个不希望出现的输出,说明原因]五、质量标准与评估
## 成功标准
| 指标 | 当前基线 | 目标值 | 衡量方法 |
|------|---------|--------|---------|
| 用户满意度(👍 率) | - | > 80% | 功能内反馈按钮 |
| 完成率(生成结果不为空) | - | > 95% | 后端日志 |
| 平均响应时间 | - | < 5s | APM 监控 |
## AB 测试方案
- 实验组:[新功能]
- 对照组:[现有体验 / 不做 AI]
- 流量比例:[10% / 50%]
- 观测周期:[2 周]
- 成功判定:[指标 A 提升 X%,指标 B 不下降]六、降级与边界处理
## 降级方案
| 场景 | 触发条件 | 处理方式 |
|------|---------|---------|
| API 不可用 | 连续失败 3 次 | 展示静态兜底文案,报警 |
| 响应超时 | > 30s | 提示"生成失败,请重试" |
| 内容安全拦截 | 敏感词触发 | 提示"无法处理此请求" |
| Token 超限 | 输入过长 | 提示用户缩短输入 |
| 质量过差 | 置信度 < X | 展示"AI 不确定,建议人工确认" |反面案例:让工程师抓狂的 PRD 写法
❌ 案例 1:模糊的质量要求
错误写法:
"AI 回答要准确、有用、符合用户期望"
工程师的困惑:不知道怎么测试、不知道上线标准是什么。
正确写法:
"对于用户输入的产品相关问题,AI 回答的正确率(与人工标注答案对比)> 85%,通过 100 道测试集验证后上线"
为什么这样写更好:
- ✅ 有明确的指标(正确率 > 85%)
- ✅ 有验证方法(100 道测试集)
- ✅ 有上线标准(通过测试集验证)
❌ 案例 2:没有输出格式规定
错误写法:
"AI 生成一份简历优化建议"
工程师实现后的问题:有时候输出是 Markdown,有时候是纯文本,前端展示一团乱。
正确写法:
"输出固定为 Markdown 格式,包含以下 3 个段落:
- 整体评价(3 句话)
- 改进建议(3-5 条 bullet)
- 修改示例(1 个完整段落的修改前后对比)"
为什么这样写更好:
- ✅ 明确格式(Markdown)
- ✅ 明确结构(3 个段落)
- ✅ 明确每部分的长度和形式
实战建议
在 PRD 里直接给出 2-3 个输出示例,比文字描述更清楚。工程师可以直接用示例做测试。
❌ 案例 3:让工程师猜 Prompt
错误写法:
"做一个 AI 面试官,能模拟真实面试场景"
工程师的困惑:面试官是什么类型的?问什么问题?怎么追问?评分标准是什么?
正确写法: 提供完整 System Prompt 草稿 + 3 个对话示例 + 明确说明几种面试官风格的差异
示例:
## System Prompt 草稿
你是一位资深的前端工程师面试官,正在面试候选人的 React 技能。
面试流程:
1. 先问 1-2 个基础概念题(如 React Hooks 原理)
2. 根据回答质量,追问 1-2 个深入问题
3. 最后给出评分(1-5 分)和改进建议
评分标准:
- 5 分:概念清晰 + 能举实际案例 + 知道最佳实践
- 3 分:概念基本正确但不够深入
- 1 分:概念错误或答非所问
## 对话示例
[提供 3 个完整的面试对话示例]为什么这样写更好:
- ✅ PM 承担了 Prompt 设计的初稿工作
- ✅ 工程师可以直接测试和优化
- ✅ 减少了来回沟通的成本
❌ 案例 4:没有降级方案
错误写法:
"API 调用失败的情况工程师处理"
上线后的问题:API 挂了,工程师不知道展示什么,临时写了一行"系统错误",用户投诉率飙升。
正确写法: 在 PRD 里明确每种失败场景的用户侧文案和处理逻辑
| 场景 | 触发条件 | 用户看到的文案 | 后续操作 |
|---|---|---|---|
| API 不可用 | 连续失败 3 次 | "AI 服务暂时不可用,请稍后重试" | 展示静态兜底内容 + 报警 |
| 响应超时 | > 30s | "生成时间过长,请重试或简化输入" | 允许用户重试 |
| 内容安全拦截 | 敏感词触发 | "抱歉,无法处理此请求" | 不展示任何 AI 输出 |
为什么这样写更好:
- ✅ 工程师知道每种情况该展示什么
- ✅ 用户体验一致
- ✅ 减少上线后的紧急修复
常见误区
不要把降级方案留给工程师"自由发挥"。降级文案是产品体验的一部分,必须由 PM 定义。
互动练习
场景:你要做一个"AI 生成周报"功能。
请用上面的模板,写出以下 3 个关键部分:
- 输入规格
- 输出规格
- 质量标准
查看参考答案
输入规格
- 格式:纯文本,支持换行
- 长度:最少 50 字,最多 2000 字
- 必填字段:本周完成的工作(至少 1 项)
- 选填字段:遇到的问题、下周计划
输出规格
- 格式:Markdown
- 结构:
- 本周工作总结(3-5 句话)
- 关键成果(3-5 条 bullet)
- 问题与解决方案(如果输入中有问题,则生成此部分)
- 下周计划(3 条 bullet)
- 长度:500-1000 字
- 禁止内容:不能包含"我觉得"、"可能"等不确定表述
质量标准
| 指标 | 目标值 | 衡量方法 |
|---|---|---|
| 用户满意度(👍 率) | > 75% | 功能内反馈按钮 |
| 完成率(生成结果不为空) | > 98% | 后端日志 |
| 平均响应时间 | < 8s | APM 监控 |
| 人工修改率 | < 30% | 用户编辑行为埋点 |
快速参考:AI 功能 PRD Checklist
在提交 PRD 给工程师之前,用这个清单检查:
基础信息
- [ ] 背景和目标(包含不做什么)
- [ ] 完整用户旅程(5 步以上)
输入输出规格
- [ ] 输入规格(格式、长度限制、必填/选填字段)
- [ ] 输出规格(格式、长度、必含/禁含内容)
- [ ] 输出示例(至少 2 个正面示例 + 1 个反面示例)
技术约束
- [ ] 模型选型(首选 + 备选 + 禁用)
- [ ] 性能要求(TTFT < X 秒、完整响应时间 < Y 秒)
- [ ] 成本约束(Token 上限、月度预算)
- [ ] 上下文长度(保留多少轮历史、如何截断)
Prompt 设计
- [ ] System Prompt 草稿(包含角色、任务、规则)
- [ ] 输出格式示例(具体到段落结构)
- [ ] 边界情况处理(如何拒绝不当请求)
质量与评估
- [ ] 质量指标(至少 3 个可量化指标)
- [ ] 评估方案(测试集 / AB 测试)
- [ ] 上线标准(明确的通过条件)
降级与兜底
- [ ] 完整降级方案(至少覆盖 API 不可用、超时、内容安全 3 种场景)
- [ ] 每种场景的用户侧文案
- [ ] 降级触发条件和恢复机制
经验法则
如果你的 PRD 少于 3 页,很可能遗漏了关键信息。AI 功能的 PRD 通常需要 5-8 页才能写清楚。
检查点
在继续之前,确保你能回答:
- [ ] 能说出 AI 产品 PRD 与传统 PRD 的 5 个关键差异
- [ ] 能用模板写出一个完整的 AI 功能 PRD(包含 6 个章节)
- [ ] 能识别并改进 4 种常见的错误写法
- [ ] 能用 Checklist 检查自己的 PRD 是否完整