# PRD: 货代单证多系统自动录入工作台

> **版本：** v1（基于 ScoredDemand 初次生成）
> **时间：** 2026-05-12
> **评分：** 31/40 — BUILD

---

## 1. Problem & User

**目标用户：** 货代公司单证操作员与报关/船务录入人员，3-10 人小团队。

**核心痛点：** 一批货物需要把合同、发票、装箱单、草稿 SI 的字段重复录入到内部 Excel、客户门户、船司 SI 门户等多个系统。HS Code 只要错一位就触发海关查验，但跨单据比对靠人眼，返工率高，每位单证员每天花 1-2 小时在纯重复劳动上。

**用户痛言：** "字段重复录入，容易出错（HS Code 错一位会引发海关查验）"

**为什么现有方案不够：** CargoWise、RPA、ABBYY 等方案要么太贵/实施周期长，要么只做 OCR 识别而不做跨单据一致性校验，核心缺口是"识别 + 校验 + 多系统回填"一体化。

---

## 2. Target Outcome & KPIs

- **主要 KPI：** 单证员每票操作时间减少 ≥50%（目标：10 分钟 → 5 分钟）
- **次要 KPI：** 字段不一致错误率降至 <1%（对比人工基准 ~5%）
- **PLG 转化 KPI：** 14 天免费试用期内完成首次校验的用户，付费率 ≥25%

---

## 3. MVP Scope (In)

- 上传合同/发票/装箱单 PDF（最多 3 份同批）
- AI 自动提取核心字段：HS Code、品名、件数、毛重、净重、金额、箱数、收发货人
- 三栏对照视图，自动标红跨单据不一致字段
- 用户确认后导出标准化 CSV（适配内部录入）
- 一键生成"复制到 SI 模板"格式化文本块
- 基础订阅付费墙（每月免费额度：10 票，超出需付费）
- 邮箱登录 + 简单订阅管理

---

## 4. Out of Scope

- 真实 RPA 自动填写外部系统（复杂浏览器自动化）
- OCR 手写单据
- CargoWise/SAP 深度 API 集成
- 多角色权限体系
- 移动端 App

---

## 5. User Flow（Aha Moment 路径）

**注册后 5 分钟内触达价值：**

1. **注册** → 系统引导页："上传你的第一批单据"
2. **上传** 合同 PDF + 发票 PDF（拖拽，<30 秒）
3. **等待 ~60 秒** → 页面展示三栏对照视图，HS Code 不一致字段已标红
4. **Aha Moment：** 用户看到系统自动找出他们之前靠人眼才发现的不一致
5. **点击"导出 CSV"** → 下载已校验字段
6. **第 11 票** → 付费墙弹出："本月免费额度用完，升级继续使用"

---

## 6. Functional Requirements (P0)

**文件处理：**
- `POST /api/upload` — 接受多 PDF，返回任务 ID
- PDF 解析：调用 LLM API（GPT-4o / Claude）提取结构化字段
- 存储：Supabase `documents` + `extracted_fields` 表

**校验引擎：**
- 规则：同批文件中同一字段值必须一致（HS Code、收货人、毛重）
- 差异字段标记 `conflict: true`，前端标红显示

**导出：**
- `GET /api/export/:batch_id` — 返回 CSV
- "复制 SI 模板"按钮：生成格式化文本块（固定顺序：收发货人、品名、HS Code、件数、毛重、净重、金额、箱数）

**Onboarding（零人工介入）：**
- 注册完成 → 自动跳转演示数据页（预加载真实样本 PDF）
- 无需阅读文档即可看到系统如何运作

**付费墙：**
- 每账户每月免费处理 10 票（批次）
- 第 11 票触发 Stripe Checkout
- 触发后同步发送转化邮件："您的第 10 票刚处理完，升级解锁无限额度"

**自动化邮件序列：**
- Day 0：欢迎邮件 + 快速入门指南
- Day 3："您已处理 X 票，节省了约 Y 分钟"（数据驱动）
- 触碰付费墙时：即时升级引导邮件

---

## 7. Data Model（Minimal）

```
users(id, email, plan, monthly_count, stripe_customer_id, created_at)
batches(id, user_id, status, created_at)
documents(id, batch_id, filename, storage_path, doc_type)
extracted_fields(id, document_id, field_name, field_value, confidence)
conflicts(id, batch_id, field_name, doc_ids[], values[])
```

---

## 8. API/Integration Notes

- **LLM：** OpenAI GPT-4o（结构化输出模式），system prompt 包含字段定义和 HS Code 格式校验规则
- **存储：** Supabase Storage（PDF）+ Supabase DB（结构化数据）
- **支付：** Stripe Billing（月度订阅，¥299/月起）
- **邮件：** Resend API（事务邮件）

---

## 9. Acceptance Criteria

- [ ] `POST /api/upload`（3 PDF）→ 60 秒内返回提取结果，HS Code 准确率 ≥90%
- [ ] 三栏对照视图正确标红至少 1 处人工制造的不一致字段
- [ ] `GET /api/export/:id` → 返回有效 CSV，字段顺序固定
- [ ] 第 11 票 → Stripe Checkout 弹出，流程可完成
- [ ] 新用户注册 → 5 分钟内可看到演示数据的对照视图，无需额外操作

---

## 10. Delivery Plan

### Milestone 1（Day 1-2）：数据管道
**文件：**
- `app/api/upload/route.ts` — PDF 上传 + Supabase Storage
- `lib/extractor.ts` — LLM 字段提取逻辑（GPT-4o structured output）
- `lib/conflict-checker.ts` — 跨文件字段比对规则引擎
- `supabase/migrations/001_schema.sql` — users/batches/documents/extracted_fields/conflicts

**Exit Criteria：** `curl -X POST /api/upload` 上传 2 PDF → DB 中出现提取字段记录，至少含 HS Code 和收发货人

### Milestone 2（Day 3-5）：核心 UI
**文件：**
- `app/page.tsx` — 上传区 + 进度条
- `app/batch/[id]/page.tsx` — 三栏对照视图，冲突字段标红
- `app/batch/[id]/export/route.ts` — CSV 导出
- `components/ConflictBadge.tsx` — 冲突标记组件

**Exit Criteria：** 上传 3 PDF → 展示三栏对照，手动在发票中改动一个字段值后系统标红该字段 → 点击导出获得正确 CSV

### Milestone 3（Day 6-7）：PLG + 支付
**文件：**
- `app/api/stripe/checkout/route.ts` — Stripe Checkout Session
- `app/api/stripe/webhook/route.ts` — 订阅激活
- `lib/quota.ts` — 每月计数检查（10 票免费）
- `lib/email.ts` — Resend 邮件序列触发
- `app/onboarding/page.tsx` — 演示数据引导页

**Exit Criteria：** 模拟第 11 次上传 → Stripe Checkout 弹出 → 完成支付 → quota 重置 → 欢迎邮件发送成功

---

## 11. Risks & Mitigations

| 风险 | 缓解措施 |
|------|----------|
| LLM 提取 HS Code 不准确 | 加入 HS Code 格式校验（6-10 位数字）+ 置信度标注；低置信度字段要求用户确认 |
| PDF 格式差异大（扫描件） | MVP 只支持文字型 PDF，扫描件显示"暂不支持"并引导联系支持 |
| 用户不愿付费 | 免费额度设 10 票（足够评估价值），Day 3 邮件强调节省时间的数据 |
| 外部系统格式各异 | MVP 只做 CSV + 文本块，不做自动填写；路线图中加浏览器书签脚本 |

---

## 12. Chargeability Rationale

**免费版：** 每月 10 票处理额度，让单证员真实体验跨单据校验价值（每票节省约 5-10 分钟）。

**付费版（¥299/月起）：** 解锁无限票量 + 自定义字段映射模板 + 团队成员席位；对 3-10 人单证团队，每月减少 2-3 次海关查验返工即可覆盖订阅成本，ROI 明确。

**付费墙触发时机：** 第 11 票——用户已建立习惯、有真实数据积累，迁移成本远高于 ¥299/月订阅费。

