用大模型做一个简单「文档问答助手」

wuwenzen@outlook.com (wuwj) — Sun, 30 Oct 2022 00:00:00 +0000

2022 年开始，大模型 API 越来越好用，大家最直觉的一个想法就是：

能不能把项目文档「喂给」模型，然后直接用自然语言问问题？

这篇文章记录的是一个从 0 到 1 的小 Demo：用大模型 API + 向量检索，实现一个能回答「我们自己文档」问题的小助手。

1. 目标和约束

目标很简单：

约束：

整体流程可以概括成：

用一张简图就是所谓的：RAG（检索增强生成）。

我们选用的文档源主要是：

预处理步骤：

简单示例：

{
  "docId": "fund-investor-miniapp",
  "title": "技术栈与整体架构",
  "content": "前端采用 Vue3 + uni-app...",
  "section": "2.1 技术栈",
  "index": 5
}

切分策略的小经验：