PageIndex:告别向量数据库,用推理定义RAG
过去两年,RAG(Retrieval-Augmented Generation,检索增强生成)几乎成了大模型落地方案的标配架构。核心流程人人耳熟能详:把文档切成小块、做向量嵌入、存入向量数据库、查询时用余弦相似度召回 Top-K 片段,最后喂给 LLM 生成答案
过去两年,RAG(Retrieval-Augmented Generation,检索增强生成)几乎成了大模型落地方案的标配架构。核心流程人人耳熟能详:把文档切成小块、做向量嵌入、存入向量数据库、查询时用余弦相似度召回 Top-K 片段,最后喂给 LLM 生成答案。
但这条路正在暴露越来越多的结构性问题:
- 切分破坏语义:一份 200 页的年报被切成 500 个 chunk,上下文关系被粗暴打断
- 相似度 ≠ 相关性:向量空间中”语义接近”的片段未必是回答问题真正需要的内容
- 黑盒检索:为什么召回了这 5 个 chunk 而不是另外 5 个?无法解释
- 结构丢失:文档的目录、层级、章节关系在切分后荡然无存
- 在金融、法律、医疗等对准确性要求极高的领域,这些问题尤为致命。
有没有可能,彻底不用向量数据库,也能做好 RAG?
Vectify AI 给出的答案是 PageIndex。
PageIndex 的核心思想是:像专家一样”翻书” (如图2所示,传统RAG VS PageIndex)
想象一下,一个金融分析师或律师需要从一份 200 页的年报中找到某个关键指标。他不会把年报撕成碎片然后随机翻找他会:
- 1)先看目录,定位到相关章节
- 2)翻到对应页面,确认标题和内容匹配
- 3)如果章节太大,继续按子标题缩小范围
- 4)最终精准定位到需要的段落
PageIndex 做的事情完全一样,只不过执行者从人类变成了 LLM(详细系统架构图见图3)。
它有三个核心设计原则:
- 1)无向量:不做嵌入,不用向量数据库
- 2 )无切分:保留文档原始结构,不切 chunk
- 3)推理驱动:用 LLM 的逻辑推理能力导航文档层级
这带来了一个思考方向上的关键转变:检索不再是”计算距离”,而是像人类思考一样”做判断”。
更多有关PageIndex的内容可以查阅图4图5以及流程示例图6
💬 本文评论区已开启,但暂无读者留言。
本文转载自微信公众号,如有侵权请联系删除。
- 标题: PageIndex:告别向量数据库,用推理定义RAG
- 作者: lxiol
- 创建于 : 2026-05-08 21:47:03
- 更新于 : 2026-05-12 16:07:04
- 链接: https://blog.lxiol.cn/2026/05/08/PageIndex告别向量数据库用推理定义RAG/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。