PageIndex:告别向量数据库,用推理定义RAG

lxiol
📝
过去两年,RAG(Retrieval-Augmented Generation,检索增强生成)几乎成了大模型落地方案的标配架构。核心流程人人耳熟能详:把文档切成小块、做向量嵌入、存入向量数据库、查询时用余弦相似度召回 Top-K 片段,最后喂给 LLM 生成答案

原文链接:https://mp.weixin.qq.com/s/uaPXknu-zYcFNiMJF4OKeg

过去两年,RAG(Retrieval-Augmented Generation,检索增强生成)几乎成了大模型落地方案的标配架构。核心流程人人耳熟能详:把文档切成小块、做向量嵌入、存入向量数据库、查询时用余弦相似度召回 Top-K 片段,最后喂给 LLM 生成答案。

但这条路正在暴露越来越多的结构性问题:

  • 切分破坏语义:一份 200 页的年报被切成 500 个 chunk,上下文关系被粗暴打断
  • 相似度 ≠ 相关性:向量空间中”语义接近”的片段未必是回答问题真正需要的内容
  • 黑盒检索:为什么召回了这 5 个 chunk 而不是另外 5 个?无法解释
  • 结构丢失:文档的目录、层级、章节关系在切分后荡然无存
  • 在金融、法律、医疗等对准确性要求极高的领域,这些问题尤为致命。

有没有可能,彻底不用向量数据库,也能做好 RAG?

Vectify AI 给出的答案是 PageIndex。

PageIndex 的核心思想是:像专家一样”翻书” (如图2所示,传统RAG VS PageIndex)

想象一下,一个金融分析师或律师需要从一份 200 页的年报中找到某个关键指标。他不会把年报撕成碎片然后随机翻找他会:

  • 1)先看目录,定位到相关章节
  • 2)翻到对应页面,确认标题和内容匹配
  • 3)如果章节太大,继续按子标题缩小范围
  • 4)最终精准定位到需要的段落

PageIndex 做的事情完全一样,只不过执行者从人类变成了 LLM(详细系统架构图见图3)。

它有三个核心设计原则:

  • 1)无向量:不做嵌入,不用向量数据库
  • 2 )无切分:保留文档原始结构,不切 chunk
  • 3)推理驱动:用 LLM 的逻辑推理能力导航文档层级

这带来了一个思考方向上的关键转变:检索不再是”计算距离”,而是像人类思考一样”做判断”。

更多有关PageIndex的内容可以查阅图4图5以及流程示例图6


💬 本文评论区已开启,但暂无读者留言。

本文转载自微信公众号,如有侵权请联系删除。

  • 标题: PageIndex:告别向量数据库,用推理定义RAG
  • 作者: lxiol
  • 创建于 : 2026-05-08 21:47:03
  • 更新于 : 2026-05-12 16:07:04
  • 链接: https://blog.lxiol.cn/2026/05/08/PageIndex告别向量数据库用推理定义RAG/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
目录
PageIndex:告别向量数据库,用推理定义RAG