RAG优化2 Chunk

文本切块是数据向量化存入向量数据库等核心优化部分。切的块不能太长,太长的块损失的语义信息较多,导致召回准确率较低,过长的召回文本也将限制放入

RAG文本召回模型

本文主要介绍RAG中文本召回的相关基础知识,和经典模型。 基础知识 召回环节中,需要使用文本向量检索模型 embedding模型来进行两个环节处理

RAG基础

LLM的缺陷–为什么需要RAG? 大模型的知识源于pretrain阶段输入的语料,对于时效性较近的问题,会出现答案错误或过时。(可