乐产功场丨薛利华：大模型已经很强了，为什么企业还是要做RAG？

2026-04-02 16:43阅读：

http://blog.sina.cn/dpool/blog/u/2663773803

【编者注】很多人第一次听到 RAG，会把它理解成“给大模型接一个知识库”。可一进入真实业务，问题很快就变了：用户要的往往不只是一个听起来顺的答案，还要它贴合当前资料、贴合企业内部规则，最好还能说清依据。对产品经理、AI 产品经理来说，RAG 补的不只是模型会不会回答，而是模型能不能围绕外部资料，给出更稳、更贴业务的回答。

周一早上九点，新同事在群里问了一句：“差旅报销现在按新制度还是旧制度走？”这类问题看起来不复杂，资料也明明都在：邮箱里有通知，网盘里有 PDF，知识库里还有流程说明。可真把问题丢给一个普通聊天机器人时，很多人还是不敢直接照着它的回答去做。

原因很现实。它也许会把话说得很顺，甚至说得像那么回事，可它未必知道你们公司上个月刚更新过制度，也未必知道那份 PDF 里哪一段，才是这次判断真正该参考的依据。它能回答，离“

贴着你手里的资料回答”还差一层。这正是很多企业开始认真看 RAG 的起点。

大家真正要的，从来都不只是“能回答”，还包括“答得准、答得稳、答得贴着资料”。对产品经理来说，这件事尤其值得关注。因为一旦问题开始依赖资料、依赖版本、依赖规则，后面牵出来的就不只是模型能力，还会变成场景判断、数据边界、效果定义和验收口径。

RAG，到底是什么？

RAG，指的是 Retrieval-Augmented Generation，通常译作“检索增强生成”。放到前台好理解一点，它就是让大模型在回答问题前，先去参考外部资料，再基于这些资料生成回答。这件事听起来像是多加了一步，真正重要的变化却不小。因为企业里的很多问题，本来就带着强烈的资料依赖。
员工问制度，客服查口径，销售找方案，培训新人问步骤，背后往往都不是“通用常识”，而是组织自己的规则、资料和版本。所以，RAG 真正补上的，是“围绕企业资料回答”的能力。

RAG 补了大模型哪块空白？

把这件事说得再直白一点，RAG 主要补了如下三块：
第一块，最新资料可见。模型再强，也很难天然知道你这周刚改过的制度、昨天刚更新的价格表、上个月刚迭代过的产品说明。可企业里的很多判断，偏偏就取决于这些最新资料。检索的意义，就在于把这些模型本身并不知道的内容，在回答前带进来。
第二块，私域资料可用。很多真正有价值的信息，并不在公开互联网上，而在企业自己的制度文档、客服话术、培训材料、历史工单、销售资料和项目记录里。没有把这些资料接进来，模型很难真正进入业务现场。
第三块，回答依据可追溯。很多时候，用户并不满足于“像是对的”，还希望知道“你是根据什么说的”。对企业来说，这一点非常关键，因为很多问题最终都要回到规则、文档和证据上。
你会发现，这三块连起来，真正改变的是回答的底子。模型给出的，不再只是一个语言上顺滑的答案，而是一个更有机会贴住资料、贴住版本、贴住企业规则的答案。

企业为什么会走到这一步？

很多团队最开始接触大模型时，兴奋点常常在“它终于会说了”。可一进入真实业务，焦点很快就会变成另一句话：它说得对不对，凭什么这么说，能不能稳定这么说。这也是为什么企业最后常常会走到 RAG。因为企业里大量高频问题，本质上都带着资料依赖。
比如一个新人在培训期问：“客户投诉升级后，超过 48 小时还没处理，该怎么流转？”再比如销售在出方案前问：“这个版本到底支不支持私有化部署？”这类问题都不难，难的是它们通常依赖当前口径、内部规则和最新版本。只靠模型的通用能力，很难让人真正放心。
这里还有一个很现实的取舍点。很多团队一开始会想把所有资料都接进来，直接做一个“全能助手”。真到落地时才发现，资料一多、版本一杂、场景一宽，问题反而更难收拾。更稳妥的做法，往往是先做边界清楚、资料相对干净、答案可验证的场景。
比如制度查询、培训问答、客服标准口径，这类问题更容易跑出第一轮效果。这个取舍很重要。它决定了 RAG 项目是从一开始就被复杂度拖住，还是先在一个可控范围里把价值做出来。

这和产品经理有什么关系？

很多人一听到 RAG，就习惯性把它归到算法、工程或者模型应用那一侧。可对产品经理来说，RAG 很早就该进入视野。因为一个 RAG 项目真正难的地方，往往不在“能不能接上知识库”，而在前面那一连串判断：这个问题值不值得做成问答产品，哪些资料应该进来，哪些资料暂时别进来，用户最常问的问题长什么样，什么叫答得准，什么叫答得稳，什么情况下应该拒答，什么情况下要把依据展示出来。这些判断，本身就是产品问题。
再往前走一步，产品经理看 RAG，至少要看见一条完整链路：用户问了什么，系统怎么理解，去哪里找资料，找回了什么，筛掉了什么，最后模型为什么会给出这个回答。
用户看到的可能只是一句话，产品经理要看到的却是一整条路径。所以，这篇文章真正想提醒的，并不是“RAG 这个名词你得知道”，而是：一旦你开始参与 AI 产品、知识问答、流程助手、培训助手这类项目，RAG 往往会变成你绕不过去的一步。

先问清三个问题，再谈要不要做

看到一个 RAG 需求时，我更建议先别急着进入“怎么做”，先问清如下三个问题：
第一，这个场景真的依赖外部资料吗？

如果一个问题主要靠模型通用能力就能解决，或者它本质上更偏流程执行、系统操作、规则编排，那它未必优先适合用 RAG 来切。
第二，这些资料真的值得接进来吗？

有资料，不等于有可用知识。版本混乱、口径冲突、结构混杂的资料，一旦直接喂进去，很可能会放大问题。
第三，用户要的究竟是一个答案，还是一个带依据的答案？

这两件事看上去很像，验收口径却完全不同。前者更看重表达和完成度，后者更看重资料命中、依据引用和结果可信度。
这三个问题问清楚了，RAG 才会从一个热词，变成一个值得推进的产品方向。

写在最后

RAG 真正重要的地方，不是多接了一层技术，而是让回答开始贴着企业资料发生。
看懂这一点后，下一步更关键的问题就来了：并不是所有问题都值得做 RAG。什么场景适合做，什么场景先别急着上，决定的不是技术热情，而是产品判断。下一篇，我们就接着把这件事拆开。
关键词：#RAG #检索增强生成 #企业AI #AI产品经理 #产品经理 #知识问答 #知识问答 #培训助手 #项目验收 #智能客服

举报/Report

我的更多文章

下载客户端阅读体验更佳