乐产功场丨薛利华:大模型已经很强了,为什么企业还是要做RAG?
2026-04-02 16:43阅读:
【编者注】很多人第一次听到
RAG,会把它理解成“给大模型接一个知识库”。可一进入真实业务,问题很快就变了:用户要的往往不只是一个听起来顺的答案,还要它贴合当前资料、贴合企业内部规则,最好还能说清依据。对产品经理、AI
产品经理来说,RAG
补的不只是模型会不会回答,而是模型能不能围绕外部资料,给出更稳、更贴业务的回答。
周一早上九点,新同事在群里问了一句:“差旅报销现在按新制度还是旧制度走?”这类问题看起来不复杂,资料也明明都在:邮箱里有通知,网盘里有
PDF,知识库里还有流程说明。可真把问题丢给一个普通聊天机器人时,很多人还是不敢直接照着它的回答去做。
原因很现实。它也许会把话说得很顺,甚至说得像那么回事,可它未必知道你们公司上个月刚更新过制度,也未必知道那份
PDF 里哪一段,才是这次判断真正该参考的依据。它能回答,离“
贴着你手里的资料回答”还差一层。这正是很多企业开始认真看 RAG 的起点。
大家真正要的,从来都不只是“能回答”,还包括“答得准、答得稳、答得贴着资料”。对产品经理来说,这件事尤其值得关注。因为一旦问题开始依赖资料、依赖版本、依赖规则,后面牵出来的就不只是模型能力,还会变成场景判断、数据边界、效果定义和验收口径。
RAG,到底是什么?
RAG,指的是 Retrieval-Augmented
Generation,通常译作“检索增强生成”。放到前台好理解一点,它就是让大模型在回答问题前,先去参考外部资料,再基于这些资料生成回答。这件事听起来像是多加了一步,真正重要的变化却不小。因为企业里的很多问题,本来就带着强烈的资料依赖。
员工问制度,客服查口径,销售找方案,培训新人问步骤,背后往往都不是“通用常识”,而是组织自己的规则、资料和版本。所以,RAG
真正补上的,是“围绕企业资料回答”的能力。
RAG
补了大模型哪块空白?
把这件事说得再直白一点,RAG 主要补了如下三块:
第一块,最新资料可见。模型再强,也很难天然知道你这周刚改过的制度、昨天刚更新的价格表、上个月刚迭代过的产品说明。可企业里的很多判断,偏偏就取决于这些最新资料。检索的意义,就在于把这些模型本身并不知道的内容,在回答前带进来。
第二块,私域资料可用。很多真正有价值的信息,并不在公开互联网上,而在企业自己的制度文档、客服话术、培训材料、历史工单、销售资料和项目记录里。没有把这些资料接进来,模型很难真正进入业务现场。
第三块,回答依据可追溯。很多时候,用户并不满足于“像是对的”,还希望知道“你是根据什么说的”。对企业来说,这一点非常关键,因为很多问题最终都要回到规则、文档和证据上。
你会发现,这三块连起来,真正改变的是回答的底子。模型给出的,不再只是一个语言上顺滑的答案,而是一个更有机会贴住资料、贴住版本、贴住企业规则的答案。
企业为什么会走到这一步?
很多团队最开始接触大模型时,兴奋点常常在“它终于会说了”。可一进入真实业务,焦点很快就会变成另一句话:它说得对不对,凭什么这么说,能不能稳定这么说。这也是为什么企业最后常常会走到
RAG。因为企业里大量高频问题,本质上都带着资料依赖。
比如一个新人在培训期问:“客户投诉升级后,超过 48
小时还没处理,该怎么流转?”再比如销售在出方案前问:“这个版本到底支不支持私有化部署?”这类问题都不难,难的是它们通常依赖当前口径、内部规则和最新版本。只靠模型的通用能力,很难让人真正放心。
这里还有一个很现实的取舍点。很多团队一开始会想把所有资料都接进来,直接做一个“全能助手”。真到落地时才发现,资料一多、版本一杂、场景一宽,问题反而更难收拾。更稳妥的做法,往往是先做边界清楚、资料相对干净、答案可验证的场景。
比如制度查询、培训问答、客服标准口径,这类问题更容易跑出第一轮效果。这个取舍很重要。它决定了 RAG
项目是从一开始就被复杂度拖住,还是先在一个可控范围里把价值做出来。
这和产品经理有什么关系?
很多人一听到 RAG,就习惯性把它归到算法、工程或者模型应用那一侧。可对产品经理来说,RAG
很早就该进入视野。因为一个 RAG
项目真正难的地方,往往不在“能不能接上知识库”,而在前面那一连串判断:这个问题值不值得做成问答产品,哪些资料应该进来,哪些资料暂时别进来,用户最常问的问题长什么样,什么叫答得准,什么叫答得稳,什么情况下应该拒答,什么情况下要把依据展示出来。这些判断,本身就是产品问题。
再往前走一步,产品经理看
RAG,至少要看见一条完整链路:用户问了什么,系统怎么理解,去哪里找资料,找回了什么,筛掉了什么,最后模型为什么会给出这个回答。
用户看到的可能只是一句话,产品经理要看到的却是一整条路径。所以,这篇文章真正想提醒的,并不是“RAG
这个名词你得知道”,而是:一旦你开始参与 AI
产品、知识问答、流程助手、培训助手这类项目,RAG
往往会变成你绕不过去的一步。
先问清三个问题,再谈要不要做
看到一个 RAG
需求时,我更建议先别急着进入“怎么做”,先问清如下三个问题:
第一,这个场景真的依赖外部资料吗?
如果一个问题主要靠模型通用能力就能解决,或者它本质上更偏流程执行、系统操作、规则编排,那它未必优先适合用
RAG 来切。
第二,这些资料真的值得接进来吗?
有资料,不等于有可用知识。版本混乱、口径冲突、结构混杂的资料,一旦直接喂进去,很可能会放大问题。
第三,用户要的究竟是一个答案,还是一个带依据的答案?
这两件事看上去很像,验收口径却完全不同。前者更看重表达和完成度,后者更看重资料命中、依据引用和结果可信度。
这三个问题问清楚了,RAG
才会从一个热词,变成一个值得推进的产品方向。
写在最后
RAG
真正重要的地方,不是多接了一层技术,而是让回答开始贴着企业资料发生。
看懂这一点后,下一步更关键的问题就来了:并不是所有问题都值得做
RAG。什么场景适合做,什么场景先别急着上,决定的不是技术热情,而是产品判断。下一篇,我们就接着把这件事拆开。
关键词:#RAG
#检索增强生成
#企业AI
#AI产品经理
#产品经理
#知识问答
#知识问答
#培训助手
#项目验收
#智能客服