<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>智能客服 on 文艺技术笔记</title>
        <link>https://wenyiblog.top/tags/%E6%99%BA%E8%83%BD%E5%AE%A2%E6%9C%8D/</link>
        <description>Recent content in 智能客服 on 文艺技术笔记</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh</language>
        <copyright>文艺技术笔记 | 软件工程师文艺</copyright>
        <lastBuildDate>Fri, 05 Jun 2026 10:00:00 +0800</lastBuildDate><atom:link href="https://wenyiblog.top/tags/%E6%99%BA%E8%83%BD%E5%AE%A2%E6%9C%8D/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>从零搭建智能客服：RAG &#43; LLM 实战指南</title>
        <link>https://wenyiblog.top/2026/06/rag-chatbot-guide/</link>
        <pubDate>Fri, 05 Jun 2026 10:00:00 +0800</pubDate>
        
        <guid>https://wenyiblog.top/2026/06/rag-chatbot-guide/</guid>
        <description>&lt;h2 id=&#34;为什么选-rag&#34;&gt;&lt;a href=&#34;#%e4%b8%ba%e4%bb%80%e4%b9%88%e9%80%89-rag&#34; class=&#34;header-anchor&#34;&gt;&lt;/a&gt;为什么选 RAG？
&lt;/h2&gt;&lt;p&gt;传统的对话机器人依赖规则匹配和意图分类，维护成本高且灵活性差。RAG（Retrieval-Augmented Generation）通过检索增强生成，让大模型能够基于企业知识库回答问题，既保持了 LLM 的泛化能力，又确保了回答的准确性。&lt;/p&gt;
&lt;h2 id=&#34;核心架构&#34;&gt;&lt;a href=&#34;#%e6%a0%b8%e5%bf%83%e6%9e%b6%e6%9e%84&#34; class=&#34;header-anchor&#34;&gt;&lt;/a&gt;核心架构
&lt;/h2&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-fallback&#34; data-lang=&#34;fallback&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;用户提问 → Embedding → 向量检索 → 相关知识 → Prompt 组装 → LLM 生成 → 回答
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id=&#34;1-知识库构建&#34;&gt;&lt;a href=&#34;#1-%e7%9f%a5%e8%af%86%e5%ba%93%e6%9e%84%e5%bb%ba&#34; class=&#34;header-anchor&#34;&gt;&lt;/a&gt;1. 知识库构建
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;文档清洗与分块（chunk_size: 500-1000 tokens）&lt;/li&gt;
&lt;li&gt;向量化存储（Milvus / Chroma / FAISS）&lt;/li&gt;
&lt;li&gt;元数据标注（来源、时间、置信度）&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id=&#34;2-检索策略&#34;&gt;&lt;a href=&#34;#2-%e6%a3%80%e7%b4%a2%e7%ad%96%e7%95%a5&#34; class=&#34;header-anchor&#34;&gt;&lt;/a&gt;2. 检索策略
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;混合检索：BM25 + 向量相似度&lt;/li&gt;
&lt;li&gt;重排序：Cross-Encoder 精排&lt;/li&gt;
&lt;li&gt;多路召回保证覆盖率&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id=&#34;3-prompt-设计要点&#34;&gt;&lt;a href=&#34;#3-prompt-%e8%ae%be%e8%ae%a1%e8%a6%81%e7%82%b9&#34; class=&#34;header-anchor&#34;&gt;&lt;/a&gt;3. Prompt 设计要点
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;角色设定 + 上下文限制 + 输出格式约束&lt;/li&gt;
&lt;li&gt;防止幻觉：添加&amp;quot;如果不确定请说不知道&amp;quot;&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;踩坑记录&#34;&gt;&lt;a href=&#34;#%e8%b8%a9%e5%9d%91%e8%ae%b0%e5%bd%95&#34; class=&#34;header-anchor&#34;&gt;&lt;/a&gt;踩坑记录
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;Chunk 太大：检索不精确；太小：上下文断裂&lt;/li&gt;
&lt;li&gt;Embedding 模型选择：中文推荐 BGE / M3E&lt;/li&gt;
&lt;li&gt;延迟优化：向量索引 + 缓存策略&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;blockquote&gt;
&lt;p&gt;💡 完整代码和部署脚本已开源，关注后续更新。&lt;/p&gt;
&lt;/blockquote&gt;
</description>
        </item>
        
    </channel>
</rss>
