百 AI 实战百科

Embedding（向量嵌入）

AI基础 · AI基础 / 向量 / RAG

一句话：把文字（或图片）转换成一串数字（向量），让机器能计算"两段内容语义上有多相似"，是搜索、推荐、RAG检索的基础技术。

它是什么

计算机没法直接理解文字的"意思"，但可以比较数字。Embedding技术把每段文字转换成一个多维向量（一串数字），语义相近的内容转换出的向量在数学上也会"靠得近"，这样就能用计算向量距离的方式实现语义搜索——不是简单的关键词匹配，而是理解意思上的相似。

适合干什么

搭建语义搜索/智能推荐功能
RAG系统里检索相关文档片段
判断两段文本内容是否语义相似

不适合干什么

简单的精确关键词匹配场景（不需要理解语义相似度，普通搜索/数据库查询就够）

普通人怎么用

不需要理解背后复杂的数学原理，只需要知道：把文字丢给Embedding模型能得到一串数字向量，两段文字的向量越"相似"（用余弦相似度等方法计算），说明它们语义上越接近。

进阶用户怎么用

选择合适的Embedding模型很重要，不同模型在不同语言、不同领域的效果有差异；向量生成后需要存到专门的向量数据库才能高效检索，普通数据库不擅长做大规模向量相似度计算。

常见误区

以为Embedding只能用于英文，实际现在有很多支持中文/多语言效果不错的Embedding模型
把Embedding和普通的关键词搜索混为一谈，Embedding能理解"含义相近但用词不同"的内容，这是它相比关键词匹配的核心优势

和相似工具的区别

和普通关键词搜索的区别：关键词搜索要求用词精确匹配，Embedding语义搜索能找到"意思相近但表述不同"的内容，比如搜"怎么退款"也能匹配到"退货流程说明"

入门步骤

选择一个Embedding模型（很多AI服务商都提供）
把你的文档内容转换成向量
存入向量数据库，实现语义检索