← AI 百科

Embedding(向量嵌入)

AI基础 · AI基础 / 向量 / RAG
一句话:把文字(或图片)转换成一串数字(向量),让机器能计算"两段内容语义上有多相似",是搜索、推荐、RAG检索的基础技术。

它是什么

计算机没法直接理解文字的"意思",但可以比较数字。Embedding技术把每段文字转换成一个多维向量(一串数字),语义相近的内容转换出的向量在数学上也会"靠得近",这样就能用计算向量距离的方式实现语义搜索——不是简单的关键词匹配,而是理解意思上的相似。

适合干什么

  • 搭建语义搜索/智能推荐功能
  • RAG系统里检索相关文档片段
  • 判断两段文本内容是否语义相似

不适合干什么

  • 简单的精确关键词匹配场景(不需要理解语义相似度,普通搜索/数据库查询就够)

普通人怎么用

不需要理解背后复杂的数学原理,只需要知道:把文字丢给Embedding模型能得到一串数字向量,两段文字的向量越"相似"(用余弦相似度等方法计算),说明它们语义上越接近。

进阶用户怎么用

选择合适的Embedding模型很重要,不同模型在不同语言、不同领域的效果有差异;向量生成后需要存到专门的向量数据库才能高效检索,普通数据库不擅长做大规模向量相似度计算。

常见误区

  • 以为Embedding只能用于英文,实际现在有很多支持中文/多语言效果不错的Embedding模型
  • 把Embedding和普通的关键词搜索混为一谈,Embedding能理解"含义相近但用词不同"的内容,这是它相比关键词匹配的核心优势

和相似工具的区别

  • 和普通关键词搜索的区别:关键词搜索要求用词精确匹配,Embedding语义搜索能找到"意思相近但表述不同"的内容,比如搜"怎么退款"也能匹配到"退货流程说明"

入门步骤

  • 选择一个Embedding模型(很多AI服务商都提供)
  • 把你的文档内容转换成向量
  • 存入向量数据库,实现语义检索