Files
nexus/wiki/concepts/向量嵌入.md
2026-04-17 20:17:28 +08:00

911 B
Raw Blame History

title, type, tags, last_updated
title type tags last_updated
向量嵌入 concept
ai
data-processing
2026-04-17

Definition

将文本、图像或其他数据转换为固定维度的数值向量表示,使得语义相似的内容在向量空间中距离相近。

Applications

  • 语义搜索:用户输入自然语言查询,通过向量相似度找到相关内容
  • 语义去重:计算两个文本的向量相似度,判断是否为重复内容
  • 推荐系统:根据用户行为向量推荐相似内容
  • 聚类分析:将相似文档自动归类

Implementation

  • 常用模型OpenAI Embedding、Sentence Transformers、BGE 等
  • 存储方式向量数据库Pinecone、Milvus或 SQLite BLOB
  • 相似度计算:余弦相似度、欧氏距离等
  • 语义去重 — 利用向量嵌入实现的内容去重技术
  • Second Brain — 使用向量嵌入实现的知识库语义搜索