--- title: "向量嵌入" type: concept tags: [ai, data-processing] last_updated: 2026-04-17 --- ## Definition 将文本、图像或其他数据转换为固定维度的数值向量表示,使得语义相似的内容在向量空间中距离相近。 ## Applications - 语义搜索:用户输入自然语言查询,通过向量相似度找到相关内容 - 语义去重:计算两个文本的向量相似度,判断是否为重复内容 - 推荐系统:根据用户行为向量推荐相似内容 - 聚类分析:将相似文档自动归类 ## Implementation - 常用模型:OpenAI Embedding、Sentence Transformers、BGE 等 - 存储方式:向量数据库(Pinecone、Milvus)或 SQLite BLOB - 相似度计算:余弦相似度、欧氏距离等 ## Related - [[语义去重]] — 利用向量嵌入实现的内容去重技术 - [[Second Brain]] — 使用向量嵌入实现的知识库语义搜索