Auto-sync: 2026-04-17 20:17

This commit is contained in:
2026-04-17 20:17:28 +08:00
parent 52c143d5e4
commit 52f4a5acad
10 changed files with 267 additions and 2 deletions

View File

@@ -0,0 +1,24 @@
---
title: "向量嵌入"
type: concept
tags: [ai, data-processing]
last_updated: 2026-04-17
---
## Definition
将文本、图像或其他数据转换为固定维度的数值向量表示,使得语义相似的内容在向量空间中距离相近。
## Applications
- 语义搜索:用户输入自然语言查询,通过向量相似度找到相关内容
- 语义去重:计算两个文本的向量相似度,判断是否为重复内容
- 推荐系统:根据用户行为向量推荐相似内容
- 聚类分析:将相似文档自动归类
## Implementation
- 常用模型OpenAI Embedding、Sentence Transformers、BGE 等
- 存储方式向量数据库Pinecone、Milvus或 SQLite BLOB
- 相似度计算:余弦相似度、欧氏距离等
## Related
- [[语义去重]] — 利用向量嵌入实现的内容去重技术
- [[Second Brain]] — 使用向量嵌入实现的知识库语义搜索