Auto-sync: 2026-04-17 20:17
This commit is contained in:
24
wiki/concepts/向量嵌入.md
Normal file
24
wiki/concepts/向量嵌入.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "向量嵌入"
|
||||
type: concept
|
||||
tags: [ai, data-processing]
|
||||
last_updated: 2026-04-17
|
||||
---
|
||||
|
||||
## Definition
|
||||
将文本、图像或其他数据转换为固定维度的数值向量表示,使得语义相似的内容在向量空间中距离相近。
|
||||
|
||||
## Applications
|
||||
- 语义搜索:用户输入自然语言查询,通过向量相似度找到相关内容
|
||||
- 语义去重:计算两个文本的向量相似度,判断是否为重复内容
|
||||
- 推荐系统:根据用户行为向量推荐相似内容
|
||||
- 聚类分析:将相似文档自动归类
|
||||
|
||||
## Implementation
|
||||
- 常用模型:OpenAI Embedding、Sentence Transformers、BGE 等
|
||||
- 存储方式:向量数据库(Pinecone、Milvus)或 SQLite BLOB
|
||||
- 相似度计算:余弦相似度、欧氏距离等
|
||||
|
||||
## Related
|
||||
- [[语义去重]] — 利用向量嵌入实现的内容去重技术
|
||||
- [[Second Brain]] — 使用向量嵌入实现的知识库语义搜索
|
||||
Reference in New Issue
Block a user