24 lines
911 B
Markdown
24 lines
911 B
Markdown
---
|
||
title: "向量嵌入"
|
||
type: concept
|
||
tags: [ai, data-processing]
|
||
last_updated: 2026-04-17
|
||
---
|
||
|
||
## Definition
|
||
将文本、图像或其他数据转换为固定维度的数值向量表示,使得语义相似的内容在向量空间中距离相近。
|
||
|
||
## Applications
|
||
- 语义搜索:用户输入自然语言查询,通过向量相似度找到相关内容
|
||
- 语义去重:计算两个文本的向量相似度,判断是否为重复内容
|
||
- 推荐系统:根据用户行为向量推荐相似内容
|
||
- 聚类分析:将相似文档自动归类
|
||
|
||
## Implementation
|
||
- 常用模型:OpenAI Embedding、Sentence Transformers、BGE 等
|
||
- 存储方式:向量数据库(Pinecone、Milvus)或 SQLite BLOB
|
||
- 相似度计算:余弦相似度、欧氏距离等
|
||
|
||
## Related
|
||
- [[语义去重]] — 利用向量嵌入实现的内容去重技术
|
||
- [[Second Brain]] — 使用向量嵌入实现的知识库语义搜索 |