Files
nexus/wiki/concepts/向量嵌入.md
2026-04-17 20:17:28 +08:00

24 lines
911 B
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "向量嵌入"
type: concept
tags: [ai, data-processing]
last_updated: 2026-04-17
---
## Definition
将文本、图像或其他数据转换为固定维度的数值向量表示,使得语义相似的内容在向量空间中距离相近。
## Applications
- 语义搜索:用户输入自然语言查询,通过向量相似度找到相关内容
- 语义去重:计算两个文本的向量相似度,判断是否为重复内容
- 推荐系统:根据用户行为向量推荐相似内容
- 聚类分析:将相似文档自动归类
## Implementation
- 常用模型OpenAI Embedding、Sentence Transformers、BGE 等
- 存储方式向量数据库Pinecone、Milvus或 SQLite BLOB
- 相似度计算:余弦相似度、欧氏距离等
## Related
- [[语义去重]] — 利用向量嵌入实现的内容去重技术
- [[Second Brain]] — 使用向量嵌入实现的知识库语义搜索