23 lines
823 B
Markdown
23 lines
823 B
Markdown
---
|
||
title: "Data Distillation"
|
||
type: concept
|
||
tags: [distillation, model-compression, training, llm]
|
||
aliases: [Data Distillation, 数据蒸馏, Knowledge Distillation]
|
||
last_updated: 2025-12-20
|
||
---
|
||
|
||
## Definition
|
||
Data Distillation,数据蒸馏,利用高性能的大模型生成精简但有价值的数据,使一个小模型可以从中学习并逼近大模型的效果。
|
||
|
||
## Key Facts
|
||
- 核心思想:用大模型作为"教师"(Teacher),生成高质量训练数据
|
||
- 小模型(Student)从这些数据中学习
|
||
- 目标:以更低成本达到接近大模型的效果
|
||
- 是模型压缩和高效部署的重要技术手段
|
||
|
||
## Connections
|
||
- [[Large Language Model]] ← 教师模型 ← [[Data Distillation]]
|
||
|
||
## Sources
|
||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|