nexus/wiki/concepts/数据蒸馏.md

---
title: "数据蒸馏"
type: concept
tags: [llm, model-compression]
last_updated: 2025-12-20
---

## 基本信息
- **全称**：Data Distillation
- **类型**：模型压缩技术
- **来源**：大模型相关术语和框架总结

## 定义
数据蒸馏是利用一个高性能的大模型生成精简但有价值的数据，使得一个小模型可以从中学习并逼近大模型的效果。

## 核心思想
- 大模型（Teacher）生成高质量合成数据
- 小模型（Student）从合成数据中学习
- 目标：用更少参数达到接近大模型的性能

## 应用场景
- 边缘设备部署（资源受限）
- 降低推理成本
- 特定领域模型快速训练

## 关联
- [[LLM]] ← Teacher 模型
- [[vLLM]] ← 推理优化

## Aliases
- Data Distillation
- 知识蒸馏
- 模型蒸馏