--- title: "Data Distillation" type: concept tags: [distillation, model-compression, training, llm] aliases: [Data Distillation, 数据蒸馏, Knowledge Distillation] last_updated: 2025-12-20 --- ## Definition Data Distillation,数据蒸馏,利用高性能的大模型生成精简但有价值的数据,使一个小模型可以从中学习并逼近大模型的效果。 ## Key Facts - 核心思想:用大模型作为"教师"(Teacher),生成高质量训练数据 - 小模型(Student)从这些数据中学习 - 目标:以更低成本达到接近大模型的效果 - 是模型压缩和高效部署的重要技术手段 ## Connections - [[Large Language Model]] ← 教师模型 ← [[Data Distillation]] ## Sources - [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]