Files
nexus/wiki/concepts/精确去重.md

29 lines
892 B
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
id: 精确去重
title: "精确去重"
type: concept
tags: [照片整理, dedup, md5]
last_updated: 2026-04-15
---
## Definition
通过 MD5 哈希比对,只删除内容完全相同的文件,保留任一有差异的版本。
## Core Mechanism
- 对每个文件计算 MD5 哈希值
- 哈希相同 → 内容相同 → 可安全删除
- 哈希不同 → 至少有一个 bit 不同 → 保留
- 适用于同一照片多设备备份、网盘同步等场景产生的完全重复副本
## Key Properties
- 零误删MD5 碰撞概率极低,可认为是内容完全相同的充分条件
- 可追溯:保留 To-Be-Deleted 目录而非直接删除
## Related Concepts
- [[小文件清理]]:另一种照片整理策略
- [[安全删除]]:删除操作的前置保护机制
- [[分批执行]]:大规模去重的执行策略
## Sources
- [[养虾日记1-OpenClaw照片整理实战]]