Files
nexus/wiki/concepts/Defuddle.md

34 lines
1.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "Defuddle"
type: concept
tags: [obsidian, skills, web-scraping]
last_updated: 2026-04-21
---
## Definition
Defuddle 是 kepanoObsidian CEO发布的网页内容清洗工具专门将杂乱的网页 HTML 转换为纯净的 Markdown 格式,通过剔除广告、导航栏、侧边栏等干扰元素,保留核心正文内容。
## Key Features
- **纯净输出**:自动删除导航条、侧边栏和广告,只保留干净的 Markdown 内容
- **Token 节省**:大幅减少 AI 处理网页内容时的 Token 消耗
- **YouTube 支持**:最新版本支持 YouTube 视频链接,通过 YouTube 官方 API 获取字幕(而非 yt-dlp
- **AI 友好**:输出格式专为 AI 阅读和分析优化
## Usage
```text
提取这个网页的正文,转成干净的 Markdown 格式:[URL]
```
## Requirements
- Node.js 运行环境
- 全局安装:`npm install -g defuddle`
## Best Fit
- 标准 HTML 网页(新闻、博客、官方文档)
- 不适合:需要登录的页面、纯动态渲染的 SPA 应用
## Connections
- [[kepano]] — Defuddle 的发布者
- [[obsidian-必装-skills]] — 来源文档
- [[网页内容清洗]] — 同类工具概念