34 lines
1.2 KiB
Markdown
34 lines
1.2 KiB
Markdown
---
|
||
title: "Defuddle"
|
||
type: concept
|
||
tags: [obsidian, skills, web-scraping]
|
||
last_updated: 2026-04-21
|
||
---
|
||
|
||
## Definition
|
||
Defuddle 是 kepano(Obsidian CEO)发布的网页内容清洗工具,专门将杂乱的网页 HTML 转换为纯净的 Markdown 格式,通过剔除广告、导航栏、侧边栏等干扰元素,保留核心正文内容。
|
||
|
||
## Key Features
|
||
- **纯净输出**:自动删除导航条、侧边栏和广告,只保留干净的 Markdown 内容
|
||
- **Token 节省**:大幅减少 AI 处理网页内容时的 Token 消耗
|
||
- **YouTube 支持**:最新版本支持 YouTube 视频链接,通过 YouTube 官方 API 获取字幕(而非 yt-dlp)
|
||
- **AI 友好**:输出格式专为 AI 阅读和分析优化
|
||
|
||
## Usage
|
||
```text
|
||
提取这个网页的正文,转成干净的 Markdown 格式:[URL]
|
||
```
|
||
|
||
## Requirements
|
||
- Node.js 运行环境
|
||
- 全局安装:`npm install -g defuddle`
|
||
|
||
## Best Fit
|
||
- 标准 HTML 网页(新闻、博客、官方文档)
|
||
- 不适合:需要登录的页面、纯动态渲染的 SPA 应用
|
||
|
||
## Connections
|
||
- [[kepano]] — Defuddle 的发布者
|
||
- [[obsidian-必装-skills]] — 来源文档
|
||
- [[网页内容清洗]] — 同类工具概念
|