Files
nexus/wiki/sources/youtube-content-pipeline.md
2026-04-23 00:02:55 +08:00

58 lines
3.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "YouTube Content Pipeline"
type: source
tags: [youtube, content-automation, openclaw, cron-job, semantic-dedup]
date: 2026-04-22
---
## Source File
- [[Agent/usecases/youtube-content-pipeline]]
## Summary用中文描述
- 核心主题AI Agent 驱动的 YouTube 内容发现与选题自动化流水线
- 问题域:每日 YouTube 创作者面临的信息过载、选题重复、趋势追踪困难等问题
- 方法/机制:定时 Cron Job + Web/X 搜索 + YouTube Analytics 查重 + SQLite 向量相似度去重 + Telegram 选题推送 + Slack 链接自动研究
- 结论/价值:实现选题发现、查重、推送的全链路自动化,创作者只需从 Telegram 选题即可
## Key Claims用中文描述
- Hourly Cron Job 扫描 Web + X/Twitter 的突发 AI 新闻,自动向 Telegram 推送选题
- 维护 90 天 YouTube 视频目录(含播放量和主题分析),避免重复覆盖同类选题
- SQLite 数据库存储所有选题及向量嵌入,通过语义相似度实现选题去重
- Slack 分享链接时OpenClaw 自动研究主题、搜索 X 相关帖子、查询知识库,并创建带完整大纲的 Asana 任务卡
## Key Quotes
> "Finding fresh, timely video ideas across the web and X/Twitter is time-consuming. Tracking what you've already covered prevents duplicates and helps you stay ahead of trends." — 核心痛点阐述
> "Stores all pitches in a SQLite database with vector embeddings for semantic dedup (so you never get pitched the same idea twice)" — 技术选型亮点
## Key Concepts
- [[Semantic-Deduplication]]通过向量嵌入embedding计算选题语义相似度防止重复选题
- [[Cron-Job]]:定时任务驱动,每小时自动执行内容发现流程
- [[Knowledge-Base-RAG]]:检索增强生成,查询知识库辅助选题研究
- [[Content-Automation]]:内容创作全流程自动化,从发现到任务创建
- [[Vector-Embedding]]:将文本选题转为向量,实现语义层面精确去重
## Key Entities
- [[OpenClaw]]:核心 Agent 框架编排所有工具Web 搜索、X 搜索、知识库查询、Asana 集成)
- [[YouTube-Analytics]]:通过 `gog` CLI 获取频道播放量和视频主题分析
- [[Asana]]:项目管理工具,用于创建选题任务卡
- [[Telegram]]:选题推送渠道,通过专属 Topic 接收 AI 推送的选题
- [[SQLite]]:选题数据库,存储 timestamp/topic/embedding/sources
- [[X-Twitter]]:选题来源之一,搜索突发 AI 新闻和社区讨论
## Connections
- [[Daily-YouTube-Digest]] ← extends ← [[YouTube-Content-Pipeline]]
- Daily YouTube Digest 侧重于已有订阅频道的更新监控,本流水线侧重于全网突发新闻和趋势的主动发现
- [[Content-Factory]] ← shares_pattern ← [[YouTube-Content-Pipeline]]
- 同属多工具编排的自动化内容流水线,均使用子 Agent 并行执行模式
- [[Custom-Morning-Brief]] ← shares_pattern ← [[YouTube-Content-Pipeline]]
- 同属 Cron Job + Telegram 推送模式,但前者侧重综合信息简报,后者垂直于视频选题
## Contradictions
- 无已知冲突
## Setup Instructions Summary
1. 配置 Telegram Topic 作为选题接收渠道
2. 安装 knowledge-base skill 和 x-research skill
3. 创建 SQLite pitches 表(含 id/timestamp/topic/embedding/sources
4. 向 OpenClaw 发送 prompt 指令,激活每小时 Cron Job