58 lines
3.3 KiB
Markdown
58 lines
3.3 KiB
Markdown
---
|
||
title: "YouTube Content Pipeline"
|
||
type: source
|
||
tags: [youtube, content-automation, openclaw, cron-job, semantic-dedup]
|
||
date: 2026-04-22
|
||
---
|
||
|
||
## Source File
|
||
- [[Agent/usecases/youtube-content-pipeline]]
|
||
|
||
## Summary(用中文描述)
|
||
- 核心主题:AI Agent 驱动的 YouTube 内容发现与选题自动化流水线
|
||
- 问题域:每日 YouTube 创作者面临的信息过载、选题重复、趋势追踪困难等问题
|
||
- 方法/机制:定时 Cron Job + Web/X 搜索 + YouTube Analytics 查重 + SQLite 向量相似度去重 + Telegram 选题推送 + Slack 链接自动研究
|
||
- 结论/价值:实现选题发现、查重、推送的全链路自动化,创作者只需从 Telegram 选题即可
|
||
|
||
## Key Claims(用中文描述)
|
||
- Hourly Cron Job 扫描 Web + X/Twitter 的突发 AI 新闻,自动向 Telegram 推送选题
|
||
- 维护 90 天 YouTube 视频目录(含播放量和主题分析),避免重复覆盖同类选题
|
||
- SQLite 数据库存储所有选题及向量嵌入,通过语义相似度实现选题去重
|
||
- Slack 分享链接时,OpenClaw 自动研究主题、搜索 X 相关帖子、查询知识库,并创建带完整大纲的 Asana 任务卡
|
||
|
||
## Key Quotes
|
||
> "Finding fresh, timely video ideas across the web and X/Twitter is time-consuming. Tracking what you've already covered prevents duplicates and helps you stay ahead of trends." — 核心痛点阐述
|
||
> "Stores all pitches in a SQLite database with vector embeddings for semantic dedup (so you never get pitched the same idea twice)" — 技术选型亮点
|
||
|
||
## Key Concepts
|
||
- [[Semantic-Deduplication]]:通过向量嵌入(embedding)计算选题语义相似度,防止重复选题
|
||
- [[Cron-Job]]:定时任务驱动,每小时自动执行内容发现流程
|
||
- [[Knowledge-Base-RAG]]:检索增强生成,查询知识库辅助选题研究
|
||
- [[Content-Automation]]:内容创作全流程自动化,从发现到任务创建
|
||
- [[Vector-Embedding]]:将文本选题转为向量,实现语义层面精确去重
|
||
|
||
## Key Entities
|
||
- [[OpenClaw]]:核心 Agent 框架,编排所有工具(Web 搜索、X 搜索、知识库查询、Asana 集成)
|
||
- [[YouTube-Analytics]]:通过 `gog` CLI 获取频道播放量和视频主题分析
|
||
- [[Asana]]:项目管理工具,用于创建选题任务卡
|
||
- [[Telegram]]:选题推送渠道,通过专属 Topic 接收 AI 推送的选题
|
||
- [[SQLite]]:选题数据库,存储 timestamp/topic/embedding/sources
|
||
- [[X-Twitter]]:选题来源之一,搜索突发 AI 新闻和社区讨论
|
||
|
||
## Connections
|
||
- [[Daily-YouTube-Digest]] ← extends ← [[YouTube-Content-Pipeline]]
|
||
- Daily YouTube Digest 侧重于已有订阅频道的更新监控,本流水线侧重于全网突发新闻和趋势的主动发现
|
||
- [[Content-Factory]] ← shares_pattern ← [[YouTube-Content-Pipeline]]
|
||
- 同属多工具编排的自动化内容流水线,均使用子 Agent 并行执行模式
|
||
- [[Custom-Morning-Brief]] ← shares_pattern ← [[YouTube-Content-Pipeline]]
|
||
- 同属 Cron Job + Telegram 推送模式,但前者侧重综合信息简报,后者垂直于视频选题
|
||
|
||
## Contradictions
|
||
- 无已知冲突
|
||
|
||
## Setup Instructions Summary
|
||
1. 配置 Telegram Topic 作为选题接收渠道
|
||
2. 安装 knowledge-base skill 和 x-research skill
|
||
3. 创建 SQLite pitches 表(含 id/timestamp/topic/embedding/sources)
|
||
4. 向 OpenClaw 发送 prompt 指令,激活每小时 Cron Job
|