Auto-sync: update nexus workspace
This commit is contained in:
@@ -1,28 +1,29 @@
|
||||
---
|
||||
title: "Alex Ewerlöf"
|
||||
type: entity
|
||||
tags: []
|
||||
sources: []
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
# Alex Ewerlöf
|
||||
|
||||
## 基本信息
|
||||
- **角色**:资深Staff Engineer(27年经验),KTH(瑞典皇家理工学院)系统工程硕士
|
||||
- **专注领域**:Reliability Engineering(可靠性工程)+ Resilient Architecture(弹性架构)
|
||||
- **LLM专攻时间**:2023年起
|
||||
- **个人网站**:alexewerlof.com
|
||||
|
||||
## 核心观点
|
||||
- 反对拟人化LLM,主张将LLM视为分布式系统中不可靠的组件
|
||||
- 强调架构约束(而非提示词约束)是提升AI系统可靠性的关键
|
||||
- 借鉴人类协作系统(军队、公司、国家)的反馈回路与制衡机制设计多智能体系统
|
||||
|
||||
## 主要著作
|
||||
- [[multi-agent-system-reliability]]:《Multi-Agent System Reliability》,2023-01-09
|
||||
- SRE系列博客
|
||||
|
||||
## Aliases
|
||||
- Alex Ewerlof
|
||||
- A. Ewerlöf
|
||||
---
|
||||
title: "Alex Ewerlöf"
|
||||
type: entity
|
||||
tags: []
|
||||
sources:
|
||||
- multi-agent-system-reliability
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
# Alex Ewerlöf
|
||||
|
||||
## 基本信息
|
||||
- **角色**:资深Staff Engineer(27年经验),KTH(瑞典皇家理工学院)系统工程硕士
|
||||
- **专注领域**:Reliability Engineering(可靠性工程)+ Resilient Architecture(弹性架构)
|
||||
- **LLM专攻时间**:2023年起
|
||||
- **个人网站**:alexewerlof.com
|
||||
|
||||
## 核心观点
|
||||
- 反对拟人化LLM,主张将LLM视为分布式系统中不可靠的组件
|
||||
- 强调架构约束(而非提示词约束)是提升AI系统可靠性的关键
|
||||
- 借鉴人类协作系统(军队、公司、国家)的反馈回路与制衡机制设计多智能体系统
|
||||
|
||||
## 主要著作
|
||||
- [[multi-agent-system-reliability]]:《Multi-Agent System Reliability》,2023-01-09
|
||||
- SRE系列博客
|
||||
|
||||
## Aliases
|
||||
- Alex Ewerlof
|
||||
- A. Ewerlöf
|
||||
|
||||
24
wiki/entities/Brightdata.md
Normal file
24
wiki/entities/Brightdata.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "Brightdata"
|
||||
type: entity
|
||||
tags: [web-scraper, paid, service]
|
||||
sources: [我的工具集]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Overview
|
||||
Brightdata 是一个付费的网页数据抓取平台,提供企业级的 Web Scraper 服务。
|
||||
|
||||
## Aliases
|
||||
- Brightdata
|
||||
- brightdata.com
|
||||
|
||||
## Role in Sources
|
||||
在 [[我的工具集]] 中作为 Web-Scraper(网页抓取)服务的提供商。
|
||||
|
||||
## Capabilities
|
||||
- Web-Scraper:网页数据抓取工具
|
||||
- 企业级数据采集解决方案
|
||||
|
||||
## Pricing
|
||||
付费服务
|
||||
27
wiki/entities/Decopy.md
Normal file
27
wiki/entities/Decopy.md
Normal file
@@ -0,0 +1,27 @@
|
||||
---
|
||||
title: "Decopy"
|
||||
type: entity
|
||||
tags: [ai-summary, service, youtube, video]
|
||||
sources: [我的工具集]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Overview
|
||||
Decopy 是一个 AI 摘要生成工具,支持对文章、PDF 和视频进行快速摘要。
|
||||
|
||||
## Aliases
|
||||
- Decopy
|
||||
- decopy.ai
|
||||
|
||||
## Role in Sources
|
||||
在 [[我的工具集]] 中作为 AI-Summary 服务的提供商,支持多摘要模式、思维导图和多语言输出。
|
||||
|
||||
## Capabilities
|
||||
- AI Summary Generator:AI 摘要生成
|
||||
- 支持文章、PDF 和视频摘要
|
||||
- 多种摘要模式
|
||||
- 思维导图生成
|
||||
- 多语言输出
|
||||
|
||||
## Pricing
|
||||
免费/免费增值模式
|
||||
@@ -2,7 +2,7 @@
|
||||
title: "DeepSeek"
|
||||
type: entity
|
||||
tags: [AI, LLM, 中国科技]
|
||||
last_updated: 2025-12-18
|
||||
last_updated: 2026-01-01
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
|
||||
28
wiki/entities/Google AI Studio.md
Normal file
28
wiki/entities/Google AI Studio.md
Normal file
@@ -0,0 +1,28 @@
|
||||
---
|
||||
title: "Google AI Studio"
|
||||
type: entity
|
||||
tags: [AI工具, 分镜生成, 视频分析]
|
||||
last_updated: 2026-03-15
|
||||
---
|
||||
|
||||
## Aliases
|
||||
- AI Studio
|
||||
- Google AI Studio
|
||||
|
||||
## Description
|
||||
Google AI Studio 是Google提供的AI开发平台,在AI短视频制作流程中用于分析视频链接并自动生成九宫格分镜描述。
|
||||
|
||||
## Use Cases in Video Production
|
||||
1. **视频分析**:输入装修视频链接,让模型分析视频逻辑
|
||||
2. **分镜生成**:自动生成九个分镜描述,确保:
|
||||
- 摄像机机位固定
|
||||
- 场景顺序清晰
|
||||
- 阶段明确
|
||||
3. **图像裁剪**:自动检测三乘三大图并裁剪为九张竖屏图
|
||||
|
||||
## Related Tools
|
||||
- [[九宫格法]]:基于Google AI Studio生成的分析结果进行图像生成
|
||||
- [[分镜拆解]]:Google AI Studio在此流程中负责将视频逻辑转化为分镜语言
|
||||
|
||||
## Source
|
||||
- [[固定镜头短视频制作的ai全流程解析]]
|
||||
27
wiki/entities/Google-AI-Studio.md
Normal file
27
wiki/entities/Google-AI-Studio.md
Normal file
@@ -0,0 +1,27 @@
|
||||
---
|
||||
title: "Google AI Studio"
|
||||
type: entity
|
||||
tags: [google, text-to-speech, ai, service]
|
||||
sources: [我的工具集, nano-banana-pro-prompting-guide-strategies-1]
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
## Overview
|
||||
Google AI Studio 是 Google 提供的在线 AI 开发平台,整合了 Gemini 模型的各种能力。
|
||||
|
||||
## Aliases
|
||||
- Google AI Studio
|
||||
- aistudio.google.com
|
||||
|
||||
## Role in Sources
|
||||
在 [[我的工具集]] 中作为 Text-to-Speech(文本转语音)服务的提供者,支持 Dialog 对话功能。
|
||||
在 [[Nano-Banana Pro Prompting Guide & Strategies 1]] 中作为 Nano-Banana Pro 图像生成模型的主要使用界面,支持提示词测试和参数调整。
|
||||
|
||||
## Capabilities
|
||||
- Text-to-Speech:文本转语音生成
|
||||
- Dialog:对话式 AI 交互
|
||||
- Gemini 模型支持
|
||||
- **Nano-Banana Pro 图像生成**:支持文本渲染、信息图、角色一致性、4K 高分辨率、思维推理等高级图像生成能力
|
||||
|
||||
## Pricing
|
||||
免费服务
|
||||
29
wiki/entities/Hailuo-AI.md
Normal file
29
wiki/entities/Hailuo-AI.md
Normal file
@@ -0,0 +1,29 @@
|
||||
---
|
||||
title: "Hailuo AI"
|
||||
type: entity
|
||||
tags: [image-to-video, text-to-video, ai, service, paid]
|
||||
sources: [我的工具集, 14个免费的ai图生视频工具]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Overview
|
||||
Hailuo AI(海螺 AI)是国内的 AI 视频生成工具,提供图生视频和文生视频功能。
|
||||
|
||||
## Aliases
|
||||
- Hailuo AI
|
||||
- 海螺 AI
|
||||
- hailuoai.com
|
||||
|
||||
## Role in Sources
|
||||
在 [[我的工具集]] 中作为 Image-to-Video 服务的提供商,月费 ¥42。
|
||||
|
||||
## Capabilities
|
||||
- Image-to-Video:将静态图片转化为动态视频
|
||||
- Text-to-Video:文本生成视频
|
||||
|
||||
## Pricing
|
||||
¥42/月
|
||||
|
||||
## Relationship to Other Tools
|
||||
- 与 [[Vidu]] 同为国内视频生成平台
|
||||
- 与 [[Wavespeed AI]] 同属 Image-to-Video 工具
|
||||
@@ -1,20 +1,37 @@
|
||||
---
|
||||
title: "KAI"
|
||||
type: entity
|
||||
tags: ["AI视频生成", "首尾针动画", "AI工具"]
|
||||
sources: ["固定镜头短视频制作的ai全流程解析"]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
- **类型**:AI 视频生成工具(动效类)
|
||||
- **定位**:支持首尾针动画的视频生成平台
|
||||
- **应用场景**:将 [[九宫格法]] 生成的连续图像转换为动态视频片段
|
||||
|
||||
## 在固定镜头短视频制作流程中的作用
|
||||
在 [[固定镜头短视频制作的AI全流程解析]] 描述的 AI 短视频制作流程中,KAI 属于**动效类**工具,负责将配对的 [[首尾针动画]] 图片转换为连贯的短视频片段。通过 AI Video API 依次生成各阶段视频片段,核心是让画面变化自然而非镜头移动。生成的所有片段最后导入 [[剪映]] 合成。
|
||||
|
||||
## 核心能力
|
||||
- [[首尾针动画]] 技术支持:上传首针图和尾针图,自动补齐中间变化
|
||||
- 短视频片段逐个生成,确保质量可控
|
||||
- 生成片段可导入 [[剪映]] 进行最终合成
|
||||
---
|
||||
title: "KAI"
|
||||
type: entity
|
||||
tags: [AI工具, 视频生成, 动画制作]
|
||||
last_updated: 2026-03-15
|
||||
---
|
||||
|
||||
## Aliases
|
||||
- KAI Video
|
||||
- KAI AI Video
|
||||
|
||||
## Description
|
||||
KAI是一款AI视频生成工具,通过AI Video API依次生成视频片段,核心功能是让画面变化自然而非镜头移动。支持首尾针动画模式。
|
||||
|
||||
## Use Cases
|
||||
1. **首尾针动画生成**:上传首针和尾针图片,自动生成过渡动画
|
||||
2. **阶段视频片段制作**:通过AI Video API依次生成各个阶段的视频片段
|
||||
3. **固定机位视频**:特别适合生成摄像机位置固定的视频内容
|
||||
|
||||
## Workflow Position
|
||||
1. 拆分镜头(Google AI Studio)
|
||||
2. 一致性图像生成(Midjourney/Nano Banana)
|
||||
3. **首尾针动画制作(KAI)** ← 当前阶段
|
||||
4. 快速剪辑(剪映)
|
||||
5. 声音设计
|
||||
|
||||
## Related Concepts
|
||||
- [[首尾针动画]]:KAI支持的核心动画技术
|
||||
- [[海螺AI]]:同类视频生成工具
|
||||
- [[多么AI]]:同类视频生成工具
|
||||
|
||||
## Related Tools
|
||||
- [[剪映]]:用于KAI生成片段的最终合成剪辑
|
||||
- [[Google AI Studio]]:前置分镜分析工具
|
||||
|
||||
## Source
|
||||
- [[固定镜头短视频制作的ai全流程解析]]
|
||||
|
||||
@@ -1,39 +1,48 @@
|
||||
---
|
||||
title: "LangChain"
|
||||
type: entity
|
||||
tags: [llm, framework, python, rag, ai]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
LangChain 是一个用于构建 LLM 应用的 Python/JavaScript 框架,提供模块化组件抽象(Document Loader、Text Splitter、Embedding、Vector Store、Retriever、Chain、PromptTemplate 等),大幅简化 RAG、Agent 等 LLM 应用的开发。
|
||||
|
||||
## Type
|
||||
- **Category**: AI Framework / 开发框架
|
||||
- **Website**: python.langchain.com
|
||||
- **Language**: Python, JavaScript/TypeScript
|
||||
|
||||
## Core Components
|
||||
1. **Document Loader**:从 160+ 不同来源(网页/PDF/Notion/Slack 等)加载文档
|
||||
2. **Text Splitter**:将长文档切分为满足 Embedding Context Window 的小片段(Split)
|
||||
3. **Embedding**:集成多种 Embedding Provider(BAAI/BGE、OpenAI、Cohere 等)
|
||||
4. **Vector Store**:集成多种向量数据库(Qdrant、Pinecone、Chroma、FAISS 等)
|
||||
5. **Retriever**:基于向量相似度的文档检索接口
|
||||
6. **Chain**:将多个步骤串联执行的抽象,最关键的是 RAG Chain(RetrievalQA Chain)
|
||||
7. **PromptTemplate**:将变量、上下文、用户问题组装为 LLM 输入 Prompt 的模板引擎
|
||||
8. **Memory**:为 Agent 提供对话历史记忆能力
|
||||
|
||||
## Key Value
|
||||
- **降低 RAG 开发门槛**:将 Indexing-Retrieval-Generation 三阶段封装为可复用的组件,开发者无需从零实现向量化和相似度检索
|
||||
- **Chain 抽象**:通过 LCEL(LangChain Expression Language)声明式组合各组件,支持 RAG Chain、Conversation Chain 等开箱即用模式
|
||||
- **工具生态**:与 LangSmith(监控)、LangServe(部署)构成完整应用生命周期支持
|
||||
|
||||
## In RAG Context
|
||||
- [[rag从入门到精通系列1-基础rag]] 中作为核心工具链组件,负责 Indexing 阶段的文档加载/切分/向量化入库,以及 Retrieval + Generation 阶段的 Chain 编排
|
||||
|
||||
## Related Concepts
|
||||
- [[RAG]] — LangChain 的核心应用场景
|
||||
- [[Indexing]] — LangChain 封装的关键阶段
|
||||
- [[Retrieval]] — LangChain 的 Retriever 组件
|
||||
- [[Generation]] — LangChain 的 Chain + PromptTemplate 组件
|
||||
- [[LlamaIndex]] — 同类竞品框架,各有侧重
|
||||
---
|
||||
title: "LangChain"
|
||||
type: entity
|
||||
tags: [LLM应用, RAG框架, Python]
|
||||
sources: [rag从入门到精通系列1-基础rag]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
|
||||
LangChain 是一个用于构建 LLM 应用的 Python/JavaScript 开源框架,提供文档加载、向量存储集成、Chain 组合、Agent 开发等能力。
|
||||
|
||||
## Key Capabilities
|
||||
|
||||
- **Document Loaders**:160+ 文档加载器,支持网页/ PDF / Markdown / 数据库等多种来源
|
||||
- **Vector Stores**:与 Qdrant、Chroma、Milvus、Pinecone 等向量数据库的原生集成
|
||||
- **Chains**:将多个步骤(检索→组装→生成)串联为统一管道
|
||||
- **Agents**:构建可自主调用工具的 LLM Agent
|
||||
- **Memory**:跨对话的上下文记忆管理
|
||||
- **Prompt Templates**:结构化 Prompt 管理
|
||||
|
||||
## Usage in RAG
|
||||
|
||||
本文档使用 LangChain 演示基础 RAG 管道:
|
||||
1. 通过 `WebBaseLoader` 加载外部博客文档
|
||||
2. 通过 `RecursiveCharacterTextSplitter` 切分文档
|
||||
3. 通过 `Qdrant` 向量存储集成建立索引
|
||||
4. 通过 `RetrievalQA Chain` 串联检索和生成
|
||||
|
||||
## LangSmith
|
||||
|
||||
LangSmith 是 LangChain 官方提供的 LLM 应用监控和调试平台,支持:
|
||||
- 追踪 LLM 应用执行链路
|
||||
- 查看每个步骤的输入输出
|
||||
- 评估应用效果和 Token 消耗
|
||||
|
||||
## Connections
|
||||
|
||||
- [[LangChain]] ← used_in ← [[RAG]]
|
||||
- [[LangChain]] ← integrates_with ← [[Vector-Store]]
|
||||
- [[LangChain]] ← integrates_with ← [[Embedding]]
|
||||
- [[LangChain]] ← provides ← [[Generation]]
|
||||
- [[LangChain]] ← monitors_with ← [[LangSmith]]
|
||||
|
||||
## Aliases
|
||||
|
||||
- LangChain Python
|
||||
- LangChain JS
|
||||
|
||||
@@ -1,31 +1,43 @@
|
||||
---
|
||||
title: "Qdrant"
|
||||
type: entity
|
||||
tags: [vector-database, rag, rust, open-source]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
Qdrant 是用 Rust 编写的开源向量数据库(Vector Store),提供高效的 Embedding Vector 存储和相似度检索能力,支持余弦相似度、欧氏距离等多种度量方式,以及过滤(Filtering)和分组(Grouping)等高级查询功能。
|
||||
|
||||
## Type
|
||||
- **Category**: 向量数据库 / Vector Database
|
||||
- **Language**: Rust
|
||||
- **Website**: qdrant.tech
|
||||
- **License**: Apache 2.0
|
||||
|
||||
## Core Capabilities
|
||||
1. **向量存储**:高维向量(Embedding)的持久化存储
|
||||
2. **相似度检索**:余弦相似度、点积、欧氏距离等多种度量方式
|
||||
3. **Top-k 检索**:根据相似度排序返回最接近的 k 个向量
|
||||
4. **过滤查询**:支持基于 Payload(元数据)的预过滤,精确定位检索范围
|
||||
5. **分布式部署**:支持集群模式横向扩展
|
||||
|
||||
## In RAG Context
|
||||
- [[rag从入门到精通系列1-基础rag]] 中作为 Indexing 阶段向量存储后端 + Retrieval 阶段检索引擎
|
||||
- 与 LangChain 的 Vector Store 接口无缝集成
|
||||
|
||||
## Related Concepts
|
||||
- [[Vector Store]] — Qdrant 属于 Vector Store 的一种实现
|
||||
- [[RAG]] — Qdrant 是 RAG Pipeline 的基础设施组件
|
||||
- [[Retrieval]] — Qdrant 提供向量相似度检索能力
|
||||
---
|
||||
title: "Qdrant"
|
||||
type: entity
|
||||
tags: [向量数据库, 开源, Rust]
|
||||
sources: [rag从入门到精通系列1-基础rag]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
|
||||
Qdrant 是一个由 Rust 编写的开源向量数据库和向量搜索引擎,专注于高性能向量存储与相似度检索,支持生产级部署。
|
||||
|
||||
## Key Features
|
||||
|
||||
- **高性能**:Rust 编写,内存安全,支持 HNSW 和 SCAN 等索引算法
|
||||
- **过滤支持**:支持在向量检索时附加标量字段过滤条件
|
||||
- **混合检索**:支持结合向量相似度与传统关键词匹配
|
||||
- **部署灵活**:支持 Docker 部署和云原生部署
|
||||
- **API 友好**:提供 RESTful API 和 gRPC 接口
|
||||
|
||||
## Usage in RAG
|
||||
|
||||
本文档使用 Qdrant 作为向量数据库存储 Embedding Vector:
|
||||
1. 配置 Qdrant 客户端连接
|
||||
2. 创建 Collection 存储文档向量
|
||||
3. 通过 LangChain 的 `Qdrant` 集成进行 Indexing 和 Retrieval
|
||||
|
||||
## Alternatives
|
||||
|
||||
- Chroma(轻量本地)
|
||||
- Milvus(分布式生产级)
|
||||
- Weaviate(混合检索)
|
||||
- Pinecone(云托管)
|
||||
|
||||
## Connections
|
||||
|
||||
- [[Qdrant]] ← used_in ← [[RAG]]
|
||||
- [[Qdrant]] ← stores ← [[Vector-Store]]
|
||||
- [[Qdrant]] ← integrated_by ← [[LangChain]]
|
||||
|
||||
## Aliases
|
||||
|
||||
- Qdrant Vector Database
|
||||
|
||||
28
wiki/entities/Vidu.md
Normal file
28
wiki/entities/Vidu.md
Normal file
@@ -0,0 +1,28 @@
|
||||
---
|
||||
title: "Vidu"
|
||||
type: entity
|
||||
tags: [image-to-video, text-to-video, ai, service, paid]
|
||||
sources: [我的工具集, 14个免费的ai图生视频工具]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Overview
|
||||
Vidu 是国内的 AI 视频生成平台,提供图生视频和文生视频功能。
|
||||
|
||||
## Aliases
|
||||
- Vidu
|
||||
- vidu.com
|
||||
|
||||
## Role in Sources
|
||||
在 [[我的工具集]] 中作为 Image-to-Video 服务的提供商,月费 ¥8。
|
||||
|
||||
## Capabilities
|
||||
- Image-to-Video:将静态图片转化为动态视频
|
||||
- Text-to-Video:文本生成视频
|
||||
|
||||
## Pricing
|
||||
¥8/月
|
||||
|
||||
## Relationship to Other Tools
|
||||
- 与 [[Wavespeed AI]] 同属 Image-to-Video 工具
|
||||
- 与 [[Hailuo AI]] 同为国内视频生成平台
|
||||
26
wiki/entities/Wavespeed-AI.md
Normal file
26
wiki/entities/Wavespeed-AI.md
Normal file
@@ -0,0 +1,26 @@
|
||||
---
|
||||
title: "Wavespeed AI"
|
||||
type: entity
|
||||
tags: [image-editor, image-to-video, ai, service, paid]
|
||||
sources: [我的工具集]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Overview
|
||||
Wavespeed AI 是一个提供图像编辑和图生视频功能的 AI 平台。
|
||||
|
||||
## Aliases
|
||||
- Wavespeed AI
|
||||
- wavespeed.ai
|
||||
|
||||
## Role in Sources
|
||||
在 [[我的工具集]] 中提供:
|
||||
- **Image-Editor**:图像编辑工具
|
||||
- **Image-to-Video**:图生视频功能(付费服务)
|
||||
|
||||
## Capabilities
|
||||
- Image-Editor:图像编辑
|
||||
- Image-to-Video:将静态图片转化为动态视频
|
||||
|
||||
## Pricing
|
||||
Image-to-Video 功能为付费服务
|
||||
36
wiki/entities/n8n.md
Normal file
36
wiki/entities/n8n.md
Normal file
@@ -0,0 +1,36 @@
|
||||
---
|
||||
title: "n8n"
|
||||
type: entity
|
||||
tags: [工作流自动化, 开源, AI自动化, Node-Based-Workflow]
|
||||
last_updated: 2026-05-01
|
||||
---
|
||||
|
||||
## Definition
|
||||
**n8n** 是 GitHub 上最强的开源工作流自动化平台,被称为"功能更强、还能私有部署的开源版 Zapier",目前拥有恐怖的 16 万 Star。
|
||||
|
||||
## Aliases
|
||||
- n8n.io
|
||||
- N8N
|
||||
|
||||
## Key Characteristics
|
||||
- 拖拽节点串联各种互不相干的 App,自动执行工作流,省去写代码对接 API 的麻烦
|
||||
- 最近在 AI 圈爆火,因为把 LangChain 等 AI 能力也做成了节点,让用户能轻松把大模型嵌入真实业务流程
|
||||
- 支持私有部署,数据完全掌握在自己手里
|
||||
- 开源免费,适合注重数据隐私的企业和个人
|
||||
|
||||
## GitHub
|
||||
- https://github.com/n8n-io/n8n
|
||||
|
||||
## Sources
|
||||
- [[2025-年-11-个神级-ai-开源平替-github-杀疯了]]
|
||||
- [[n8n-workflow-orchestration]]
|
||||
- [[n8n-docker-install-update]]
|
||||
- [[n8n-full-tutorial-building-ai-agents-in-2025-for-beginners]]
|
||||
- [[n8n-claude-通过自然语言自动化工作流]]
|
||||
- [[n8n-configure-telegram-trigger]]
|
||||
- [[n8n-docker-配置-telegram-代理-troubleshooting]]
|
||||
|
||||
## Related
|
||||
- [[Dify]] — 同为工作流自动化平台,n8n 侧重通用流程自动化,Dify 侧重 LLM 应用开发
|
||||
- [[LangChain]] — n8n 支持 LangChain 节点集成
|
||||
- [[Zapier]] — n8n 的商业对标产品
|
||||
30
wiki/entities/vLLM.md
Normal file
30
wiki/entities/vLLM.md
Normal file
@@ -0,0 +1,30 @@
|
||||
---
|
||||
title: "vLLM"
|
||||
type: entity
|
||||
tags: [llm, inference, open-source, gpu]
|
||||
aliases: [vLLM, Virtual Large Language Model]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Description
|
||||
vLLM 是由 vLLM 社区维护的开源项目,通过更好地利用 GPU 内存来加速大语言模型(LLM)的推理生成。
|
||||
|
||||
## Key Capabilities
|
||||
- **PagedAttention**:将 KV Cache 切分为固定大小的块(block),用页表式映射管理,避免连续内存分配导致的碎片化和 OOM
|
||||
- **连续批处理(Continuous Batching)**:每步解码都动态组装活跃请求批次,基于 PagedAttention 的块式内存 + 步进级调度器,无需等待整批结束即可插入新请求
|
||||
- **KV Cache 优化**:保存历史 Key/Value 向量避免重复计算,通过分块管理实现动态并发与复用
|
||||
- **预填充(Prefill)加速**:在多分支(如 beam search)和重复前缀场景下可复用相同前缀产生的 KV 块
|
||||
|
||||
## Technical Details
|
||||
- **KV Cache**:K 和 V 由每个 token 向量化后通过线性变换得到的两类向量,用于注意力计算。KV Cache 随上下文长度、层数、头数、维度线性增长,是推理中最大的显存开销之一
|
||||
- **分块策略**:用 PagedAttention 将每条序列的 KV Cache 切分为固定大小的块,类似操作系统的虚拟内存灵活调度
|
||||
- **复用机制**:多分支和重复前缀场景下可复用相同前缀产生的 KV 块,减少预填充时间
|
||||
|
||||
## Connections
|
||||
- [[Large Language Model]] ← 加速推理 ← [[vLLM]]
|
||||
- [[PagedAttention]] ← 核心机制 ← [[vLLM]]
|
||||
- [[KV Cache]] ← 优化对象 ← [[vLLM]]
|
||||
- [[Continuous Batching]] ← 核心机制 ← [[vLLM]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
Reference in New Issue
Block a user