手动更新
This commit is contained in:
40
wiki/concepts/AI-Agent.md
Normal file
40
wiki/concepts/AI-Agent.md
Normal file
@@ -0,0 +1,40 @@
|
||||
---
|
||||
title: "AI Agent"
|
||||
type: concept
|
||||
tags: [ai-agent, autonomous, llm]
|
||||
last_updated: 2025-04-23
|
||||
---
|
||||
|
||||
## Definition
|
||||
AI Agent(AI 智能体)是围绕大语言模型(LLM)构建的循环控制系统,具备感知目标、规划步骤、执行动作、反思结果的能力,实现真正的自主行动。
|
||||
|
||||
## Core Loop
|
||||
AI Agent 通过一个连续循环过程实现其目标:
|
||||
|
||||
1. **获取任务**:接收高层目标(用户或自动触发)
|
||||
2. **扫描场景**:感知环境,获取上下文信息(工具/记忆/资源)
|
||||
3. **仔细思考**:由推理模型驱动,分析任务与场景,制定行动计划
|
||||
4. **采取行动**:调用适当工具(API/代码/数据库),作用于外部世界
|
||||
5. **观察并迭代**:观察行动结果,更新上下文,循环回到步骤3
|
||||
|
||||
## Key Capabilities
|
||||
- **自主决策**:根据上下文自主选择行动策略
|
||||
- **工具使用**:调用 API、执行代码、查询数据库
|
||||
- **多步骤规划**:分解复杂任务为可执行步骤
|
||||
- **自我反思**:基于执行结果调整下一步行动
|
||||
|
||||
## Role in AI System Architecture
|
||||
- **执行层**:AI Agent 作为 AI 系统的"行动系统",负责将决策转化为实际行动
|
||||
- 使用 [[Large Language Model]] 进行推理
|
||||
- 使用 [[RAG]] 确保信息来源准确
|
||||
|
||||
## Related Concepts
|
||||
- [[Large Language Model]] — Agent 的"大脑"
|
||||
- [[RAG]] — Agent 的"记忆"
|
||||
- [[ReAct Pattern]] — Agent 的推理-行动模式
|
||||
- [[Agentic AI]] — 具备自主决策能力的 AI 系统
|
||||
|
||||
## Sources
|
||||
- [[llms-rag-ai-agent-三个到底什么区别]]
|
||||
- [[designing-for-agentic-ai]]
|
||||
- [[n8n-full-tutorial-building-ai-agents-in-2025-for-beginners]]
|
||||
40
wiki/concepts/Custom-Instructions.md
Normal file
40
wiki/concepts/Custom-Instructions.md
Normal file
@@ -0,0 +1,40 @@
|
||||
---
|
||||
title: "Custom Instructions"
|
||||
type: concept
|
||||
tags: [ai, chatgpt, personalization, prompt-engineering]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
# Custom Instructions
|
||||
|
||||
## Aliases
|
||||
- 自定义指令(ChatGPT)
|
||||
- Custom Instructions
|
||||
|
||||
## Definition
|
||||
ChatGPT 提供的一项功能,允许用户通过两条配置项("自定义指令"+"你的详情")永久定义 AI 的行为模式、响应风格和用户背景,无需在每次对话中重复说明。
|
||||
|
||||
## Two Components
|
||||
1. **自定义指令**:定义 AI 的交互偏好
|
||||
- 响应风格(有条理/简洁/详细)
|
||||
- 工作方式(主动预判/被动等待)
|
||||
- 引用格式、道德判断倾向等
|
||||
|
||||
2. **你的详情**:描述用户背景
|
||||
- 专业领域和技术水平
|
||||
- 工作场景和使用目标
|
||||
- 语言偏好
|
||||
|
||||
## Case Study: Weishen 的配置
|
||||
- **用户假设**:被定义为"所有领域专家",无需简化技术
|
||||
- **错误政策**:错误零容忍,必须准确和详尽
|
||||
- **引用要求**:URL 统一放末尾
|
||||
- **道德判断**:不进行道德说教
|
||||
- **推测告知**:高度推测内容必须明确标注
|
||||
|
||||
## Relevance to This Wiki
|
||||
- [[openai-chatgpt-个性化定义]]:完整的自定义指令配置内容
|
||||
- [[Agent Personality Design]]:多 Agent 系统中的个性化设计,与 Custom Instructions 同属 AI 个性化范畴
|
||||
|
||||
## Sources
|
||||
- [[openai-chatgpt-个性化定义]]
|
||||
83
wiki/concepts/Docker-LLM-Deployment.md
Normal file
83
wiki/concepts/Docker-LLM-Deployment.md
Normal file
@@ -0,0 +1,83 @@
|
||||
---
|
||||
title: "Docker LLM Deployment"
|
||||
type: concept
|
||||
tags: []
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
# Docker LLM Deployment
|
||||
|
||||
## Definition
|
||||
通过 Docker 容器化方式部署本地大语言模型运行时(LLM)及其周边工具(Web 界面、RAG 引擎等),实现环境隔离、可移植性和便捷管理的部署模式。
|
||||
|
||||
## Core Patterns
|
||||
|
||||
### Pattern 1: Ollama 独立容器
|
||||
```bash
|
||||
# CPU 模式
|
||||
docker run -d -p 11434:11434 \
|
||||
-v /data/ollama:/root/.ollama \
|
||||
--name ollama ollama/ollama
|
||||
|
||||
# GPU 模式(需 nvidia-container-toolkit)
|
||||
docker run --gpus=all -d -p 11434:11434 \
|
||||
-v /data/ollama:/root/.ollama \
|
||||
--name ollama ollama/ollama
|
||||
```
|
||||
|
||||
### Pattern 2: Ollama + Open WebUI 联合部署
|
||||
```yaml
|
||||
services:
|
||||
ollama:
|
||||
image: ollama/ollama
|
||||
volumes:
|
||||
- /data/ollama:/root/.ollama
|
||||
# GPU 模式
|
||||
deploy:
|
||||
resources:
|
||||
reservations:
|
||||
devices:
|
||||
- driver: nvidia
|
||||
count: all
|
||||
capabilities: [gpu]
|
||||
|
||||
open-webui:
|
||||
image: ghcr.io/open-webui/open-webui:main
|
||||
environment:
|
||||
- OLLAMA_API_BASE_URL=http://ollama:11434/api
|
||||
ports:
|
||||
- 8080:8080
|
||||
depends_on:
|
||||
- ollama
|
||||
```
|
||||
|
||||
## Key Advantages
|
||||
| 优势 | 说明 |
|
||||
|------|------|
|
||||
| 环境隔离 | 避免依赖冲突,不污染宿主机 |
|
||||
| GPU 直通 | `--gpus=all` 直接利用宿主 GPU |
|
||||
| 便捷迁移 | 镜像导出/导入实现跨机器部署 |
|
||||
| 统一管理 | `docker compose up/down` 控制启停 |
|
||||
| 卷挂载 | 模型数据持久化到宿主机目录 |
|
||||
|
||||
## Key Environment Variables
|
||||
| 变量 | 说明 | 示例 |
|
||||
|------|------|------|
|
||||
| OLLAMA_MODELS | 模型存储路径 | `/data/ollama/models` |
|
||||
| OLLAMA_HOST | API 绑定地址 | `0.0.0.0:11434` |
|
||||
| OLLAMA_ORIGINS | 允许的跨域来源 | `*` |
|
||||
| HF_ENDPOINT | HuggingFace 镜像 | `https://hf-mirror.com` |
|
||||
|
||||
## China Environment Best Practices
|
||||
- 设置 `HF_ENDPOINT=https://hf-mirror.com` 加速镜像拉取
|
||||
- 预先拉取镜像:`docker pull ollama/ollama ghcr.io/open-webui/open-webui:main`
|
||||
- 通过 volume 挂载宿主机模型目录避免重复下载
|
||||
- 模型目录规划:`/data/ollama/models` 集中管理所有 GGUF 文件
|
||||
|
||||
## Related Concepts
|
||||
- [[Local LLM Deployment]]:Docker 部署是本地 LLM 的一种实现方式
|
||||
- [[Ollama]]:Ollama Docker 镜像是核心运行时
|
||||
- [[Open WebUI]]:Ollama 的 Web 界面伴侣
|
||||
|
||||
## Sources
|
||||
- [[详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决-1]]
|
||||
46
wiki/concepts/Error-Accountability.md
Normal file
46
wiki/concepts/Error-Accountability.md
Normal file
@@ -0,0 +1,46 @@
|
||||
---
|
||||
title: "Error Accountability"
|
||||
type: concept
|
||||
tags: [ai, personalization, trust, feedback]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
# Error Accountability
|
||||
|
||||
## Aliases
|
||||
- 错误反馈机制
|
||||
- 错误负责制
|
||||
- AI Error Transparency
|
||||
|
||||
## Definition
|
||||
AI 个性化配置中的一种原则:AI 应主动识别并承认因配置或能力限制导致的回复质量下降,而非静默产生低质量回复损害用户信任。
|
||||
|
||||
## Core Principle
|
||||
> "If the quality of your response has dropped significantly due to my custom instructions, please explain the problem" — ChatGPT 个性化配置
|
||||
|
||||
## Mechanism
|
||||
1. AI 检测到回复质量显著下降
|
||||
2. AI 主动指出问题所在
|
||||
3. 说明是配置原因还是能力限制
|
||||
4. 提供最接近可接受的替代方案
|
||||
|
||||
## Contrast with Silent Failure
|
||||
| | Silent Failure | Error Accountability |
|
||||
|--|---------------|---------------------|
|
||||
| 表现 | 静默产生低质量回复 | 主动指出问题 |
|
||||
| 用户感知 | 信任逐渐侵蚀 | 信任透明可控 |
|
||||
| 修复路径 | 用户自己发现问题 | AI 给出诊断 |
|
||||
| 长期影响 | 信任累积性下降 | 信任维持稳定 |
|
||||
|
||||
## Key Insight
|
||||
> "Mistakes can erode my trust, so be accurate and detailed" — 错误零容忍原则
|
||||
|
||||
错误对信任的损害是累积性的,因此 Error Accountability 本质上是信任维护机制而非错误修复机制。
|
||||
|
||||
## Examples in This Wiki
|
||||
- [[openai-chatgpt-个性化定义]]:用户明确要求 AI 主动反馈配置导致的回复质量下降
|
||||
- [[养龙虾5天血泪史]]:OpenClaw Agent 调试中"错误只犯一次"的学习闭环
|
||||
|
||||
## Sources
|
||||
- [[openai-chatgpt-个性化定义]]
|
||||
- [[养龙虾5天血泪史-我的ai-agent为什么总失忆-openclaw-记忆调试全记录]]
|
||||
40
wiki/concepts/Expert-User-Assumption.md
Normal file
40
wiki/concepts/Expert-User-Assumption.md
Normal file
@@ -0,0 +1,40 @@
|
||||
---
|
||||
title: "Expert User Assumption"
|
||||
type: concept
|
||||
tags: [ai, personalization, interaction-design]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
# Expert User Assumption
|
||||
|
||||
## Aliases
|
||||
- 专家用户假设
|
||||
- Expert Mode
|
||||
- 技术用户假设
|
||||
|
||||
## Definition
|
||||
AI 个性化配置中的一种原则:将用户视为具备专业背景的专家,无需在技术内容上简化解释、使用通俗语言或过度铺垫背景知识。
|
||||
|
||||
## Core Principle
|
||||
> "Think of me as an expert in all fields" — ChatGPT 个性化配置
|
||||
|
||||
## Key Implications
|
||||
- **无需通俗化**:技术细节直接呈现,不做"类比解释"
|
||||
- **无知识铺垫**:不解释基础概念,直接进入专业讨论
|
||||
- **错误零容忍**:专家用户更容易发现错误,因此错误会直接损害信任
|
||||
- **论据优先于权威**:专家关注论证质量,而非"权威来源"背书
|
||||
|
||||
## Examples in This Wiki
|
||||
- [[openai-chatgpt-个性化定义]]:用户明确声明"把我当成所有领域的专家"
|
||||
- [[llms-rag-ai-agent-三个到底什么区别]]:Wiki 假设读者理解 LLM/RAG/Agent 的基本概念
|
||||
|
||||
## Contrast: Beginner User Assumption
|
||||
| | Expert User Assumption | Beginner User Assumption |
|
||||
|--|----------------------|------------------------|
|
||||
| 解释深度 | 详细、直接 | 铺垫、类比 |
|
||||
| 技术术语 | 直接使用 | 适度解释 |
|
||||
| 错误容忍 | 零容忍 | 有限容忍 |
|
||||
| 引用要求 | 论据优先 | 来源优先 |
|
||||
|
||||
## Sources
|
||||
- [[openai-chatgpt-个性化定义]]
|
||||
28
wiki/concepts/Fixed-Point-Semantics.md
Normal file
28
wiki/concepts/Fixed-Point-Semantics.md
Normal file
@@ -0,0 +1,28 @@
|
||||
---
|
||||
title: "Fixed-Point Semantics"
|
||||
type: concept
|
||||
tags: []
|
||||
---
|
||||
|
||||
## Definition
|
||||
不动点语义是递归自我优化系统的收敛理论基础。稳定生成能力被定义为自映射 $\Phi: \mathcal{G} \to \mathcal{G}$ 的不动点 $G^* \in \mathcal{G}$,满足:
|
||||
$$\Phi(G^*) = G^*$$
|
||||
|
||||
即:在经历一次完整的"生成-优化-更新"循环后,生成器保持不变——它已经与自身的能力上限达成一致。
|
||||
|
||||
## Existence & Convergence
|
||||
不动点的存在性由 Banach 不动点定理保证:当 $\Phi$ 是收缩映射(contraction mapping)时,不动点存在且唯一,并且可以通过迭代获得:
|
||||
$$G^* = \lim_{n \to \infty} \Phi^n(G_0)$$
|
||||
|
||||
这意味着:**即使初始生成器 $G_0$ 很简单,通过足够多的迭代,生成器序列将收敛到稳定状态**。
|
||||
|
||||
## Significance
|
||||
不动点代表了一个生成器,其输出已经包含改进自身所需的全部信息——它不再需要外部优化器的干预。同时,不动点的存在证明了系统不会陷入无限循环或发散。
|
||||
|
||||
## Sources
|
||||
- [[a-formalization-of-recursive-self-optimizing-generative-systems]]
|
||||
|
||||
## Connections
|
||||
- [[Recursive Self-Optimization]] ← converges_to ← [[Fixed-Point Semantics]]
|
||||
- [[Self-Referential Computation]] ← is_grounded_in ← [[Fixed-Point Semantics]]
|
||||
- [[Y-Combinator]] ← computes ← [[Fixed-Point Semantics]]
|
||||
25
wiki/concepts/Generator-Space.md
Normal file
25
wiki/concepts/Generator-Space.md
Normal file
@@ -0,0 +1,25 @@
|
||||
---
|
||||
title: "Generator Space"
|
||||
type: concept
|
||||
tags: []
|
||||
---
|
||||
|
||||
## Definition
|
||||
生成器空间 $\mathcal{G}$ 是递归自我优化框架的核心数学结构,定义为 $\mathcal{G} \subseteq \mathcal{P}^{\mathcal{I}}$,其中每个生成器(Generator)$G \in \mathcal{G}$ 是一个从意图空间 $\mathcal{I}$ 到程序/提示空间 $\mathcal{P}$ 的函数:
|
||||
$$G: \mathcal{I} \to \mathcal{P}$$
|
||||
|
||||
## Intuition
|
||||
传统计算:输入 → 输出(单个解)
|
||||
生成器计算:意图 → 生成器(解的生成机制)
|
||||
|
||||
核心洞察:**优化"生成解的机制"比优化"单个解"更有价值**——因为生成器可以被迭代改进,其输出可以自我参照地影响生成器本身的演化。
|
||||
|
||||
## Role in Recursive Self-Optimization
|
||||
在递归自我优化系统中,生成器空间 $\mathcal{G}$ 是自映射 $\Phi: \mathcal{G} \to \mathcal{G}$ 的定义域和值域。系统的收敛目标是在 $\mathcal{G}$ 中找到不动点 $G^*$。
|
||||
|
||||
## Sources
|
||||
- [[a-formalization-of-recursive-self-optimizing-generative-systems]]
|
||||
|
||||
## Connections
|
||||
- [[Recursive Self-Optimization]] ← operates_on ← [[Generator Space]]
|
||||
- [[Self-Referential Computation]] ← enables ← [[Generator Space]]
|
||||
27
wiki/concepts/Large-Language-Model.md
Normal file
27
wiki/concepts/Large-Language-Model.md
Normal file
@@ -0,0 +1,27 @@
|
||||
---
|
||||
title: "Large Language Model"
|
||||
type: concept
|
||||
tags: [llm, ai, nlp]
|
||||
last_updated: 2025-04-23
|
||||
---
|
||||
|
||||
## Definition
|
||||
大语言模型(Large Language Model,LLM)是基于大规模预训练的深度学习模型,能够理解和生成人类语言,在推理与生成方面表现出色。
|
||||
|
||||
## Core Characteristics
|
||||
- **知识截止日期**:LLM 的知识基于训练数据,存在固定的时间节点,无法自动获取最新信息
|
||||
- **推理能力强**:能够进行复杂推理、代码生成、文本创作等任务
|
||||
- **幻觉问题**:可能生成看似合理但实际错误的内容(幻觉)
|
||||
|
||||
## Role in AI System Architecture
|
||||
- **思考层**:LLM 作为 AI 系统的"天才大脑",负责逻辑推理和内容生成
|
||||
- 与 [[RAG]] 配合获取实时信息
|
||||
- 与 [[AI Agent]] 配合实现自主行动
|
||||
|
||||
## Related Concepts
|
||||
- [[RAG]] — 补充实时知识,降低幻觉
|
||||
- [[AI Agent]] — 提供行动能力
|
||||
- [[ReAct Pattern]] — 推理-行动协同模式
|
||||
|
||||
## Sources
|
||||
- [[llms-rag-ai-agent-三个到底什么区别]]
|
||||
56
wiki/concepts/Local-LLM-Deployment.md
Normal file
56
wiki/concepts/Local-LLM-Deployment.md
Normal file
@@ -0,0 +1,56 @@
|
||||
---
|
||||
title: "Local LLM Deployment"
|
||||
type: concept
|
||||
tags: []
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
# Local LLM Deployment
|
||||
|
||||
## Definition
|
||||
在本地机器上离线部署和运行大语言模型(LLM),无需依赖云端 API 服务,实现数据完全私有化且零 API 调用费用。
|
||||
|
||||
## Key Benefits
|
||||
- **隐私安全**:数据不出本地,无需上传至第三方服务器
|
||||
- **成本为零**:无需 API Key,无调用费用
|
||||
- **离线可用**:无网络连接要求
|
||||
- **完全可控**:可自由选择模型、配置参数、定制系统提示词
|
||||
|
||||
## Core Stack
|
||||
| 组件 | 作用 | 代表工具 |
|
||||
|------|------|---------|
|
||||
| LLM 运行时 | 本地运行大模型 | [[Ollama]], llama.cpp, vLLM |
|
||||
| 大模型 | 推理能力 | [[DeepSeek]]-R1, Llama, Qwen |
|
||||
| Web 界面 | 图形化交互 | [[Open WebUI]], ChatUI |
|
||||
| 知识库 | RAG 增强 | bge-m3, Chroma |
|
||||
|
||||
## Hardware Requirements
|
||||
| 模型参数规模 | 最低 RAM | 推荐显存 | 典型硬件 |
|
||||
|------------|---------|---------|---------|
|
||||
| 1.5B | 4 GB | 4 GB | 普通笔记本 |
|
||||
| 7B | 16 GB | 14 GB | 有独显的电脑 |
|
||||
| 32B | 64 GB | 48 GB | Mac Studio M2 Max / 高端工作站 |
|
||||
| 70B+ | 128 GB | 140 GB+ | 多 GPU 服务器 |
|
||||
|
||||
## Implementation Options
|
||||
1. **ollama run**:`ollama run deepseek-r1:8b` 一行命令本地运行
|
||||
2. **Docker 部署**:`docker run --gpus=all -p 11434:11434 ollama/ollama`
|
||||
3. **API 服务**:通过 `http://localhost:11434/api/generate` 调用
|
||||
4. **Web 界面**:部署 [[Open WebUI]] 提供浏览器交互
|
||||
|
||||
## China Environment Challenges & Solutions
|
||||
| 挑战 | 解决方案 |
|
||||
|------|---------|
|
||||
| 模型下载慢 | 魔塔社区(modelscope.cn)、HF Mirror(hf-mirror.com)、夸克网盘 |
|
||||
| GPU 不可用 | Docker GPU 模式:`docker run --gpus=all` |
|
||||
| 模型导入 | `ollama create <name> -f <Modelfile>` 导入本地 GGUF 文件 |
|
||||
| API 安全 | nginx 反向代理 + Bearer Token 认证 |
|
||||
|
||||
## Related Concepts
|
||||
- [[Docker LLM Deployment]]:通过 Docker 容器化部署本地 LLM
|
||||
- [[RAG]]:本地 LLM 的知识增强技术
|
||||
- [[Model Quantization]]:GGUF 格式量化降低硬件要求
|
||||
- [[Ollama]]:本地 LLM 部署的核心运行时工具
|
||||
|
||||
## Sources
|
||||
- [[详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决-1]]
|
||||
37
wiki/concepts/Personalization.md
Normal file
37
wiki/concepts/Personalization.md
Normal file
@@ -0,0 +1,37 @@
|
||||
---
|
||||
title: "Personalization"
|
||||
type: concept
|
||||
tags: [ai, personalization, interaction-design]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
# Personalization
|
||||
|
||||
## Aliases
|
||||
- AI 个性化
|
||||
- 个性化配置
|
||||
- Personalized AI
|
||||
|
||||
## Definition
|
||||
通过系统级指令(如自定义指令、用户画像)塑造 AI 的响应风格、交互方式和输出格式,使 AI 适配特定用户的背景、偏好和使用场景。
|
||||
|
||||
## Key Dimensions
|
||||
- **响应风格**:有条理/简洁/详细/技术性
|
||||
- **交互方式**:被动响应 vs 主动预判
|
||||
- **输出格式**:URL 位置、语言偏好、引用格式
|
||||
- **用户假设**:专家 vs 新手视角
|
||||
- **错误处理**:主动反馈 vs 静默忽略
|
||||
|
||||
## Patterns in This Wiki
|
||||
- [[openai-chatgpt-个性化定义]]:ChatGPT 自定义指令的完整配置案例
|
||||
- [[Agent Personality Design]]:多 Agent 系统中的个性化设计
|
||||
- [[custom-morning-brief]]:个性化晨间简报
|
||||
- [[Adaptive Tone]]:根据用户表现动态调整语气
|
||||
|
||||
## Relationship to TCPCA
|
||||
Personalization 是 [[designing-for-agentic-ai]] 中 TCPCA 五原则之一——AI 应适应个人用户需求和偏好,基于历史行为预测未来需求。
|
||||
|
||||
## Sources
|
||||
- [[openai-chatgpt-个性化定义]]
|
||||
- [[designing-for-agentic-ai]]
|
||||
- [[multi-agent-team]]
|
||||
41
wiki/concepts/Proactive-AI.md
Normal file
41
wiki/concepts/Proactive-AI.md
Normal file
@@ -0,0 +1,41 @@
|
||||
---
|
||||
title: "Proactive AI"
|
||||
type: concept
|
||||
tags: [ai, agentic-ai, interaction-design]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
# Proactive AI
|
||||
|
||||
## Aliases
|
||||
- 主动 AI
|
||||
- Proactive Assistant
|
||||
- 主动预判型 AI
|
||||
|
||||
## Definition
|
||||
AI 主动预判用户需求、提前采取行动,而非被动等待用户指令的交互模式。核心特征:AI 不只是响应请求,而是识别潜在需求并在适当时机主动介入。
|
||||
|
||||
## Contrast with Reactive AI
|
||||
| | Reactive AI | Proactive AI |
|
||||
|--|------------|--------------|
|
||||
| 触发方式 | 用户请求 | AI 自主判断 |
|
||||
| 典型行为 | 回答问题 | 推送提醒、建议行动 |
|
||||
| 用户角色 | 主动方 | 审核/确认方 |
|
||||
| 适用场景 | 问答、检索 | 监控、任务管理 |
|
||||
|
||||
## Examples in This Wiki
|
||||
- [[openai-chatgpt-个性化定义]]:ChatGPT 被配置为"主动出击,预判我的需求"
|
||||
- [[custom-morning-brief]]:AI 主动推送每日晨间简报,而非用户查询
|
||||
- [[self-healing-home-server]]:Agent 主动监控并在问题发生前修复
|
||||
- [[personal-crm]]:AI 主动研究会议参会者并推送背景资料
|
||||
|
||||
## Relationship to TCPCA
|
||||
Proactive AI 是 [[designing-for-agentic-ai]] 中"主动预判"(Anticipation)原则的核心体现——AI 预判需求并主动提供帮助,同时允许用户控制 AI 自主权级别。
|
||||
|
||||
## Key Insight
|
||||
> "主动任务推荐是整个系统最有价值的部分——AI 主动思考如何帮助用户,而非被动等待指令。" — 自定义晨间简报核心洞察
|
||||
|
||||
## Sources
|
||||
- [[openai-chatgpt-个性化定义]]
|
||||
- [[custom-morning-brief]]
|
||||
- [[designing-for-agentic-ai]]
|
||||
35
wiki/concepts/RAG.md
Normal file
35
wiki/concepts/RAG.md
Normal file
@@ -0,0 +1,35 @@
|
||||
---
|
||||
title: "RAG"
|
||||
type: concept
|
||||
tags: [rag, retrieval, llm, ai]
|
||||
last_updated: 2025-04-23
|
||||
---
|
||||
|
||||
## Definition
|
||||
检索增强生成(Retrieval-Augmented Generation,RAG)是将大语言模型(LLM)链接到外部实时知识库的技术,通过检索+生成的流程提升答案准确性和时效性。
|
||||
|
||||
## Core Mechanism
|
||||
1. **检索(Retrieval)**:当用户提问时,从外部知识库(向量数据库/知识图谱/公司文档)中检索最相关的信息块(Chunk)
|
||||
2. **增强生成(Augmented Generation)**:将检索结果与用户问题作为上下文输入 LLM,指示其严格基于上下文生成答案
|
||||
|
||||
## Key Benefits
|
||||
- **知识更新与定制**:无需重新训练即可获取最新信息
|
||||
- **消除幻觉**:提供事实依据,显著降低胡说八道的风险
|
||||
- **引用来源**:可追溯信息来源,增加可信度
|
||||
- **成本效益**:相比微调,成本更低、更新更快
|
||||
|
||||
## Role in AI System Architecture
|
||||
- **认知层**:RAG 作为 AI 系统的"记忆系统",负责信息获取与准确性保障
|
||||
- 补充 [[Large Language Model]] 的知识时效性局限
|
||||
- 为 [[AI Agent]] 提供可信赖的信息来源
|
||||
|
||||
## Related Concepts
|
||||
- [[Large Language Model]] — 被增强的底层模型
|
||||
- [[AI Agent]] — 依赖 RAG 提供准确信息
|
||||
- [[Hybrid Search]] — RAG 常用检索策略
|
||||
- [[Semantic Search]] — 向量检索的核心技术
|
||||
|
||||
## Sources
|
||||
- [[llms-rag-ai-agent-三个到底什么区别]]
|
||||
- [[rag从入门到精通系列1-基础rag]]
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
41
wiki/concepts/Recursive-Self-Optimization.md
Normal file
41
wiki/concepts/Recursive-Self-Optimization.md
Normal file
@@ -0,0 +1,41 @@
|
||||
---
|
||||
title: "Recursive Self-Optimization"
|
||||
type: concept
|
||||
tags: []
|
||||
---
|
||||
|
||||
## Definition
|
||||
递归自我优化是一种通过迭代自我修改构建稳定生成能力的计算框架——系统的目标不是直接产出最优输出,而是在生成器空间(Generator Space)中通过不断的"生成-优化-更新"循环收敛到稳定不动点。
|
||||
|
||||
## Formalization
|
||||
给定:
|
||||
- $\mathcal{I}$:意图空间(Intention Space)
|
||||
- $\mathcal{G} \subseteq \mathcal{P}^{\mathcal{I}}$:生成器空间,每个生成器 $G: \mathcal{I} \to \mathcal{P}$
|
||||
- $O: \mathcal{P} \times \Omega \to \mathcal{P}$:优化算子
|
||||
- $M: \mathcal{G} \times \mathcal{P} \to \mathcal{G}$:元生成算子
|
||||
|
||||
系统演化:
|
||||
```
|
||||
P = G(I)
|
||||
P* = O(P, Ω)
|
||||
G' = M(G, P*)
|
||||
```
|
||||
|
||||
自映射 $\Phi: \mathcal{G} \to \mathcal{G}$ 定义为:
|
||||
$$\Phi(G) = M\big(G, O(G(I), \Omega)\big)$$
|
||||
|
||||
迭代序列 $G_{n+1} = \Phi(G_n)$。
|
||||
|
||||
## Key Insight
|
||||
系统的收敛目标不是某个特定的输出 $P^*$,而是生成器序列 $\{G_n\}$ 的极限行为。当 $\Phi$ 满足收缩性条件时:
|
||||
$$G^* = \lim_{n \to \infty} \Phi^n(G_0)$$
|
||||
这就是**稳定生成能力**(Stable Generative Capability)。
|
||||
|
||||
## Sources
|
||||
- [[a-formalization-of-recursive-self-optimizing-generative-systems]]
|
||||
|
||||
## Connections
|
||||
- [[Generator Space]] ← defines_the_space ← [[Recursive Self-Optimization]]
|
||||
- [[Fixed-Point Semantics]] ← formalizes_convergence ← [[Recursive Self-Optimization]]
|
||||
- [[Self-Improving AI]] ← is_applied_instance ← [[Recursive Self-Optimization]]
|
||||
- [[Self-Improving-Skill]] ← concrete_implementation ← [[Recursive Self-Optimization]]
|
||||
33
wiki/concepts/Self-Referential-Computation.md
Normal file
33
wiki/concepts/Self-Referential-Computation.md
Normal file
@@ -0,0 +1,33 @@
|
||||
---
|
||||
title: "Self-Referential Computation"
|
||||
type: concept
|
||||
tags: []
|
||||
---
|
||||
|
||||
## Definition
|
||||
自引用计算是指系统的输出被用于修改系统自身结构的计算模式。在递归自我优化生成系统中,生成器的输出(优化后的提示词/程序)被元生成算子 $M$ 用来更新生成器本身,形成闭环。
|
||||
|
||||
## Expression
|
||||
在 λ-calculus 中的表达:
|
||||
|
||||
单步更新函数:
|
||||
$$\text{STEP} \equiv \lambda G.\; (M\;G)\big((O\;(G\;I));\Omega\big)$$
|
||||
|
||||
不动点组合子(Y-Combinator):
|
||||
$$Y \equiv \lambda f.(\lambda x.f(x,x))(\lambda x.f(x,x))$$
|
||||
|
||||
稳定生成器:
|
||||
$$G^* \equiv Y\;\text{STEP}$$
|
||||
满足自引用不动点方程:
|
||||
$$G^* = \text{STEP}\;G^*$$
|
||||
|
||||
## Key Insight
|
||||
生成器被定义为"使用自身输出的函数"的不动点。这意味着生成器的输出已经编码了改进生成器所需的全部信息——无需外部干预,系统即可自我完善。
|
||||
|
||||
## Sources
|
||||
- [[a-formalization-of-recursive-self-optimizing-generative-systems]]
|
||||
|
||||
## Connections
|
||||
- [[Y-Combinator]] ← implements ← [[Self-Referential Computation]]
|
||||
- [[Generator Space]] ← domain_of ← [[Self-Referential Computation]]
|
||||
- [[Fixed-Point Semantics]] ← provides_semantics ← [[Self-Referential Computation]]
|
||||
33
wiki/concepts/Y-Combinator.md
Normal file
33
wiki/concepts/Y-Combinator.md
Normal file
@@ -0,0 +1,33 @@
|
||||
---
|
||||
title: "Y-Combinator"
|
||||
type: concept
|
||||
tags: []
|
||||
---
|
||||
|
||||
## Definition
|
||||
Y组合子(Y-Combinator)是 λ-calculus 中的不动点组合子,用于在无名字 λ-calculus 中表达递归函数。其标准定义为:
|
||||
$$Y \equiv \lambda f.(\lambda x.f(x,x))(\lambda x.f(x,x))$$
|
||||
|
||||
## Role in Recursive Self-Optimizing Systems
|
||||
在递归自我优化框架中,Y 组合子用于表达稳定生成器 $G^*$ 的自引用不动点方程:
|
||||
|
||||
定义单步更新函数:
|
||||
$$\text{STEP} \equiv \lambda G.\; (M\;G)\big((O\;(G\;I));\Omega\big)$$
|
||||
|
||||
稳定生成器通过不动点组合子获得:
|
||||
$$G^* \equiv Y\;\text{STEP}$$
|
||||
|
||||
展开验证不动点性质:
|
||||
$$Y\;\text{STEP} = (\lambda x.\text{STEP}(x,x))(Y\;\text{STEP}) = \text{STEP}(Y\;\text{STEP}) = \text{STEP}(G^*)$$
|
||||
|
||||
这精确表达了"生成器的输出就是它自身的输入"这一自引用性质。
|
||||
|
||||
## Key Insight
|
||||
Y 组合子将**递归的语义**("调用自身")转化为**组合子的语法**(无自由变量的 λ-项),从而在纯数学结构中捕捉了自我改进系统的本质。
|
||||
|
||||
## Sources
|
||||
- [[a-formalization-of-recursive-self-optimizing-generative-systems]]
|
||||
|
||||
## Connections
|
||||
- [[Self-Referential Computation]] ← implemented_by ← [[Y-Combinator]]
|
||||
- [[Fixed-Point Semantics]] ← computes ← [[Y-Combinator]]
|
||||
Reference in New Issue
Block a user