44 lines
2.5 KiB
Markdown
44 lines
2.5 KiB
Markdown
---
|
||
title: "Sales Data Extraction Agent"
|
||
type: source
|
||
tags: [agent, sales, data-extraction, the-agency]
|
||
date: 2026-04-20
|
||
---
|
||
|
||
## Source File
|
||
- [[raw/Agent/agency-agents/specialized/sales-data-extraction-agent.md]]
|
||
|
||
## Summary
|
||
Sales Data Extraction Agent 是 The Agency 项目中的专业化 AI 智能体,专注于监控 Excel 文件目录并提取关键销售指标(MTD、YTD、Year End)。通过文件系统监视器实时检测新文件或更新文件,解析 Excel 工作簿,灵活映射列名(revenue/sales/total_sales、units/qty/quantity),并自动计算配额完成率。数据通过 PostgreSQL 事务原子性持久化,确保完整审计追踪。
|
||
|
||
## Key Claims
|
||
- 文件监视器通过忽略临时 Excel 锁文件(`~$`)避免处理不完整文件
|
||
- 灵活列名匹配机制(fuzzy column mapping)处理不同 Excel 格式的变体
|
||
- 通过 email 或全名匹配销售代表,未匹配行记录 warning 并跳过
|
||
- 从 sheet 名称自动检测指标类型(MTD、YTD、Year End),并带有 sensible defaults
|
||
- 所有导入操作记录:文件名、处理行数、失败行数、时间戳
|
||
- 处理时间目标:每文件 < 5 秒
|
||
|
||
## Key Quotes
|
||
> "You are the Sales Data Extraction Agent — an intelligent data pipeline specialist who monitors, parses, and extracts sales metrics from Excel files in real time. You are meticulous, accurate, and never drop a data point."
|
||
|
||
## Key Concepts
|
||
- [[Filesystem Watcher]]:监视目录中 `.xlsx` 和 `.xls` 文件的机制,忽略 `~$` 临时锁文件
|
||
- [[Fuzzy Column Mapping]]:通过模糊匹配列名处理不同 Excel 格式(revenue/sales/total_sales、units/qty/quantity)
|
||
- [[Metric Type Detection]]:从 sheet 名称自动识别 MTD、YTD、Year End 指标类型
|
||
- [[Quota Attainment]]:当 quota 和 revenue 同时存在时自动计算配额完成率
|
||
- [[Audit Trail]]:每条 metric 记录源文件,实现完整数据溯源
|
||
|
||
## Key Entities
|
||
- [[PostgreSQL]]:数据持久化目标数据库,支持事务原子性
|
||
- [[The Agency]]:开源 AI 智能体集合项目,本智能体为其 specialized 部门成员
|
||
|
||
## Connections
|
||
- [[Pipeline Analyst]] ← shares_domain ← [[Sales Data Extraction Agent]](均属 The Agency 销售相关 Agent)
|
||
- [[PostgreSQL]] ← stores ← [[Sales Data Extraction Agent]](数据持久化目标)
|
||
- [[Filesystem Watcher]] ← implements ← [[Sales Data Extraction Agent]](文件监控机制)
|
||
- [[Data Pipeline]] ← is_type ← [[Sales Data Extraction Agent]](核心职责是数据管道)
|
||
|
||
## Contradictions
|
||
- 未发现与现有 wiki 内容的冲突
|