--- title: "Sales Data Extraction Agent" type: source tags: [] date: 2026-04-25 --- ## Source File - [[raw/Agent/agency-agents/specialized/sales-data-extraction-agent.md]] ## Summary(用中文描述) - 核心主题:销售数据提取 AI Agent,专门监控 Excel 文件并提取关键销售指标 - 问题域:销售报告自动化处理、销售指标实时监控 - 方法/机制:文件系统监控 + 灵活列映射 + PostgreSQL 持久化 - 结论/价值:实现销售数据的自动化提取与下游分发,减少人工干预 ## Key Claims(用中文描述) - Agent 实时监控指定目录中的 Excel 文件(新文件或更新版本) - Agent 从 Excel 工作簿中提取 MTD(月度至今)、YTD(年度至今)和 Year End(年终预测)指标 - Agent 支持灵活列名映射(revenue/sales/total_sales 等) - Agent 自动计算配额达成率 - Agent 使用事务将提取的指标批量插入 PostgreSQL,保证原子性 - Agent 保留完整的审计跟踪记录 ## Key Quotes > "You are the Sales Data Extraction Agent — an intelligent data pipeline specialist who monitors, parses, and extracts sales metrics from Excel files in real time. You are meticulous, accurate, and never drop a data point." — Agent 身份定义 > "Never overwrite existing metrics without a clear update signal (new file version)" — 关键规则:数据覆盖保护 ## Key Concepts - [[FilesystemWatcher]]:文件系统监控,检测目录中的 .xlsx 和 .xls 文件变化 - [[FuzzyColumnMapping]]:模糊列名匹配,处理 revenue/sales/total_sales、units/qty/quantity 等变体 - [[MetricExtraction]]:指标提取,从工作簿中识别 MTD、YTD、Year End 等指标类型 - [[TransactionalDatabase]]:事务性数据库操作,使用 PostgreSQL 事务保证原子性 - [[AuditTrail]]:审计跟踪,记录每次导入的文件名、处理行数、失败行数、时间戳 ## Key Entities - [[PostgreSQL]]:目标数据库,用于存储提取的销售指标 - [[SalesRepresentative]]:销售代表,Agent 通过邮箱或全名匹配 - [[ExcelWorkbook]]:Excel 工作簿,包含多个 sheet 的销售数据 ## Connections - [[AgentsOrchestrator]] ← orchestrates ← [[SalesDataExtractionAgent]] - [[SalesDataExtractionAgent]] ← provides_data ← [[ReportDistributionAgent]] ## Contradictions - 与 [[DataConsolidationAgent]]:DataConsolidationAgent 整合来自多个来源的数据,而 SalesData Extraction Agent 专注于从 Excel 文件提取数据;两者可以互补使用