--- title: "arXiv API" type: concept tags: [] sources: [arxiv-paper-reader] last_updated: 2026-04-17 --- ## Concept Definition **arXiv API** 是 arXiv 开放论文平台提供的 HTTP 接口集,支持通过程序化方式获取论文元数据(标题、作者、摘要、分类)、PDF 和 LaTeX 源码,无需手动下载。 ## Key Endpoints | 操作 | 端点 | 说明 | |------|------|------| | 搜索 | `http://export.arxiv.org/api/query?search_query=...` | Atom XML 格式返回匹配论文 | | 获取 | `http://export.arxiv.org/api/query?id_list=2301.00001` | 按 arXiv ID 获取单篇或批量论文 | | LaTeX 源码 | `https://arxiv.org/e-print/` | 下载 LaTeX 源码 `.tar.gz` | | PDF | `https://arxiv.org/pdf/.pdf` | 下载 PDF 全文 | ## Use Cases - [[arXiv-Paper-Reader]] 的核心数据来源 - 批量论文筛选和元数据分析 ## Limitations - 每秒最多 1 请求(官方限速),需实现请求节流 - LaTeX 源码仅部分论文提供(非强制提交) ## Related Concepts - [[LaTeX-Flattening]]:API 返回的 LaTeX 源码的处理方式 - [[论文摘要批量获取]]:批量调用 API 的应用场景