31 lines
1.2 KiB
Markdown
31 lines
1.2 KiB
Markdown
---
|
||
title: "arXiv API"
|
||
type: concept
|
||
tags: []
|
||
sources: [arxiv-paper-reader]
|
||
last_updated: 2026-04-17
|
||
---
|
||
|
||
## Concept Definition
|
||
**arXiv API** 是 arXiv 开放论文平台提供的 HTTP 接口集,支持通过程序化方式获取论文元数据(标题、作者、摘要、分类)、PDF 和 LaTeX 源码,无需手动下载。
|
||
|
||
## Key Endpoints
|
||
| 操作 | 端点 | 说明 |
|
||
|------|------|------|
|
||
| 搜索 | `http://export.arxiv.org/api/query?search_query=...` | Atom XML 格式返回匹配论文 |
|
||
| 获取 | `http://export.arxiv.org/api/query?id_list=2301.00001` | 按 arXiv ID 获取单篇或批量论文 |
|
||
| LaTeX 源码 | `https://arxiv.org/e-print/<arxiv-id>` | 下载 LaTeX 源码 `.tar.gz` |
|
||
| PDF | `https://arxiv.org/pdf/<arxiv-id>.pdf` | 下载 PDF 全文 |
|
||
|
||
## Use Cases
|
||
- [[arXiv-Paper-Reader]] 的核心数据来源
|
||
- 批量论文筛选和元数据分析
|
||
|
||
## Limitations
|
||
- 每秒最多 1 请求(官方限速),需实现请求节流
|
||
- LaTeX 源码仅部分论文提供(非强制提交)
|
||
|
||
## Related Concepts
|
||
- [[LaTeX-Flattening]]:API 返回的 LaTeX 源码的处理方式
|
||
- [[论文摘要批量获取]]:批量调用 API 的应用场景
|