nexus/wiki/concepts/LaTeX-Flattening.md

---
title: "LaTeX Flattening"
type: concept
tags: []
sources: [arxiv-paper-reader]
last_updated: 2026-04-17
---

## Concept Definition
**LaTeX 扁平化（LaTeX Flattening）** 是指将多文件 LaTeX 论文项目（含 `\include{}`、 `\input{}`、子文件等）自动合成为单一连续文本的技术过程，使 AI 模型能够完整理解论文结构而无需处理文件引用和相对路径。

## How It Works
arXiv 论文通常包含多个 `.tex` 文件（主文件引用 `sections/` 目录下的子文件）。扁平化过程：
1. 下载 arXiv LaTeX 源码压缩包（`.tar.gz`）
2. 解析主文件，找到所有 `\include{}` / `\input{}` 引用
3. 按引用顺序将子文件内容拼接注入主文件
4. 清理 `\bibliography{}`、图片引用等外部依赖标记
5. 输出单一完整文本流

## Use Cases
- [[arXiv-Paper-Reader]] 的核心处理步骤——将 arXiv LaTeX 源码转换为 AI 可读的纯净文本
- 任何需要将 LaTeX 文档喂入 LLM 的场景

## Related Concepts
- [[arXiv-API]]：LaTeX 源码的下载来源
- [[本地缓存]]：扁平化结果可缓存避免重复处理