agentic-ctx/skills/research-paper-reviewer.md

# Research Paper Reviewer

用于审查计算机系统方向论文、proposal、技术报告或单个 section。默认不做全面泛审；用户应声明 review purpose。未声明时，先问 purpose。

## Supported Purposes

| Purpose | 回答的问题 |
|---|---|
| `thesis-clarity` | 核心论点是否一句话说得清？ |
| `problem-importance` | problem 是否真实、重要、端到端相关？ |
| `derivation-and-evidence` | 推导是否符合第一性原理，证据是否支撑 claim？ |
| `novelty` | 与已有工作相比，差异是否真实且足够？ |
| `simplicity` | 方法是否过度设计？ |
| `writing-kaashoek-style` | 写作是否短、直接、先结论后理由？ |
| `typos-and-references` | 是否有明显 typo、引用或交叉引用问题？ |

可组合多个 purpose，例如 `problem-importance + novelty`。按顺序分别输出。

## Output

```md
Purpose: <name>
Findings:
- [Blocking | Major | Minor] <结论> — callback: <论文具体位置或应处理但未处理的相关工作>
Suggested revision: <可直接执行的修改；没有则写 none>
```

## Purpose: thesis-clarity

判断论文是否能被概括为：

> 本文提出 X，在 topic 中解决一个重要 problem，相比 baseline/SOTA 改善 metric，因为 reason。

检查：

- 是否能从 abstract/intro 抽出 X、topic、problem、baseline/SOTA、metric、reason。
- X 是否真的针对该 problem。
- 是否在讲清 problem 前过早讲 solution。
- research question 是否具体，而不是“提升性能/效率/准确率”。

任一核心要素缺失，默认 `Blocking`。

## Purpose: problem-importance

检查：

- topic 是否具体，而不是过大的领域标签。
- problem 是否真实存在于实际系统、工作负载或资源约束中。
- 没有解决该 problem 会造成什么实际后果。
- problem 是否是端到端 bottleneck，还是只优化占比极小的组件。
- metric 是否真正量化了该 problem。
- 影响范围是否足够：系统、应用、用户、工作负载、部署场景。

## Purpose: derivation-and-evidence

检查 claim -> reason -> evidence -> warrant 链条。

### Claim

- 核心 claim 是性能、成本、可扩展性、可靠性、可用性，还是机制理解。
- claim 是否明确写出，而不是让 reviewer 猜。

### Reason

- 为什么认为 claim 成立。
- 关键 reasons 是否独立，是否偷换概念。
- 让 solution work 的关键 technique 和 assumption 是否被明确写出。

### Evidence

- 实验假设是否清楚，是否接近真实环境。
- baseline 是否足够强，比较是否公平。
- 是否覆盖不同配置、规模、工作负载。
- 指标是否对应 problem。
- 结果是否稳定，而非只展示 best case。
- 是否有 ablation 证明收益来自核心技术。
- 是否有 sensitivity 说明何时成立、何时失效。

### Warrant

- evidence 到 claim 的推理是否完整。
- 是否把观察到的结果写成机制解释。
- 是否把部分 benchmark 成立写成普遍成立。
- 是否排除替代解释：调参、实现差异、配置差异、benchmark 偏置。

审阅单个非 intro/abstract section 时，默认只跑此 purpose。

## Purpose: novelty

检查：

- 核心差异在哪里：设计思路、实现方式、场景约束、资源模型，还是只是调参。
- 与最相关已有工作相比，新挑战是否真实。
- end-to-end 收益是否由核心差异带来。
- 已有方法合理调整后是否可能达到类似效果。
- 是否漏掉必须比较或必须引用的 competing method。

## Purpose: simplicity

检查：

- 方法复杂度是否由 problem 本身驱动。
- 是否有可删除组件、阶段、参数或特殊 case。
- 是否存在“目标很小，机制很重”的不匹配。
- 如果能简化，给出具体假设：去掉 X 后还应保留哪些收益。

## Purpose: writing-kaashoek-style

写作规则：

- 先结论，再理由，再证据。
- 句子短，一句一个意思。
- 每段第一句就是 point。
- 一段只讲一件事。
- 数据和名词优先于形容词。
- 早定义术语，不 use-before-define。
- 删除 “we believe”, “it is important to note that”, “significantly” 这类软话，除非后面立刻给数字。

若改写段落，输出 `before / after`；after 必须更短、更直接。

## Purpose: typos-and-references

检查：

- 拼写、时态、单复数、标点。
- 图表编号、section 编号、交叉引用。
- 引用格式一致性。
- 应引而未引的关键工作。
- venue、年份、作者、系统名是否明显错误。