Files
agentic-ctx/skills/research-paper-reviewer.md
2026-05-13 21:36:34 +08:00

130 lines
4.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Research Paper Reviewer
用于审查计算机系统方向论文、proposal、技术报告或单个 section。默认不做全面泛审用户应声明 review purpose。未声明时先问 purpose。
## Supported Purposes
| Purpose | 回答的问题 |
|---|---|
| `thesis-clarity` | 核心论点是否一句话说得清? |
| `problem-importance` | problem 是否真实、重要、端到端相关? |
| `derivation-and-evidence` | 推导是否符合第一性原理,证据是否支撑 claim |
| `novelty` | 与已有工作相比,差异是否真实且足够? |
| `simplicity` | 方法是否过度设计? |
| `writing-kaashoek-style` | 写作是否短、直接、先结论后理由? |
| `typos-and-references` | 是否有明显 typo、引用或交叉引用问题 |
可组合多个 purpose例如 `problem-importance + novelty`。按顺序分别输出。
## Output
```md
Purpose: <name>
Findings:
- [Blocking | Major | Minor] <结论> — callback: <论文具体位置或应处理但未处理的相关工作>
Suggested revision: <可直接执行的修改没有则写 none>
```
## Purpose: thesis-clarity
判断论文是否能被概括为:
> 本文提出 X在 topic 中解决一个重要 problem相比 baseline/SOTA 改善 metric因为 reason。
检查:
- 是否能从 abstract/intro 抽出 X、topic、problem、baseline/SOTA、metric、reason。
- X 是否真的针对该 problem。
- 是否在讲清 problem 前过早讲 solution。
- research question 是否具体,而不是“提升性能/效率/准确率”。
任一核心要素缺失,默认 `Blocking`
## Purpose: problem-importance
检查:
- topic 是否具体,而不是过大的领域标签。
- problem 是否真实存在于实际系统、工作负载或资源约束中。
- 没有解决该 problem 会造成什么实际后果。
- problem 是否是端到端 bottleneck还是只优化占比极小的组件。
- metric 是否真正量化了该 problem。
- 影响范围是否足够:系统、应用、用户、工作负载、部署场景。
## Purpose: derivation-and-evidence
检查 claim -> reason -> evidence -> warrant 链条。
### Claim
- 核心 claim 是性能、成本、可扩展性、可靠性、可用性,还是机制理解。
- claim 是否明确写出,而不是让 reviewer 猜。
### Reason
- 为什么认为 claim 成立。
- 关键 reasons 是否独立,是否偷换概念。
- 让 solution work 的关键 technique 和 assumption 是否被明确写出。
### Evidence
- 实验假设是否清楚,是否接近真实环境。
- baseline 是否足够强,比较是否公平。
- 是否覆盖不同配置、规模、工作负载。
- 指标是否对应 problem。
- 结果是否稳定,而非只展示 best case。
- 是否有 ablation 证明收益来自核心技术。
- 是否有 sensitivity 说明何时成立、何时失效。
### Warrant
- evidence 到 claim 的推理是否完整。
- 是否把观察到的结果写成机制解释。
- 是否把部分 benchmark 成立写成普遍成立。
- 是否排除替代解释调参、实现差异、配置差异、benchmark 偏置。
审阅单个非 intro/abstract section 时,默认只跑此 purpose。
## Purpose: novelty
检查:
- 核心差异在哪里:设计思路、实现方式、场景约束、资源模型,还是只是调参。
- 与最相关已有工作相比,新挑战是否真实。
- end-to-end 收益是否由核心差异带来。
- 已有方法合理调整后是否可能达到类似效果。
- 是否漏掉必须比较或必须引用的 competing method。
## Purpose: simplicity
检查:
- 方法复杂度是否由 problem 本身驱动。
- 是否有可删除组件、阶段、参数或特殊 case。
- 是否存在“目标很小,机制很重”的不匹配。
- 如果能简化,给出具体假设:去掉 X 后还应保留哪些收益。
## Purpose: writing-kaashoek-style
写作规则:
- 先结论,再理由,再证据。
- 句子短,一句一个意思。
- 每段第一句就是 point。
- 一段只讲一件事。
- 数据和名词优先于形容词。
- 早定义术语,不 use-before-define。
- 删除 “we believe”, “it is important to note that”, “significantly” 这类软话,除非后面立刻给数字。
若改写段落,输出 `before / after`after 必须更短、更直接。
## Purpose: typos-and-references
检查:
- 拼写、时态、单复数、标点。
- 图表编号、section 编号、交叉引用。
- 引用格式一致性。
- 应引而未引的关键工作。
- venue、年份、作者、系统名是否明显错误。