From 23eac40217ac390510ff8265f6b23e693476a1c0 Mon Sep 17 00:00:00 2001 From: Gahow Wang Date: Tue, 19 May 2026 11:42:47 +0800 Subject: [PATCH] add skill: paper-reader --- skills/paper-reader.md | 77 ++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 77 insertions(+) create mode 100644 skills/paper-reader.md diff --git a/skills/paper-reader.md b/skills/paper-reader.md new file mode 100644 index 0000000..c02625b --- /dev/null +++ b/skills/paper-reader.md @@ -0,0 +1,77 @@ +# Paper Reader + +阅读并消化一篇研究论文,输出结构化摘要。目标是**快速判断一篇论文是否值得深入**,而非逐条找问题。 + +## Supported Inputs + +| 输入类型 | 处理方式 | +|----------|----------| +| 本地 PDF 路径 | 直接读取 | +| 论文网页链接 (arXiv, ACM DL, etc.) | 抓取网页内容 | +| 用户粘贴的论文文本片段 | 直接处理 | + +## Execution Steps + +1. **获取内容**:根据输入类型读取论文全文或可用部分。PDF 较长时分页读取,优先读 abstract、introduction、evaluation、conclusion。 +2. **抽取核心 claim**:将论文压缩为"本文提出 X,在 topic 中解决 problem,相比 baseline/SOTA 改善 metric,因为 reason。" +3. **判断可信度**:按下方 Credibility Rubric 打分。 +4. **条件展开**:仅当可信度为 HIGH 或 MEDIUM 时,才展开方法和细节。 + +## Output Format + +严格按以下结构输出,不加多余寒暄: + +``` +## One-liner + +<一句话概括:本文做了什么、在哪个场景、核心结果是什么> + +## Credibility: + +<2-4 条判断依据,每条一行,格式: - [+/-] 依据> + +## Effect + +- 主要指标: = ,相比 提升/下降 +- 场景/workload: <适用范围> +- 局限: <作者承认或我识别的主要局限> + +## Method (仅 HIGH/MEDIUM 时输出) + +<3-5 句话说清核心 technique,不超过一段> +- Key insight: <一句话说清为什么 work> +- 与最相关已有工作的核心差异: <一句话> + +## Verdict + +<一句话给出阅读建议:值得精读 / 值得了解思路 / 仅供参考 / 不建议花时间> +``` + +## Credibility Rubric + +| 信号 | 正面 (+) | 负面 (-) | +|------|----------|----------| +| Venue / 作者 | Top venue 发表或知名组 | 无 peer review、predatory venue | +| Evidence | 端到端实验、真实 workload、多配置 | 仅 micro-benchmark、单配置、无 baseline | +| Baseline | 公平比较 SOTA | 缺 baseline、弱 baseline、只和自己比 | +| Reproducibility | 开源代码、详细配置 | 无代码、关键参数未报告 | +| Claim vs Evidence | claim 与实验范围匹配 | 过度泛化、标题党 | +| Writing | 清晰、数据驱动 | 模糊、大量副词无数据支撑 | + +- 4+ 正面信号且无 Blocking 负面 → HIGH +- 有正面但存在 1-2 个显著负面 → MEDIUM +- 多个负面或核心 evidence 缺失 → LOW + +## LOW Credibility Handling + +当判定为 LOW 时: +- 不输出 Method section +- 在 Verdict 中明确说明不建议花时间的原因 +- 如果论文有一个有趣的 idea 但执行差,可以一句话提及 idea + +## Notes + +- 默认中文输出,保留英文术语。 +- 如果 PDF 太长无法完整读取,优先读 abstract + intro + evaluation + conclusion,跳过 related work 和实现细节。 +- 如果网页链接无法抓取完整内容(如付费墙),报告阻塞并建议用户提供 PDF。 +- 不要编造论文中没有的数据或结论。信息不足时标注 `[信息不足]`。