条目S1：To Data & Beyond — Important LLM Papers Week of 12-17 Jan 2026

可复用信息

- 来源：To Data & Beyond（Youssef Hosni），Substack，https://todatabeyond.substack.com/p/important-llm-papers-for-the-week-504
- 类型：AI论文周报
- 可信度：中高（知名AI newsletter，链接arXiv原文）
- 核心论文1：STEP3-VL-10B（StepFun）
- 10B参数开源多模态模型，性能媲美10-20x大的模型（GLM-4.6V-106B、Qwen3-VL-235B），甚至超越Gemini 2.5 Pro
- 核心技术：全参数解冻预训练（1.2T tokens）+ PaCoRe（Parallel Coordinated Reasoning，并行协调推理）
- RL动态发现：推理任务随token长度增加而提升，但确定性感知任务（如grounding）在RL过程中反而出现"长度缩减"——模型学会剪枝冗余tokens
- AIME2025: 94.43%，MMMU: 80.11%，ScreenSpot-V2（GUI grounding）: 92.61%