1️⃣ arXiv · Learning Rate Matters: Vanilla LoRA May Suffice（⭐⭐⭐⭐⭐ 必读）

可复用信息

本次检索覆盖 LoRA/QLoRA 微调技术演进（含2026年arXiv新论文）与 RAG生产优化 两大主题。腾讯云社区有两篇高质量综述；CSDN面经实战性强但需人工核实代码；arXiv有3篇值得关注的新研究。整体判断：LoRA领域"原版足矣"（学习率影响远大于变体差异）是2026重要结论；RAG生产落地五大坑已有系统性梳理。

- 链接：https://arxiv.org/abs/2602.04998（v2，2026-05-19更新）
- 核心结论：对9种LoRA变体（PiSSA/DoRA/AdaLoRA等）做系统性超参搜索（学习率、batch size、rank、训练时长），发现：① 不同变体偏好的学习率区间不同；② 一旦学习率调优，所有方法性能差距在1-2%以内；③ PiSSA和DoRA报告的惊人提升（+10%~+37%）均来自固定/窄范围超参对比，本质是学习率没公平调优。实践建议：优先用Vanilla LoRA + 认真调学习率，不要迷信变体。
- 二阶分析：最优学习率差异源于Hessian最大特征值的不同（与经典学习理论一致）。
- 配套代码：https://github.com/yuang-lee/lr-matters-lora
- 涉及版本：peft、transformers（未指定具体版本，需核实）
- 标签：PEFT LoRA 超参调优 实证研究 2026新论文