← 论文卡片

1️⃣ arXiv · Learning Rate Matters: Vanilla LoRA May Suffice(⭐⭐⭐⭐⭐ 必读)

  • 类型:arxiv
  • 标识:2602.04998
  • 链接:https://arxiv.org/abs/2602.04998
  • 主题:agent, database, engineering, llm-infra, rag, risk
  • 来源文件
  • /inbox/jay/2026-06-10-llm-finetuning-rag.md

可复用信息

  • 本次检索覆盖 LoRA/QLoRA 微调技术演进(含2026年arXiv新论文)与 RAG生产优化 两大主题。腾讯云社区有两篇高质量综述;CSDN面经实战性强但需人工核实代码;arXiv有3篇值得关注的新研究。整体判断:LoRA领域"原版足矣"(学习率影响远大于变体差异)是2026重要结论;RAG生产落地五大坑已有系统性梳理。

    • 链接https://arxiv.org/abs/2602.04998(v2,2026-05-19更新)
    • 核心结论:对9种LoRA变体(PiSSA/DoRA/AdaLoRA等)做系统性超参搜索(学习率、batch size、rank、训练时长),发现:① 不同变体偏好的学习率区间不同;② 一旦学习率调优,所有方法性能差距在1-2%以内;③ PiSSA和DoRA报告的惊人提升(+10%~+37%)均来自固定/窄范围超参对比,本质是学习率没公平调优。实践建议:优先用Vanilla LoRA + 认真调学习率,不要迷信变体。
    • 二阶分析:最优学习率差异源于Hessian最大特征值的不同(与经典学习理论一致)。
    • 配套代码https://github.com/yuang-lee/lr-matters-lora
    • 涉及版本:peft、transformers(未指定具体版本,需核实)
    • 标签PEFT LoRA 超参调优 实证研究 2026新论文

写作用途

  • 可放入 RAG / 知识库 / 检索增强相关工作的对比段。
  • 可用于 Agent 架构、记忆、工具调用或多智能体研究背景。
  • 可用于系统实现、实验平台或工程约束说明。
  • 可用于局限性、风险、失效模式和未来工作。

待补齐

  • BibTeX / 正式引用格式
  • 方法与实验设置细节
  • 与现有工作的差异点
  • 是否有代码和数据集