突破Lora局限！全新MoRA方法，高秩更新助LLM高效学习新知识 - 文章 - 开发者社区

文章出发点 ：常见的peft训练方法-lora，其所用到的低秩更新机制可能会限制LLM有效学习和记忆新知识的能力。这个工作中，提出了一种名为 MoRA 的新方法，它采用方阵来实现高秩更新，同时保持相同数量的可训练参数。

LLM常见的有3种训练模式：

指令微调，目标是更好地使 LLMs 与最终任务和用户偏好保持一致
涉及复杂的推理任务，例如解决数学问题，一般的指令微调在处理复杂的、符号的、多步骤的推理任务时效果都很难让人满意。为了提高 LLMs 的推理能力，大多数研究都集中在创建相应的训练数据集，或者通过利用更大的教师模型，或者使用思维链的方式来解决问题
继续预训练，目标是增强LLMs的特定领域能力。

众所周知的结论，lora在1，3上表现可能都一般般。应对3，有relora的方法，可以推广到remora方法。


        
          
https://arxiv.org/html/2405.12130v1?

lora vs mora 图示：
一个观察，构造了一个10k的唯一的数据，需要根据uuid生成uuid，完成该任务所需知识均来自于训练集，也就是说考验模型对新知识的记忆能力。如下图：lora方式对比fft（全参数微调），低秩更新很难记住新知识。虽然不断提高LoRA的rank可以缓解这个问题，但差距仍然存在。