木子李的个人主页 - 开发者社区

文档备案控制台登录立即注册

首页文章活动镜像站

发布

木子李

文章

专栏

问答

木子李

2023 年度总结之大模型的微调｜社区征文

大模型2023总结

随着最近几年大模型在各行各业的广泛应用，人们逐渐意识到了大模型强大的任务处理能力。然而，在实践中，将这些大型模型用于下游任务时需要对每个模型都进行一个独立和完整的微调过程来适应不同的任务，但这种策略需要为每个任务存储和部署一个单独的主干网络参数副本。因此这种方法通常成本很高且不可行，特别是基于 Transformer 架构的模型会比卷积神经网络大得多。这限制了它在不同视觉领域的可移植性。为了应对这

205