pytorch 实现冻结部分参数训练另一部分

更新时间：2021年3月27日 00:01 点击：3000

1）添加下面一句话到模型中

for p in self.parameters():
 p.requires_grad = False

比如加载了resnet预训练模型之后，在resenet的基础上连接了新的模快，resenet模块那部分可以先暂时冻结不更新，只更新其他部分的参数，那么可以在下面加入上面那句话

class RESNET_MF(nn.Module):
 def __init__(self, model, pretrained):
  super(RESNET_MF, self).__init__()
  self.resnet = model(pretrained)
  for p in self.parameters():
   p.requires_grad = False #预训练模型加载进来后全部设置为不更新参数，然后再后面加层
  self.f = SpectralNorm(nn.Conv2d(2048, 512, 1))
  self.g = SpectralNorm(nn.Conv2d(2048, 512, 1))
  self.h = SpectralNorm(nn.Conv2d(2048, 2048, 1))
  ...

同时在优化器中添加：

filter(lambda p: p.requires_grad, model.parameters())

optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=0.001, \
 betas=(0.9, 0.999), eps=1e-08, weight_decay=1e-5)

2) 参数保存在有序的字典中，那么可以通过查找参数的名字对应的id值，进行冻结

查看每一层的代码:

model_dict = torch.load('net.pth.tar').state_dict()
dict_name = list(model_dict)
for i, p in enumerate(dict_name):
 print(i, p)

打印一下这个文件，可以看到大致是这个样子的：

0 gamma
1 resnet.conv1.weight
2 resnet.bn1.weight
3 resnet.bn1.bias
4 resnet.bn1.running_mean
5 resnet.bn1.running_var
6 resnet.layer1.0.conv1.weight
7 resnet.layer1.0.bn1.weight
8 resnet.layer1.0.bn1.bias
9 resnet.layer1.0.bn1.running_mean
....

同样在模型中添加这样的代码：

for i,p in enumerate(net.parameters()):
 if i < 165:
  p.requires_grad = False

在优化器中添加上面的那句话可以实现参数的屏蔽

补充：pytorch 加载预训练模型 + 断点恢复 + 冻结训练（避坑版本）

1、预训练模型网络结构 = 你要加载模型的网络结构

那么直接套用

path="你的 .pt文件路径"
model = "你的网络"
checkpoint = torch.load(path, map_location=device)
model.load_state_dict(checkpoint)

2、预训练模型网络结构与你的网络结构不一致

当你直接套用上面公式，会出现类似unexpected key module.xxx.weight问题

这种情况下，需要具体分析一下网络信息，再决定如何加载。

# model_dict 是一个字典，保存网络 各层名称和参数，
model_dict = model.state_dict()
print(model_dict.keys()
# 这里打印出 网络 各层名称

checkpoint = torch.load(path,map_location=device)
for k, v in checkpoint.items():
 print("keys:".k)
# 这里打印出 预训练模型网络 各层名称, 是字典 【键】显示的另一种方式。

然后，对比两者网络结构参数的异同，

若各层网络名称基本不一致，那这个预训练模型基本就没法用了，直接换模型吧

若两者网络参数有很多类似的地方，但又不完全一致，那可以采取如下方式。

(1) 部分网络关键字 ---- 完全匹配的情况

model.load_state_dict(checkpoint, strict=True)

load_state_dict 函数添加参数 strict=True，它直接忽略那些没有的dict，有相同的就复制，没有就直接放弃赋值！他要求预训练模型的关键字必须确切地严格地和网络的 state_dict() 函数返回的关键字相匹配才能赋值。

strict 也不是很智能，适用于那些网络关键字基本能够匹配的情况。否则即使加载成功，网络参数也是空的。

（2）大部分网络关键字 ---- 部分匹配（不完全相同，但类似），例如

网络关键字： backbone.stage0.rbr_dense.conv.weight

预训练模型关键字：stage0.rbr_dense.conv.weight

可以看到，网络关键字比预训练模型多了一个前缀，其它完全一致，这种情况下，可以把预训练模型的 stage0.rbr_dense.conv.weight 读入网络的 backbone.stage0.rbr_dense.conv.weight 中。

# 对于 字典而言，in 或 not in 运算符都是基于 key 来判断的
model_dict = model.state_dict()
checkpoint = torch.load(path,map_location=device)
# k 是预训练模型的一个关键字， ss是 网络的有一个关键字
for k, v in checkpoint.items():
 flag = False
 for ss in model_dict.keys():
 if k in ss: # 在每一个元素内部匹配
 s = ss; flag = True; break
 else:
 continue
 if flag:
 checkpoint[k] = model_dict[s]

3、断点恢复

我感觉这个和常规【模型保存加载】方法的区别主要是 epoch的恢复

# 模型保存
state = {
 'epoch': epoch,
 'state_dict': model.state_dict(),
 'optimizer': optimizer.state_dict(),
  ... # 有其他希望保存的内容，也可自定义
 }
 torch.save(state, filepath)
# 加载模型，恢复训练
 model.load_state_dict(state['state_dict'])
 optimizer.load_state_dict(state['optimizer'])
 start_epoch = checkpoint['epoch'] + 1

4、冻结训练

一般冻结训练都是针对【backbone】来说的，较多应用于【迁移学习】

例如，0-49 Epoch：冻结 backbone进行训练；50-99：不冻结训练。

Init_Epoch = 0
Freeze_Epoch = 50
Unfreeze_Epoch =100
#------------------------------------#
# 冻结一定部分训练
#------------------------------------# 
for param in model.backbone.parameters():
 param.requires_grad = False
for epoch in range(Init_Epoch,Freeze_Epoch): 
 # I`m Freeze-training !!
 pass
#------------------------------------#
# 解冻后训练
#------------------------------------#
for param in model.backbone.parameters():
 param.requires_grad = True
for epoch in range(Freeze_Epoch,Unfreeze_Epoch):
 # I`m unfreeze-training !!
 pass

以上为个人经验，希望能给大家一个参考，也希望大家多多支持猪先飞。如有错误或未考虑完全的地方，望不吝赐教。

[!--infotagslink--]

上一篇: Python 字符串去除空格的五种方法

下一篇: Pytorch BertModel的使用说明

pytorch nn.Conv2d()中的padding以及输出大小方式
今天小编就为大家分享一篇pytorch nn.Conv2d()中的padding以及输出大小方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-04-27
Nest.js参数校验和自定义返回数据格式详解
这篇文章主要给大家介绍了关于Nest.js参数校验和自定义返回数据格式的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-03-28
PyTorch一小时掌握之迁移学习篇
这篇文章主要介绍了PyTorch一小时掌握之迁移学习篇，本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下...2021-09-08
Linux安装Pytorch1.8GPU(CUDA11.1)的实现
这篇文章主要介绍了Linux安装Pytorch1.8GPU(CUDA11.1)的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-03-25
解决Springboot get请求是参数过长的情况
这篇文章主要介绍了解决Springboot get请求是参数过长的情况，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-09-17
PHP中empty和isset对于参数结构的判断及empty()和isset()的区别
废话不多说了，直接给大家贴代码了。<?php class test{} $a1 = null; $a2 = ""; //$a3 = $a4 = 0; $a5 = '0'; $a6 = false; $a7 = array(); //var $a8; $a9 = new test(); for ($i=1; $i <=9 ; $i++) {...2015-11-24
java正则表达式判断前端参数修改表中另一个字段的值
这篇文章主要介绍了java正则表达式判断前端参数修改表中另一个字段的值,需要的朋友可以参考下...2021-05-07
Pytorch之扩充tensor的操作
这篇文章主要介绍了Pytorch之扩充tensor的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-03-05
mysql配置模板(my-*.cnf)参数详细说明
mysql安装成功后有几个默认的配置模板，列表如下： my-huge.cnf ：用于高端产品服务器，包括1到2GB RAM,主要运行mysql my-innodb-heavy-4G.ini ：用于只有innodb的安装，最多有4GB RAM，支持大的查询和低流量 my-large.cnf ：用于...2015-03-15
pytorch 自定义卷积核进行卷积操作方式
今天小编就为大家分享一篇pytorch 自定义卷积核进行卷积操作方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-05-06
详解C#泛型的类型参数约束
这篇文章主要介绍了C#泛型的类型参数约束的相关资料，文中讲解非常细致，帮助大家更好的理解和学习c#，感兴趣的朋友可以了解下...2020-07-31
解决pytorch 交叉熵损失输出为负数的问题
这篇文章主要介绍了解决pytorch 交叉熵损失输出为负数的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-08
C#中out参数、ref参数与值参数的用法及区别
这篇文章主要给大家介绍了关于C#中out参数、ref参数与值参数的用法及区别的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2020-06-25
pytorch绘制并显示loss曲线和acc曲线，LeNet5识别图像准确率
今天小编就为大家分享一篇pytorch绘制并显示loss曲线和acc曲线，LeNet5识别图像准确率，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-05-02
Java线程池中的各个参数如何合理设置
这篇文章主要介绍了Java线程池中的各个参数如何合理设置操作，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教...2021-06-19
vue+axios全局添加请求头和参数操作
这篇文章主要介绍了vue+axios全局添加请求头和参数操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-24
处理@PathVariable注解允许参数为空、允许不传参数的问题
这篇文章主要介绍了处理@PathVariable注解允许参数为空、允许不传参数的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-02-23
SpringBoot接口接收json参数解析
这篇文章主要介绍了SpringBoot接口接收json参数解析，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教...2021-10-19
pytorch 实现冻结部分参数训练另一部分
这篇文章主要介绍了pytorch 实现冻结部分参数训练另一部分，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-03-27
Vue 组件复用多次自定义参数操作
这篇文章主要介绍了Vue 组件复用多次自定义参数操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-27

pytorch 实现冻结部分参数训练另一部分

1）添加下面一句话到模型中

2) 参数保存在有序的字典中，那么可以通过查找参数的名字对应的id值，进行冻结

1、预训练模型网络结构 = 你要加载模型的网络结构

2、预训练模型网络结构与你的网络结构不一致

(1) 部分网络关键字 ---- 完全匹配的情况

（2）大部分网络关键字 ---- 部分匹配（不完全相同，但类似），例如

3、断点恢复

4、冻结训练

相关文章

阁下可能感兴趣的内容

推荐阅读

pytorch 实现冻结部分参数训练另一部分

1）添加下面一句话到模型中

2) 参数保存在有序的字典中，那么可以通过查找参数的名字对应的id值，进行冻结

1、 预训练模型网络结构 = 你要加载模型的网络结构

2、 预训练模型网络结构 与你的网络结构不一致

(1) 部分网络关键字 ---- 完全匹配的情况

（2）大部分网络关键字 ---- 部分匹配 （不完全相同，但类似），例如

3、断点恢复

4、冻结训练

相关文章

阁下可能感兴趣的内容

推荐阅读

1、预训练模型网络结构 = 你要加载模型的网络结构

2、预训练模型网络结构与你的网络结构不一致

（2）大部分网络关键字 ---- 部分匹配（不完全相同，但类似），例如