2020
10-08
10-08
解决pytorch多GPU训练保存的模型,在单GPU环境下加载出错问题
背景在公司用多卡训练模型,得到权值文件后保存,然后回到实验室,没有多卡的环境,用单卡训练,加载模型时出错,因为单卡机器上,没有使用DataParallel来加载模型,所以会出现加载错误。原因DataParallel包装的模型在保存时,权值参数前面会带有module字符,然而自己在单卡环境下,没有用DataParallel包装的模型权值参数不带module。本质上保存的权值文件是一个有序字典。解决方法1.在单卡环境下,用DataParallel包装模型。2.自己...
继续阅读 >