202107-09 pytorch训练神经网络爆内存的解决方案 训练的时候内存一直在增加,最后内存爆满,被迫中断。后来换了一个电脑发现还是这样,考虑是代码的问题。检查才发现我的代码两次存了loss,只有一个地方写的是loss.item()。问题就在loss,因为loss是variable类型。要写成loss_train=loss_train+loss.item(),不能直接写loss_train=loss_train+loss。否则就会发现随着epoch的增加,占的内存也在一点一点增加。算是一个小坑吧,希望大家还是要仔细。补充:pytorch神经网络... 继续阅读 >
202103-05 用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案 训练的时候当然用gpu,速度快呀。我想用cpu版的tensorflow跑一下,结果报错,这个错误不太容易看懂。大概意思是没找到一些节点。后来发现原因,用gpu和cpu保存的pb模型不太一样,但是checkpoints文件是通用的。使用tensorflow-cpu再把checkpoints文件重新转换一下pb文件就可以了。完美解决!补充:tensflow-gpu版的无数坑坑坑!(tf坑大总结)自己的小本本,之前预装有的pycharm+win10+anaconda3+python3的环境2019/3/24重新安装发... 继续阅读 >