codecs在读取文件时,发生错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 0: invalid start byte
中文切换编码:gbk,正常解决。
但有时,utf-8和gbk都不好使用,使用notepad++,打开有乱码;看到有小块黑色。
这时候,需要加个参数, errors="ignore"
# 读文件:含特殊字符 import codecs f = codecs.open('20.txt', 'rb',encoding='gbk', errors="ignore") # 默认编码utf-8,中文是gbk content = f.readline() f.close() print('in:',content)
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持自学编程网。
- 本文固定链接: https://zxbcw.cn/post/186307/
- 转载请注明:必须在正文中标注并保留原文链接
- QQ群: PHP高手阵营官方总群(344148542)
- QQ群: Yii2.0开发(304864863)