Python处理encoding的小技巧
用Python写过处理文本经常会遇到需要decoding或者encoding, 尤其是处理中文的时候。
encoding的问题处理起来是个脏活儿,报错不太容易看懂,网上相关资料不太好查。有同感?请继续读下去。
常规做法是读取文件的时候立刻decode, 所有的处理工作都用unicode,写会文件的时候encode. 但是等到读取的时候在处理的代码读/写起来都很别扭,感觉像穿上鞋以后袜子滑下来了…Python 3.1.1以上的版本解决了该问题。在Python 3.1.1中,打开文件可以加入encoding的参数:
file = open(filename, encoding='xxx')
啊,这样看起来终于舒坦了。 不同写如下的code了
file = open(filename)
for line in file:
decoded_line = line.decode('xxx')
do something else
提倡使用utf8
转载于酷壳CoolShell 无删改 仅以此纪念陈皓(左耳朵耗子)
两个人的数据开发团队,被要求从零开始治理企业数据
从互联网大数据岗位跳槽到制造业 ToB 公司,本以为能逃离“卷需求”,结果发现真正的噩梦是“没有需求”——只有领导的模糊概念和业务部门的“与我无关”😇 现在在这个公司,就感觉需…
独立开发之路,防不胜防
我在端午节发布了独立开发的自动记牌器 app 。 最近有俩用户给我反馈,app 总是弹窗,且都是安卓 14 。 本周我查了些资料,发现安卓 14 持续截屏会一直弹窗。 然后…
如果手贱删除 Windows 的恢复分区,可能导致某些安全更新安装失败
之前我觉得 Windows 恢复分区(可以打开磁盘管理工具,一般在第一个物理硬盘的最后)没啥用,还占用我大几百 MB 的空间,于是我就用磁盘管理工具把恢复分区合并到 C 盘里面…
合速度