Python处理encoding的小技巧
用Python写过处理文本经常会遇到需要decoding或者encoding, 尤其是处理中文的时候。
encoding的问题处理起来是个脏活儿,报错不太容易看懂,网上相关资料不太好查。有同感?请继续读下去。
常规做法是读取文件的时候立刻decode, 所有的处理工作都用unicode,写会文件的时候encode. 但是等到读取的时候在处理的代码读/写起来都很别扭,感觉像穿上鞋以后袜子滑下来了…Python 3.1.1以上的版本解决了该问题。在Python 3.1.1中,打开文件可以加入encoding的参数:
file = open(filename, encoding='xxx')
啊,这样看起来终于舒坦了。 不同写如下的code了
file = open(filename)
for line in file:
decoded_line = line.decode('xxx')
do something else
提倡使用utf8
转载于酷壳CoolShell 无删改 仅以此纪念陈皓(左耳朵耗子)
请教 Python 大佬,遍历一个 5GB 大小的 txt 文件,用什么方式效率比较高
python 新手,现在有个需求,大概几百万条数据需要翻译,映射关系存在一个 5GB 左右大小的 txt 文件里,也就是拿几百万个值去几亿条数据里去匹配,怎么做比较好 介绍的…
edge 浏览器标签页选框图形 bug 稳定复现
版本 124.0.2478.80 (正式版本) (64 位) 上方标签页只要多开几个再关标签页,这个框的位置就放飞自我了,大概率对不齐 找到问题了,开启 edge 的新 ui…
我觉得 Java 最大的阻碍就是各种“被废弃”
随便找本书看看,但凡版本稍微升级一点点,各种“被废弃”的方法和类。 有些升级真是破坏性的升级,设计大改,用法完全改变了。 写 Java 的同学和写前端的也应该一样,能用就不更新…