编码的思维图谱:
也就是说文件没有编码之说,事实上都是按二进制格式保存在硬盘中的。不过在写入读取时须使用相应的编码进行处理,以便操作系统配合相关软件/字体,绘制到屏幕中给人看。所以关键问题是得知道原先这些字串数据是使用什么编码来编译的!可是在 Unicode之前都是使用类似对比表的形式来组织编码的,无法从串数据流本身统一解出不同的文 字来。
unicode是编码方式,万国码,详细的实现方式:utf-8 utf-16
在逻辑上 unicode是没有编码格式的。
进行I/O输出一定要做encode('utf-8')这样类似的操作
只是unicode在python 是内部函数。
ust r i ng = uni code( st r eam , ' gbk' )这个的意思就是先转换成unicode,再转换成你想要的编码