python编码

2449人浏览 / 0人评论

一、常见字符编码类型

  ASCII:美国信息交换标准码,是目前计算机中最广泛使用的字符集编码。每个ASCII码以1个字节存储,例如数字字符0的ASCII码是0110000,十进制表示为48.

  Unicode:为解决世界上上百种语言带来混合、冲突,各国有各国的标准,显示很容易出现乱码。Unicode就出现了,它把所有的语言的字符都统一到一套Unicode编码中,并定义每个语言的标准,所以Unicode又称统一码,万国码。大部分编程语言都支持Unicode,python内部编码也支持Unicode。

  GB2312:中国国家标准总局发布处理汉字的标准编码。

GBK:GB2312的扩展,向下兼容GB2312。

UTF-8:针对Unicode的可变长度字符编码,又称万国码。支持中文简体繁体及其它语言(如英文,日文,韩文)。

二、编码函数

1、decode()

decode()函数作用是将其他编码(比如ACSII、Byte、String)的字符串解码成Unicode。

2、encode()

encode()函数作用是将Unicode编码成终端软件能是识别的编码,就能正常显示了,比如UTF-8、GBK。

三、python编码处理

 

全部评论