python常见的字符编码有哪些?
刚开始学习Python的时候,一定要对基础知识有一定的了解,比如字符编码。你知道Python中常见的字符编码有哪些吗?让我们来看看Python字符编码的常见类型。
第一种:ASCII码。它是一种基于拉丁字母的计算机编码系统。它主要用于显示现代英语和其他西欧语言。它是最常见的单字节编码系统,相当于国际标准IS/IEC646。由于计算机是美国人发明的,计算机中最早编码的字母只有127个,即大小写英文字母、数字和一些符号。这个编码表称为ASCII编码。例如大写字母A的编码是65,小写字母a的编码是97,最后的128称为扩展ASCII码。
第二种:GBK和GB2312。能够在计算机中显示汉字是非常重要的,但是ASCII表中没有偏旁部首,所以我们需要一张中文和数字的对应表。一个字节最多只能表示256个字符,可以用来处理中文。显然一个字节是不够的,所以我们需要用两个字节来表示它,所以中国开发了GB2312代码来写中文。
第三种:Unicode。因为每个国家都有自己的一套代码,冲突不可避免,于是Unicode诞生了。它可以将所有语言统一成一组编码,这样就不会出现乱码问题。现代操作系统和大多数编程语言都直接支持Unicode。
第四种:UFT-8。基于经济性原则,出现了将Unicode编码转换为变长编码的UTF-8编码。UTF-8编码根据不同的数字大小将Unicode字符编码为1-6个字节。常用的英文字母编码为1个字节,汉字通常为3个字节。只有非常稀有的字符才会被编码成4-6个字节,如果要传输的文本包含大量英文字符,使用UTF-8编码可以节省空间。
鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com
图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!