谷歌翻译中文简体GBK和gb18030有什么区别?
GB18030和GBK,GB2312都是中文编码其中GB2312主要包含六千多个常用简体字GBK除了简体字还包括繁体字符而GB18030包含了GBK的字符集,也是目前最新的中文字符集简单点说,GB18030包含GBK包含GB2312
G
B2312编码大约包含6000多汉字(不包括特殊字符),编码范围为第一位b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1
-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和其他字符大约7573个字符编码gbk编码是对G
B2312编码的扩充,容纳的汉字更多,但仅仅是扩充,没有质的变化。保留了所有G
B2312编码,在此基础上进行编码范围的扩充.容纳(包含特殊字符)共22014个字符编码.gb18030编码是在gbk编码基础上的扩充,因为汉字更多,仅仅使用两位编码已经不能容纳要求的汉字,所以采用了2\4位混和的办法,可以支持更多的汉字编码。并且保留了原有的gbk
2字节编码兼容G
B2312和gbk编码的文件。大概容纳55657个编码(包含特殊字符)unicode
编码(也就是UTF编码):俗称万国码,致力于使用统一的编码准则表达各国的文字。为表达更多的文字,utf-8采用2/3混编的方式。目前容纳的汉字范围小于gbk编码。并且以3字节的方式处理中文,带来了兼容性的问题,原有的gbk,G
B2312,gb18030编码文件都不能正常的处理,还有很长的路要走。
鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com
图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!