打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
GB2312, GBK, GB18030 这几种字符集主要的区别是什么?
早期的计算机使用7位的ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5。 
GB2312(1980年):16位字符集,收录有6763个简体汉字,682个符号,共7445个字符; 
优点:适用于简体中文环境,属于中国国家标准,通行于大陆,新加坡等地也使用此编码; 
缺点:不兼容繁体中文,其汉字集合过少。 
GBK(1995年):16位字符集,收录有21003个汉字,883个符号,共21886个字符; 
优点:适用于简繁中文共存的环境,为简体Windows所使用(代码页cp936),向下完全兼容gb2312,向上支持 ISO-10646 国际标准 ;所有字符都可以一对一映射到unicode2.0上;
缺点:不属于官方标准,和big5之间需要转换;很多搜索引擎都不能很好地支持GBK汉字。
GB18030(2000年):32位字符集;收录了27484个汉字,同时收录了藏文、蒙文、维吾尔文等主要的少数民族文字。 
优点:可以收录所有你能想到的文字和符号,属于中国最新的国家标准; 
缺点:目前支持它的软件较少。

补充:
  • 现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。
  • 从ASCII、GB2312、GBK到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。
  • GB18030是中国所有非手持/嵌入式计算机系统的强制实施标准。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
手握两个锟斤拷,口中直呼烫烫烫
GBK与UTF
GB18030 编码范围, GB18030 编码表
字符编码方式
常用字符集编码详解:ASCII 、GB2312、GBK、GB18030、...
java中文乱码解决之道—
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服