打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
GBK 代码集和方正超大字符集定义表

郑永晓

内容提要 像笔者这样的文字工作者经常遇到冷僻字难以输入,在某些情况下,明明知道系统字库中收有该字,但即使是“全拼”输入法也难以找出此字。在这种情况下,就只好到GBK 字符集中去寻找,如果GBK字符集中仍找不到,就应该到“方正超大字符集”中寻找,该字符集中收录汉字65,531个。涵盖GB18030 (以及ISO10646-2000或Unicode 4.0) 中编入的汉字。虽然编制方法不甚科学,但该字符集仍能帮助我们输入绝大部分汉字。如果该字符集仍然没有你需要的字符,就只好造字或到日本“文字镜”中查询了。因而,只要我们能细心查询,一般情况下极少会遇到不能输入的汉字。此处整理的《GBK 代码集字符定义表》和《方正超大字符集》所收汉字有六万之多,根据笔者的使用体会,应该能够解决绝大部分汉字的录入问题。

GBK字符定义表使用说明:①在windows中安装区位输入法。②点击输入法的工具条,使其变成GBK内码输入状态。③在相关页码中找到所需字符后,按照左上角(两位数字)—下方(一位)—上方(一位)之顺序组成的四位数字键入即可完成输入。当然,最简单的方法即直接复制到word 中。笔画索引是笔者制作,偏旁后面的数字是本字符在本文件中的页码。该索引不很完备,用户在使用时需注意。


方正超大字符集使用说明:用户可以通过输入汉字的Unicode(或Surrogate)码来输入汉字。如在Word 2003 中,可以直接键入Unicode码,然后按Alt+X 转换成汉字。对于扩展B的汉字,请将前面两个“去掉。比如,针对Unicode 是00020000的一个冷僻字,在word中输入020000 ,然后按Alt+X即可,即可出现相应的汉字。要想知道每个字符的Unicode,也可以将光标定位在汉字后面,然后按ALT+X,相应的Unicode码则会显示出来。

为便于用户使用,笔者提供的此表包含了每个字符在《康熙字典》或《汉语大辞典》的页码。先查这其中的一部字典,找到该字所在页码,而后根据该页码在“超大字符集”中利用word 提供的搜索功能搜索此字,如果页码不足4位,请在前面加零。找到所需文字后复制到相应的编辑器如Word中。

注:“GBK”是继 简体中文Windows3.2 之后的简体中文 Windows 所使用之代码页,它涵盖了 Unicode 所有 20902 个中文字符以及中国国家标准化组织添加的大约 80 个中文字符。此前之“GB-2312”是简体中文 Windows 3.2 的代码页,仅含有 6763 个汉字。“GBK” 包含了“Big5”的繁体中文字符和“GB2312”中的简体中文字符。国际标准化组织在 ISO10646-2000 的基本平面(BMP 或者 Unicode 3.0, 下简称 Unicode)编入了27,564 汉字(U+4E00~U+9FFF以及U+3400~U+4DFF),即2000年3月在GB18030颁布时所建议支持的字汇。其中U+3400~U+4DFF部分的6582个汉字又称为扩展A。该组织还在ISO10646-2000 的第二平面扩展了42,711汉字(又称为扩展B)。由于这42,711汉字编排在ISO10646-2000 的第二平面,所以编码需要4个字节。为了能够存取处理这些4字节字符,在Unicode 中引入了Surrogate 机制(在ISO10646-2000中命名为UTF-16)。根据这样一种机制, 在Unicode中用两个16位编码就可以对ISO10646-2000 第二平面中的汉字进行存取。
可以使用 Alt+X 来显示特殊字符的 Unicode 字符代码。将插入点置于字符右侧,然后按 Alt+X。字符代码将取代字符,再按 Alt+X 将切换为字符。
如果字符当前使用系统代码页进行编码,您可将其转换为 Unicode 编码。若要执行该操作,请在字符前键入“x”,将插入点置于字符后,按 Alt+X,然后再按 Alt+X。
Windows 98 、Winme 等微软早期操作系统不能支持超大字符集。自Windows 2000始可使用该字符集,但需安装相关补丁(补丁程序本站“软件下载”一栏中提供下载)。在WindowsXP 、Windwos 2003 server 等操作系统中,配合安装Office 2003 ,使用方正超大字符集最为方便。

要安装宋体-方正超大字符集,请在安装界面上选择Office共享功能 –> 中文字体->中文超大字符集字体。如果您是从多语言包进行安装,请在安装界面上选择Office Shared Features- >Chinese fonts->Chinese Extended font。宋体-方正超大字符集字体包括了上面提到的全部27,564个汉字以及在第二平面中(42,711)选出的36,862个在中国大陆,香港特别行政区(以及部分台湾地区)使用的汉字。因此包括西文等常用字符在内,宋体-方正超大字符集共包括65,531个字符。

另一种安装方正超大字符集的方式是直接下载本文档附件10,打开“我的电脑”或“资源管理器”,依次打开“Windows ---Font"目录,然后选择”文件“--安装字体。将该字库安装到系统中。

有关本文档的几个附件:
附件1为 GBK 字符表,附有本人编纂的简单索引;
附件2为本人选取之GBK 难字表,按笔画排列;
附件3为 超大字符集第1部分;
附件4为 超大字符集第2部分。
以上附件均为不加密Word 文档,使用方便。
附件5为CJK基本字符集(CJK Unified Ideographs),5166KB,20901字;
附件6为CJK扩充集A(CJK Unified Ideographs Extension A),1682KB,6581字;
附件7为CJK扩充集B(CJK Unified Ideographs Extension B),12,442KB, 42710字。
附件8为CJK Compatibility Ideographs ,695KB;
附件9 CJK Compability Ideographs Supplement ;741 KB;

以上文件为PDF文档,需要Adobe pdf Reader 打开。

附件10 为方正超大字符集之字体文件。如没有Offce 2003或Office 2007安装盘,可使用该文件直接安装该字库。该文件为ZIP文档,请解压缩后使用。文件大小: 40,507K。

附件11 为超大字符集手写输入法, 为ZIP文档,解压缩后点击Setup 安装,安装后输入法中出现”逍遥笔 版本 4.0字样“,可用鼠标手写输入冷僻字,极为方便实用。文件大小:约20MB。

注:CJK为中日韩之缩写;

1993年中国发布GB13000.1-1993标准,收录CJK基本集和CJK扩充集A,替代原有GB2312-1980标准。该标准俗称GBK。
2000年中国发布GB18030-2000标准,开始收录CJK扩充集B,替代原有的GB13000.1-1993标准

Windows 3.x及Windows95只支持GB2312-1980
Windows 98开始支持GBK
Windows 2000开始支持Unicode 3.0
Windows XP开始支持GB18030-2000。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
国际标准超大字符集字体支持包:Unifonts 6.0
汉字简介
Word中生僻字输入详谈
汉字的编码体系
深入图解字符集与字符集编码(九)
Hello Unicode ——JAVA的中文处理学习笔记
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服