当前位置:首页 > 培训职业 > 正文

在汉字信息处理中,汉字输入编码方法主要分为哪些

计算机中汉字的表示同样依赖于二进制编码,这一编码同样是人为设定的。汉字编码主要分为四大类:外码、交换码、机内码和字形码。

外码,也被称为输入码,是将汉字输入计算机的一系列键盘符号。常见的输入码包括拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等。优秀的输入码应当具备编码规则简洁、易于学习记忆、操作简便、重码率低以及输入速度高等特点,使用者可根据个人偏好选择适合自己的编码方式。

交换码,即国标码,由中华人民共和国国家标准GB2312—80《信息交换用汉字编码字符集—基本集》定义。该标准于1981年由中国标准总局制定。区位码是国标码的一种表现形式,将GB2312—80中的汉字和图形符号按94×94的矩阵排列,分为94个区和94个位,总共8836个位置。在区位码中,汉字和图形符号占据了7445个位置,剩下的1391个位置预留备用。

机内码是指在微机内部及磁盘上记录汉字时所使用的二进制代码,根据国标码的规定,每个汉字都有确定的二进制代码。机内码是计算机处理汉字时所使用的编码方式。

汉字的字形码是汉字的输出码,主要用于输出汉字时的图形显示。通常使用16×16点阵来展示每个汉字。字形码用于将汉字转化为图形,以供用户阅读。

汉字地址码则是指在汉字库中存储汉字字形信息的逻辑地址码。它与汉字内码之间存在简单的对应关系,以便简化内码到地址码的转换过程。这一机制确保了计算机能够快速准确地找到所需的汉字字形信息。

多重随机标签

猜你喜欢文章