汉字编码分为哪些类别?

供稿:hz-xin.com     日期:2024-05-13

汉字编码主要分为四大类:汉字输入码、汉字交换码、汉字内码和汉字字形码。

(1)汉字的外部码

汉字的外部码简称外码,又叫输人码,是输人汉字的一组键盘符号。使用不同的输入方法,同一汉字的外部码不同。用户应选用易记忆、操作简单、位码少、重码少和输人速度快的外码。

(2)汉字的内部码

汉字的内部码又称汉字内码或汉字机内码。机器接收到外码后,要转换成内码进行存储、运算和传送。用二个字节表示汉字的内码。为了和西文符号区分,内码的最高位设为“1”。内码通常用汉字在车库中的物理位置表示,可以是汉字在字库中的序号,也可以是字库中的存储位置。

(3)汉字交换码

在计算机之间交换信息时,要求传送的汉字代码符合国家规定的交换码标准,即符合GB2312-80信息交换用汉字编码集,又称为国标码。国标码收集了7445个图形字符,其中有6763个汉字和各种符号709个。

(4)汉字字形码

在显示或打印汉字时,还涉及到字形码,又称输出码。汉字字形是指原来铅字排版汉字的大小和形状,在计算机中指组成汉字的点阵。

尽管汉字字形有多种变化,笔画繁简不一,但都是方块字且大小相同,都可以写在同样的方块中。把一个方块看成m行n列矩阵,共有m×n个点,称为汉字点阵。如16×16点阵的汉字,共有256个点。

汉字编码

汉字编码(Chinese character encoding )是为汉字设计的一种便于输入计算机的代码。由于电子计算机现有的输入键盘与英文打字机键盘完全兼容。因而如何输入非拉丁字母的文字(包括汉字)便成了多年来人们研究的课题。

汉字信息处理系统一般包括编码、输入、存储、编辑、输出和传输。编码是关键。不解决这个问题,汉字就不能进入计算机。

汉字进入计算机的三种途径 分别为:

①机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。

②通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。

③通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机。

机器自动识别汉字和汉语语音识别,国内外都在研究,虽然取得了不少进展,但由于难度大,预计还要经过相当一段时间才能得到解决。在现阶段,比较现实的就是通过汉字编码方法使汉字进入计算机。



汉字代码问题...
答:一、汉字编码的种类 汉字编码中现在主要用到的有三类,包括GBK,GB2312和Big5。1、GB2312又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆。新加坡等地也使用此编码。它是一个简化字的编码规范,当然也包括其他的符号、字母、日文假名等,共7445个图形字符,其中汉字占6763个。我们平时说...

汉字编码有哪些
答:汉字的编码体系主要有以下几种:⑴ 国标、区位、“准国标”国标是将七千余个汉字以及标点符号、外文字母等,排成一个94行、94列的方阵。方阵中每一横行称为一个“区”,每个区有94个“位”。一个汉字在方阵中的坐标,称为该字的区位码。为了与美标(ASCII)的形象码的范围重合,出现了“国标码”...

中文字符编码的方式有哪些?
答:1. 汉字信息交换码(国标码)《信息交换用汉字 编码字符集·基本集》是我国于1980年制定的国家标准 GB2312-80,代号为国标码,是国家规定的用于汉字信息处理使用的代码依据。   GB2312-80中规定了信息交换用的6763个汉字和682个非汉字图形符号(包括几种外文字母、数字和符号)的代码。6763个汉字又按...

字符常见的几种编码方式
答:2)对于n字节的符号(n>1),第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的unicode码。5.GBK/GB2312/GB18030 GBK和GB2312都是针对简体字的编码,只是GB2312只支持六千多个汉字的编码,而GBK支持1万多个汉字编码。而GB...

汉字国标码把汉字分成几类?
答:汉字是世界上最古老的文字之一,对周边的影响也是非常巨大的,是其它文字的母字。它是记录事件的书写符号。在形体上逐渐由图形变为由笔画构成的方块形符号,所以汉字一般也叫“方块字”。它由象形文字(表形文字)演变成兼表音义的意音文字,但总的体系仍属表意文字。所以,汉字具有集形象、声音和辞义...

汉字的编码方式都有哪些?
答:BIG5码:BIG5码是针对繁体汉字的汉字编码,目前在台湾、香港的电脑系统中得到普遍应用,繁体版Windows是用Big5作系统内码。Unicode码:Unicode码是最新的国际标准编码,采用二个字节 (16-bit) 编码,收入了几乎所有国家的文字符号,适用于所有语言的作业平台,但与ANSI码不兼容,只应用于支援Unicode的程式。

汉字输入码可分为几类?有哪些特点?
答:4,序号码:这是一类基于国标汉字字符集的某种形式的排列顺序的汉字输入码.将国标汉字字符集以某种方式重新排列以后,以排列的序号为编码元素的编码方案即是汉字的序号码.常用的汉字输入法:常用的汉字输入有拼音和五笔两种,教程重点讲述五笔字型汉字输入法.输入法的总体分类:根据语言分为英文和汉字输入法两大...

汉字编码有哪几种?
答:BCD码:使用4位二进制数表示1位十进制数,常称为二进制编码的十进制数。ASCII码:美国(国家)信息交换标准(代)码,一种使用7个或8个二进制位进行编码的方案,最多可以给256个字符(包括字母、数字、标点符号、控制字符及其他符号)分配(或指定)数值。Hanzi bianma汉字编码Chinese character encoding 为汉字...

汉字输入编码的类型
答:汉字编码方案的一种,可归结为下列几种类型:(1)汉字拼音编码 以汉语拼音为基础的汉字输入编码,在汉语拼音键盘或经过处理的西文键盘上,根据汉字读音直接键入拼音。(2)汉字字形编码所有的汉字都由横、竖、撇、点、折、弯有限的几种笔划构成,并且又可分为‘左右’、‘上下’、‘包围’、‘单体’...

汉字信息处理过程中需要使用哪些汉字编码?各自的作用是什么?
答:汉字信息处理过程中需要使用汉字编码如下:(1)汉字输入码,简称外码,其作用是将汉字信息输入到计算机内部;(2)汉字交换码,其作用是在汉字信息系统之间进行汉字交换时所使用的编码;(3)汉字内码,其作用是信息处理系统内部存储、处理、传输汉字而使用的编码;(4)汉字字形码,其作用是表示汉字字形...