信息技术基础:Windows+WPS Office
上QQ阅读APP看书,第一时间看更新

1.2.4 常见的信息编码

计算机中的信息是指二进制数所表达的具体内容。在计算机中,数据以二进制数的形式存在,同样,文字、声音、图像等信息也都以二进制数的形式存在,但是人们习惯使用十进制数,因此就出现了一些转换码,可以对二进制数和十进制数进行转换。

1. 数字编码

数字编码是用二进制数码按照一定规律来描述十进制数的一种编码,其中最常见的是8421码,或称BCD(Binary Coded Decimal,二进制编码的十进制)码。它利用4位二进制数进行编码,从高至低的位权分别为23、22、21、20,即8、4、2、1,用来表示一位十进制数。表1-3列出了十进制数码与BCD码的对应关系。

表1-3 十进制数码与BCD码的对应关系

图片表格

根据这种对应关系,我们可以将任何十进制数与BCD码进行转换。

例:(52)10=(01010010)BCD

(1001010010000101)BCD=(9485)10

2. 西文字符编码

计算机除处理数字外,还需要把符号、文字等用二进制数表示,这样的二进制数被称为字符编码。

计算机中常用的西文字符编码有两种:EBCDIC(Extended Binary Coded Decimal Interchange Code,扩充的二进制编码的十进制交换码)和ASCII(American Standard Code for Information Interchange,美国信息交换标准码)。EBCDIC是IBM公司为其大型计算机开发的8位字符编码,微型计算机则通常采用ASCII。下面主要介绍ASCII。

ASCII是被国际标准化组织(International Standardization Organization,ISO)采纳的、计算机中普遍采用的一种字符编码。计算机中常用的基本字符包括十进制数码0~9、大写英文字母A~Z、小写英文字母a~z,以及运算符号、标点符号、控制符等,它们都能被转换成二进制编码形式,以便被计算机识别。表1-4列出的就是ASCII。

表1-4 ASCII

图片表格

在ASCII中,每个字符都可以用二进制编码表示。例如,要确定字符A的ASCII,可以从表1-4中查到字符A的高位是0100,低位是0001,将高位和低位拼起来就是A的ASCII,即01000001,十六进制形式记作41H。在计算机中用1字节(8位)来存储一个字符的ASCII,其中低7位二进制数对应字符的编码,每字节的最高位一般置0,在数据传输时该位可用作奇偶校验位。

3. 汉字的编码

汉字在计算机中也采用二进制的数字化信息编码。汉字的数量大,常用的汉字也有几千个,因此汉字编码比ASCII要复杂得多,只用1字节(8位)来存储是不够的。目前的汉字编码方案有2字节、3字节甚至4字节的。在汉字信息处理系统中,输入、内部处理、输出这3个过程对汉字的要求不同,所用代码也不尽相同,主要有用于汉字输入的输入码、机内处理和存储等的机内码、用于显示及打印的字形码。由于不同过程使用的代码不同,汉字信息处理系统在处理汉字时,要进行输入码、机内码、字形码等一系列的汉字代码转换,具体转换过程如图1-2所示。

图1-2 汉字代码的转换过程

(1)输入码(外码)

由于汉字的数量大,键盘上的键位无法与每个汉字一一对应。要解决汉字与键位的对应问题,就需要用到输入码。

输入码是指通过各种输入设备,以不同方式将汉字输入计算机所使用的代码。每一种输入码都与相应的输入编码规则有关。根据输入编码规则,输入码一般可分为数字码、音码、音形码等,例如五笔字型输入法就是一种典型的字形码输入法。

(2)机内码(内码)

机内码用以将输入时使用的多种输入码进行统一转换并存储,以方便机内的汉字处理。目前,机内码有几种不同的编码方式,如简体的GB/T 2312—1980,繁体的BIG5、GB/T 13000—2010、Unicode等。

GB/T 2312—1980是由中国国家标准总局在1980年发布,1981年5月1日开始实施的国家标准汉字编码集,即《信息交换用汉字编码字符集 基本集》,基本集中共有7445个字符符号,其中,非汉字符号682个,汉字符号6763个(包含一级汉字3755个,二级汉字3008个)。

(3)字形码(输出码)

汉字的字形码是表示汉字字形信息的编码,它与汉字内码一一对应。每个汉字的字形码是预先存放在计算机内的,字形码的集合被称为字库。当输出汉字时,计算机根据内码,在字库中查到其字形码,得知其字形信息,然后就可以显示或打印输出了。

描述汉字字形的方法主要有点阵字模法和轮廓字模法两种。点阵字模法用黑白点阵列来表现字形,该方法简单,但放大后会出现锯齿现象。轮廓字模法则采用数学方法来描述汉字笔画的轮廓,如中文Windows系统采用的TrueType字库;运用这种方法的优点是字形精度高,缺点是输出前要经过复杂的数学运算处理。

案例1-1使用Windows系统自带的计算器进行不同数制的转换

常用进制数的转换通过手工计算是比较烦琐的。而使用Windows系统自带的计算器组件,可以方便地将十进制数转换为二进制数、八进制数和十六进制数,或者将二进制数转换为十进制数、八进制数和十六进制数。

步骤1 单击Windows 10桌面左下角的“开始”按钮,在弹出的菜单中选择“计算器”。

步骤2 在“计算器”窗口中,单击左上角的按钮,在菜单中选择“程序员”,如图1-3所示。

步骤3 默认的输入状态为十进制(DEC)数,这里输入65,可以看到,已经自动显示出了对应的二进制(BIN)数01000001、八进制(OCT)数101、十六进制(HEX)数41,如图1-4所示。

图1-3 选择“程序员”

图1-4 将十进制数转换为其他进制数

步骤4 单击进制列表中的BIN,切换到二进制数输入状态,输入1101101,可以看到,已经自动显示出了对应的八进制数155、十进制数109、十六进制数6D,如图1-5所示。

图1-5 将二进制数转换为其他进制数