|
为了使信息的表示、交换、存储或加工处理方便,在计算机系统中通常采用统一的编码方式,因此制定了编码的国家标准或国际标准。计算机使用这些编码在计算机内部和键盘等终端之间以及计算机之间进行信息交换。
1.二-十进制编码
在计算机中,为了适应人们的习惯,采用十进制数方式对数值进行输入和输出。这样,在计算机中就要将十进制数变换为二进制数。将十进制数变换为二进制数的方法很多,但是不管采用哪种方法的编码统称为二-十进制编码,即BCD码(Binary Coded Decimal)。在二-十进制编码中最常用的一种是8421码。它采用4位二进制编码表示1位十进制数,其中4位二进制数中由高位到低位的每一位权值分别是:23、22、21、20,即8、4、2、1。BCD码在形式上是0和1组成的二进制形式,而实际上它表示的是十进制数,只不过是每位十进制数用4位二进制编码表示,运算规则和数制都是十进制。
2.字符编码
英文字母和常用的数学符号与标点符号等字符通常采用ASCII(American Standard Code for Information Interchange,美国信息交换标准码)编码。
ASCII码有7位码和8位码两种形式。7位ASCII码用7位二进制数进行编码,可以表示128个字符。8位ASCII码用8位二进制数进行编码,可以表示256个字符。
标准ASCII 码为7位码,也叫基础ASCII码,表示所有的大写和小写字母、数字0~9、标点符号,以及在美式英语中使用的特殊控制字符共128个符号。8位ASCII码的前127个符号编码与7位码相同,后128个称为扩展ASCII码。
计算机存储单元中,7位ASCII码常用一个字节来表示(8位二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。
3.汉字编码
汉字种类繁多,编码比拼音文字困难,因此在不同的场合要使用不同的编码,通常有4种类型的编码,即输入码、国标码、内码、字形码。
(1)输入码
输入码所解决的问题是如何使用西文标准键盘把汉字输入到计算机内。有各种不同的输入码,主要分为三类:数字编码、拼音编码和字形编形码。
(2)国标码
国标码又称为汉字交换码,在计算机之间交换信息用,用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为214=16384个。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20)便得到国标码。
(3)内码
汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128。
为了统一表示世界各国的文字,1993年国际标准化组织公布了“通用多八位编码字符集”的国际标准ISO/IEC 10646,简称UCS(Universal Code Set),它为包括汉字在内的各种正在使用的文字规定了统一的编码方法。
(4)字形码
字形码是表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式,通常用点阵、矢量函数等表示。
4.多媒体信息编码
所谓多媒体信息是指由文字、声音、图像为载体的信息。图像和声音信息在计算机中也是以二进制形式编码的。
(1)图像编码
一幅彩色图像(image)可以看成是由许许多多个彩色的点(像素)组成的,如图1所示。每个像素点有深浅不同的颜色,这种点越小,图像越清晰。
图1 像素图像示意 | (2)声音编码
声音是由声波传递的,声波编码数据在文件中的存储形式、排列顺序等称为文件格式,因各种应用需求不同,存在着多种多样的声音文件格式,有些文件格式可以存储多种不同的音频编码数据,也有些文件格式是为某一种音频编码特制的。 |
|