计算机的信息编码
信息的编码包括以下三个方面:信息存储的单位、数值型数据的编码、非数值型数据的编码。
信息存储的单位
- 01
位(bit,也称作比特) 计算机中最小的数据单位,就是一个二进制位,一位的取值只能是0或1。例如32bit就是32位。
- 02
字节(Byte) 字节是计算机中信息组织和存储的基本单位,规定1字节就是8比特。宇节常用大B表示。例如1B=8bit。描述计算机的存储器的存储容量常常用KB,MB,GB,TB等单位来表示,其换算规则为: 1kB=1024B=2^10B 1MB=1024kB=2^20B 1GB=1024MB=2^30B 1TB=1024GB=2^40B
- 03
目前微型计算机的内存通常为几百MB到1GB,u盘的容量通常为64MB~2GB。而硬盘的容量为几十GB到几百GB。一个英文字母用1字节存储,一个汉字用2个字节存储。一本书通常为几万字到几十万字,你可以算算如果一个80GB硬盘可以存储多少本全文字型的书籍。一张光盘可以存储650MB,一张DVD可以存储4.7GB,—张数码相机的照片通常为1~5MB,一音MP3歌曲的容量为几个MB。一部电影的容量有几百MB,如果为高清晰电影,可能能需要占用几个GB容量。
- 04
字(word) 字是位的组合,并作为一个独立的信息单位进行存取、运算。一个字由若干个字节组成,其比特位数称作字长,不同的机器有不同的字长。字长有8位,16位,32位和64位等。字长越长,说明机器能够一次进行运算的数据位数就多.机器性能就好。目前微型机的CPU的字长一般采用64位,单片机的CPU的字长一般采用8位或16位。16位字长的数据表示范围肯定没有32位字长表示的数据范围大。
数值型数据的编码
- 01
数值型数据有整数和浮点数之分。318,-318就是整数,而318.32,-318.32就是浮点数。为了解决整数的负数在机器中的表示问题,人们提出了常用的3种表示方法,即原码表示、反码表示和补码表示。为了解决浮点数在机器中的表示问题,人们提出了浮点表示方法。整数的表示和浮点的表示最终都是以二进制形式表示,但是方法完全不同。
- 02
原码表示 原码是一种直观的二进制数表示形式,其中最高位表示符号。最高位“0”表示正,最高位“1”,表示负,数值部分用二进制数的绝对值表示。
- 03
反码表示 反码是—种中间过渡的编码,采用它的主要原因是为了计算补码。其负数编码方法是:符号位为1,其余位为将真值绝对值各位求反。
- 04
补码表示 负数的补码为该负数的反码在末尾再加上“1”。
非数值型数据的编码
- 01
数字编码:BCD码 BCD(Binar coded Decimal)码是十进制数在计算机中的一种表示方法。它是将十进制数的每一位直接用4位或者8位二进制码表示。 将十进制数的每一位直接用4位二进制码表示,称作压缩BCD码表示。 将十进制数的每一位直接用4位二进制码表示,高4位为全0,称作非压缩BCD码表示。
- 02
字符的编码 字符包括字母、数字、标点符号及特殊控制字符。目前国际上广泛使用的是ASCII(American standard Code for information interchange,即美国信息交换标准代码)。ASCII诞生于1963年,用于计算机内部字符的存储和计算机与外设的通信。标准的ASCII码为7位(即D6—D0位),存储时用一个字节表示(最高位D7用0表示),标准的ASCII字符集中定义了128个字符,其中10个阿拉伯数字(“0”~“9”),26个大写字母(“A”~“Z”),26个小写字母(“a”~“z”),33个符号及33个控制字符。有95个可打印字符,即20H~7EH,33个控制字符为00H~1FH。
- 03
数字“0”~“9”的ASCII码连续,从30H(或48)开始;大写字母“A”~“Z”连续,从41H(或65)开始;小写字母“a”~“z”连续,从61H(或97)开始。因此同一个字母,其小写比对应大写字母大20H,即“M”+20H=“m”,或者“M”+32=“m”。
- 04
AscII码的可打印字符输人方法:可以使用键盘上标记的按键直接输入,也可以按住Alt键,然后在小键盘上输入3位等值的十进制数字。例如,要输入字母“5”,可以直接按键盘上“5”键或小键盘的数字“5”键;也可以左手按住A1t键一直不放松,右手从小键盘上依次输入“0”、“5”、“3”3个键。因为“5”的AScII码为0110101B=35H=53。同理,要输入“{”,可以左手按住shift键,右手同时按“{[”键;也可以左手按住Att键一直不放松,右手从小键盘上依次输入“1”,“2”,“3”,3个键。因为字符“1”的ASCII码为11110llB=7BH=123。
- 05
汉字的编码 汉字信息在计算机的存储、交换、检索操作中使用的编码,称作内码。目前大多采用两个字节的汉字编码,即每个汉字用16位来表示。由于汉字的应用范围较广,汉字的编码字符集不相同,例如有GB/GBK码和BIG5码等。目前使用的国标码是1981年的GB2312~1980和2000年颁布的GB18030~2000。