计算机的数据与编码
- 格式:doc
- 大小:85.50 KB
- 文档页数:13
计算机中的数制与编码在计算机科学中,数制和编码是非常重要的概念。
数制是一种数学表示法,用于表示不同类型的数值。
而编码是将字符、符号或信息转化为特定形式的过程。
数制和编码在计算机中扮演着至关重要的角色,它们用于存储、传输和处理数字和数据。
数制(Number System)在计算机中,常见的数制有二进制、十进制、八进制和十六进制。
每种数制有其各自的特点和用途。
1. 二进制(Binary System):二进制是最常见和基础的数制,在计算机中广泛使用。
它只包含两个数字0和1,以2为基数。
计算机内部存储和处理的数据都是以二进制形式表示的。
每个二进制位称为一个bit(二进制位),每8位为一个字节(Byte)。
2. 十进制(Decimal System):十进制是我们日常生活中最常用的数制,以10为基数,包含0-9的数字。
在计算机中,通常使用十进制数制进行人机交互和显示。
3. 八进制(Octal System):八进制以8为基数,包含0-7的数字。
在计算机中,八进制表示法不太常用,但是在Unix操作系统中仍然使用八进制权限表示法。
4. 十六进制(Hexadecimal System):十六进制以16为基数,包含0-9的数字和A-F的字母。
在计算机中,十六进制数制常用于表示内存地址和字节编码。
十六进制数更加简洁和紧凑,便于人们阅读和理解。
编码(Coding)在计算机中,数据和字符需要以特定的方式进行编码,以便计算机可以正确存储和处理它们。
常见的编码方式包括ASCII码、Unicode、UTF-8和UTF-16等。
1.ASCII码:ASCII(American Standard Code for Information Interchange)是一种最早的字符编码标准,用于将字符映射为对应的数字编码。
ASCII码使用7位二进制数表示128个字符,包括英文字母、数字、标点符号和控制字符等。
2. Unicode:Unicode是一种字符编码标准,为世界上几乎所有的字符建立了唯一的数字表示。
四年级信息科技数据与编码主要涉及数据和编码的基本概念、表示方法以及应用。
以下是对该主题的800字回答:数据与编码是计算机科学中的两个基本概念,它们是信息技术的基础。
在四年级的信息科技课程中,学生将学习数据与编码的基本概念和应用。
一、数据数据是计算机处理的原始事实、信息或数字。
它们可以是数字、字母、符号、图片、音频和视频等。
数据可以是结构化的,也可以是非结构化的。
结构化数据具有固定的格式和规范,如数字、日期和时间等。
非结构化数据则没有固定的格式,如文本、图片和音频等。
在计算机中,数据通常以二进制形式表示,因为二进制是计算机内部使用的语言。
这意味着数据以0和1的形式存在,每个0或1代表一个位(bit)。
这些位组成字节(byte),字节又组成更复杂的数据结构,如记录、文件和网络数据包等。
二、编码编码是使用符号代表数据的过程。
编码有很多种,包括数字编码(如二进制)、字符编码(如ASCII码)和图像编码(如JPEG)。
编码允许我们以紧凑的方式存储和传输数据,同时保持数据的完整性和可读性。
在四年级的信息科技课程中,学生将学习基本的数字编码,如二进制。
二进制是一种使用0和1代表数据的数字系统。
它是最基本的数字系统之一,许多其他数字系统都基于二进制系统。
例如,计算机中的字节使用二进制编码表示,网络数据包使用二进制编码进行传输。
三、数据与编码的应用数据和编码在信息技术中有着广泛的应用。
例如,它们在计算机编程中起着至关重要的作用,因为编程语言是计算机可以理解和执行的代码,而代码是由数据和编码组成的。
此外,数据和编码在通信、存储、计算和人工智能等领域也起着重要作用。
在日常生活中,学生也可以看到数据和编码的应用。
例如,数字货币的交易记录是以数字形式存储的,而这些数字记录是通过编码技术创建的。
互联网上的网页也是由数据和编码组成的,以便计算机可以读取和理解它们。
总之,数据与编码是信息技术的基础,它们在计算机科学和信息技术的各个领域中起着至关重要的作用。
计算机数据与编码1.6.1信息和数据信息是人们对客观世界的认识,即对客观世界的一种反映。
数据是表达现实世界中各种信息的一组可以记录、可以识别的记号或符号。
它是信息的载体,是信息的具体表现形式。
数据形式可以是字符、符号、表格、声音、图像等。
数据可以在物理介质上记录或传输,并通过输入设备传送给计算机处理加工。
数据的单位分为以下几种:1)位(bit)计算机中最小的数据单位二进制的一个数位,称为比特位,简称位。
1位二进制只能表示两种状态,即0或1。
n位二进制能表示2n种状态2)字节(Byte)相邻8个比特位组成一个字节,用B表示。
字节是计算机中用来表示存储容量大小的基本单位。
1B = 8bits1KB = 210B = 1024B1MB = 220B = 1024KB1GB = 230B = 1024MB1TB = 240B = 1024GB3)字(Word)在计算机中作为一个整体被存取、传送、处理的二进制数位叫做一个字,每个字中二进制位数的长度,称为字长。
用8位字长表示一个整数与用16位字长表示一个整数,其所表示的数的上限和下限是不一样的。
字长所占位数其所表示的数的范围8 -128 ~ 127 即:-27 ~ (27 - 1)16 -32768 ~ 32767 即:-215 ~ (215 - 1)32 -48 ~ 47 即:-231 ~ (231 - 1)1.6.2 数字化信息编码在计算机内部,可用物理器件的高低电平代表二进制的“0”和“1”,另外,脉冲的正负极性,晶体管的导通和截止都可以用来表示二进制的“0”和“1”。
由于二进制只有两个状态,数据的传输和处理不容易出错,另外二进制数的记数、加减法运算规则较为简单,可用开关电路实现,且二进制的“0”和“1”正好与逻辑命题的两个值“真”和“假”相对应,为计算机种中实现逻辑运算和逻辑判断提供了便利的条件。
所以,在计算机中,广泛采用的是只有“0”和“1”两个基本符号组成的基二码,或称为二进制码。
计算机中数据的表示与信息编码计算机最主要的功能是处理信息,如处理文字、声音、图形和图像等信息。
在计算机内部,各种信息都必须经过数字化编码后才能被传送、存储和处理。
因此要了解计算机工作的原理,还必须了解计算机中信息的表现形式。
1.2.1 计算机使用的数制1.计算机内部是一个二进制数字世界计算机内部采用二进制来保存数据和信息.无论是指令还是数据,若想存入计算机中,都必须采用二进制数编码形式,即使是图形、图像、声音等信息,也必须转换成二进制,才能存入计算机中。
为什么在计算机中必须使用二进制数,而不使用人们习惯的十进制数?原因在于:⑴易于物理实现:因为具有两种稳定状态的物理器件很多,例如,电路的导通与截止、电压的高与低、磁性材料的正向极化与反向极化等。
它们恰好对应表示1和0两个符号。
⑵机器可靠性高:由于电压的高低、电流的有无等都是一种跃变,两种状态分明,所以0和1两个数的传输和处理抗干扰性强,不易出错,鉴别信息的可靠性好。
⑶运算规则简单:二进制数的运算法则比较简单,例如,二进制数的四则运算法则分别只有三条。
由于二进制数运算法则少,使计算机运算器的硬件结构大大简化,控制也就简单多了。
虽然在计算机内部都使用二进制数来表示各种信息,但计算机仍采用人们熟悉和便于阅读的形式与外部联系,如十进制、八进制、十六进制数据,文字和图形信息等,由计算机系统将各种形式的信息转化为二进制的形式并储存在计算机的内部.2.进位计数制数制,也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。
数制可分为非进位计数制和进位计数制两种.非进位计数制的数码表示的数值大小与它在数中的位置无关;而进位计数制的数码所表示的数值大小则与它在数中所处的位置有关。
而我们在这里讨论的数制指的都是进位计数制。
进制是进位计数制的简称,是目前世界上使用最广泛的一种计数方法,它有基数和位权两个要素.➢➢基数:在采用进位计数制的系统中,如果只用r个基本符号(例如0,1,2,…,r—1)表示数值,则称其为r数制(Radix—r Number System),r称为该数制的基数(Radix).如日常生活中常用的十进制,就是r=10,即基本符号为0,1,2,…,9。
计算机常用编码一、字符编码字符编码是将字符集中的每个字符与一个唯一的数字码相对应的过程。
常见的字符编码标准包括ASCII码、Unicode、GB2312、GBK和UTF-8等。
ASCII码是最早的字符编码标准,它将128个字符分配了0-127的码值。
Unicode则是一个跨平台的字符编码标准,它为每个字符提供了一个唯一的码值,适用于国际化的应用。
GB2312和GBK是中国常用的字符编码标准,支持中文字符的编码。
UTF-8是一种可变长度字符编码,它支持多种语言字符,并且兼容ASCII码。
二、数值编码数值编码是指将数值数据转换为二进制或其他进制表示的过程。
常见的数值编码方式包括二进制、十进制、十六进制等。
二进制是计算机内部处理数据的格式,所有的信息都被表示成二进制形式。
十进制是我们日常使用的数字表示方式,而十六进制则是一种简化的数字表示方式,它使用数字0-9和字母A-F来表示数值。
三、图像编码图像编码是指将图像数据转换为二进制或其他进制表示的过程。
常见的图像编码方式包括JPEG、PNG、BMP等。
JPEG是一种有损压缩的图像编码格式,广泛应用于网络和多媒体应用中。
PNG是一种无损压缩的图像编码格式,支持透明度和渐变效果。
BMP是一种简单的图像编码格式,它是未经压缩的位图格式。
四、音频编码音频编码是指将音频数据转换为二进制或其他进制表示的过程。
常见的音频编码方式包括MP3、AAC、WAV等。
MP3是一种有损压缩的音频编码格式,广泛应用于音乐和语音的存储和传输中。
AAC是一种高级音频编码格式,支持更高的音质和更高效的压缩。
WAV是一种无损压缩的音频编码格式,支持多种音频采样率和位深度。
五、视频编码视频编码是指将视频数据转换为二进制或其他进制表示的过程。
常见的视频编码方式包括MPEG、AVI、MOV等。
MPEG是一种有损压缩的视频编码格式,广泛应用于视频存储和传输中。
AVI是一种无损压缩的视频编码格式,支持多种视频分辨率和帧率。
计算机中信息的编码计算机中的信息编码是指将各种类型的数据转化为计算机可以处理和存储的二进制形式。
通过对信息进行编码,计算机可以在数据传输、存储和处理过程中,准确地表示和解释各种不同类型的信息。
本文将就计算机中信息的编码进行详细探讨。
一、信息编码的基本原理信息编码是将不同类型的信息转化为二进制形式的过程。
在计算机中,信息可以分为数字、文本、图像和音频等不同类型。
为了能够准确地表示这些信息,计算机使用不同的编码方式。
1. 数字编码数字编码是将数字信息转化为计算机可以处理的二进制形式。
最常用的数字编码方式是十进制和二进制编码。
十进制编码即使用十个数字0-9来表示数字信息,而二进制编码使用0和1来表示。
在计算机中,一般采用二进制编码来表示数字信息。
2. 文本编码文本编码是将字符信息转化为计算机可以理解的形式。
最常用的文本编码方式是ASCII码和Unicode码。
ASCII码采用7位二进制来表示128个不同的字符,其中包括大写和小写字母、数字、标点符号等。
Unicode码则采用16位二进制来表示字符,能够涵盖全球各种语言和符号。
3. 图像编码图像编码是将图像信息转化为计算机可以存储和显示的形式。
常见的图像编码方式包括位图和矢量图。
位图是将图像划分为像素点,并将每个像素点的颜色信息转化为二进制码。
矢量图则是通过记录图像中各个元素的坐标、颜色和形状等信息来表示图像。
4. 音频编码音频编码是将声音信息转化为计算机可以处理的形式。
常见的音频编码方式包括PCM编码和MP3编码。
PCM编码是将声音波形转化为数字信号的过程,采用脉冲编码调制方式,可保持声音的原始质量。
而MP3编码则是一种有损压缩方式,通过去除无关的声音信号来减小文件大小。
二、信息编码的应用领域信息编码在计算机科学和通信领域有着广泛的应用。
以下是几个常见的应用领域:1. 网络通信在网络通信中,信息编码起到了至关重要的作用。
通过对信息进行编码和解码,可以在不同设备之间准确地传递和解释数据。
计算机中数据的表示与信息编码计算机作为现代科技的核心工具,承载着海量的数据信息。
而数据的表示与信息编码则是计算机运算的基础,对于计算机科学与技术的学习者来说,了解数据的表示与信息编码原理显得尤为重要。
本文将就计算机中数据的表示与信息编码进行深入探讨。
一、数据的表示计算机中的数据以二进制的形式进行表示。
在二进制系统中,只有两个符号:0和1。
将数据转化为二进制形式,有助于计算机对数据的处理与存储。
1. 整数表示在计算机中,整数可以使用有符号数和无符号数两种方式进行表示。
(1)有符号数:有符号数用来表示正负数。
通常采用补码的形式来表示,即将其二进制表示的数值进行符号位的变换。
(2)无符号数:无符号数仅用来表示正数,不考虑负数的情况。
无符号数的范围比有符号数更大,但无法表示负数。
2. 小数表示计算机中的小数表示可以采用浮点数的形式。
浮点数是一种科学计数法,能够表示较大或较小的实数。
浮点数由两个部分组成:尾数和指数。
3. 字符表示计算机中的字符可以通过ASCII码来进行表示。
ASCII码是一种用于计算机和电子通信中的字符编码标准,使用7位或8位二进制数来表示128或256种不同的字符。
二、信息编码1. 压缩编码压缩编码是一种将数据压缩以减少存储空间和传输带宽的技术。
其中,Huffman编码是一种被广泛使用的压缩编码技术。
Huffman编码通过对使用频率较高的字符进行较短的编码,降低了整体的存储或传输成本。
2. 错误检测与纠正编码在数据传输过程中,由于传输噪声等原因,数据可能会出现错误。
为了检测和纠正这些错误,需要使用错误检测与纠正编码技术,其中最常见的是奇偶校验码和循环冗余检测码(CRC码)。
(1)奇偶校验码:奇偶校验码是通过在数据位中添加一个奇偶位来检测数据传输中的单一位错误。
(2)CRC码:CRC码是一种多项式编码技术,通过在数据位后添加一定数量的冗余位,以检测和纠正数据传输中的错误。
3. 加密编码加密编码是一种将数据进行加密处理,以确保数据在传输和存储过程中的安全性。
计算机的数据与编码随着科技的飞速发展,计算机已经成为我们生活中不可或缺的一部分。
无论是在工作、学习还是娱乐中,计算机都扮演着重要的角色。
然而,计算机与人之间的交流并不是直观的,而是通过一种特殊的方式来实现,即数据与编码。
让我们来看看什么是计算机数据。
在计算机科学中,数据是用来表示事物或现象的一种符号记录。
它可以是数字、文字、图像、音频或视频等。
例如,当我们输入“Hello World”到计算机中时,计算机将把我们输入的字符存储为二进制数据,每个字符都被转换为一串二进制代码。
接下来,让我们来看看什么是编码。
编码是将信息转换为计算机可识别的形式的过程。
编码可以是二进制编码、ASCII编码、Unicode编码等。
例如,当我们输入的“Hello World”被转换为二进制数据后,计算机将根据某种编码规则将其解析为字符并显示出来。
在计算机中,数据和编码是密不可分的。
它们之间的关系可以概括为以下几点:1、数据是编码的对象:编码是将数据转换为计算机可识别的形式的过程,因此数据是编码的对象。
2、编码是数据处理的基础:在计算机中,数据处理包括数据的存储、传输、显示等。
编码是实现这些操作的基础,因为只有通过编码,计算机才能正确地识别和处理数据。
3、数据和编码的相互转换:在计算机中,数据和编码之间需要进行相互转换。
例如,当我们将数据输入到计算机中时,我们需要将其转换为二进制代码进行存储;当我们将数据输出到计算机屏幕上时,我们需要将其从二进制代码转换为字符进行显示。
计算机的数据与编码是密不可分的。
它们之间的关系是计算机处理信息的基础。
只有了解数据与编码的关系和转换方式,我们才能更好地理解和应用计算机科学中的其他概念和技术。
在当今数字化的世界中,计算机已成为我们生活、学习和工作中不可或缺的工具。
而在计算机科学中,信息编码是实现信息存储、传输和处理的关键技术。
本文将探讨计算机中的信息编码,帮助读者更好地理解这一重要概念。
信息编码是指将信息转换为计算机能够处理的格式的过程。
计算机中信息的编码计算机中的信息编码是指将各种形式的数据转换为计算机能够识别和处理的二进制形式。
信息编码是计算机科学和计算机工程中的重要概念,它涉及到许多不同的编码系统和标准。
一.数字编码系统1.二进制编码:二进制编码是计算机内部使用的最基础的编码系统,它只包含两个数字0和1、计算机中的所有数据最终都要转换为二进制形式来进行处理和存储。
2.十进制编码:十进制编码是人们最常用的一种编码系统,它使用10个数字0-9来表示。
在计算机内部,十进制编码通常需要转换为二进制编码来进行处理。
3.八进制编码:八进制编码使用8个数字0-7来表示。
在计算机中,八进制编码有时用于表示一些特殊的控制字符。
4.十六进制编码:十六进制编码使用16个数字0-9和字母A-F来表示。
它经常在计算机中用于表示内存地址、颜色值等。
二.字符编码系统1.ASCII编码:ASCII编码是一种最早的字符编码系统,它使用7位二进制数来表示128个常见字符,包括英文字母、数字、标点符号等。
后来发展出了8位ASCII编码,称为扩展ASCII码,可以表示更多的字符。
2. Unicode编码:Unicode编码是一种广泛使用的字符编码系统,它包含了全世界几乎所有的字符,每个字符都有对应的唯一编码。
Unicode编码使用32位二进制数来表示字符,其中大部分字符使用了16位编码,称为基本多语言面(BMP)编码。
3. UTF-8编码:UTF-8是一种可变长度的Unicode编码,它可以根据字符的不同来使用1到4个字节的长度。
UTF-8编码兼容ASCII编码,对于ASCII字符只需要1个字节的编码,可以有效地节省存储空间。
4. UTF-16编码:UTF-16是Unicode的另一种编码方式,它使用16位编码来表示字符。
对于BMP范围内的字符,UTF-16编码与Unicode编码相同。
5.GBK编码:GBK编码是对汉字的一种常用编码系统,采用双字节编码,兼容ASCII编码。
数据与数据编码习题一、数据编码的基本概念数据编码是将信息转化为特定的编码形式,以便能够在计算机系统中进行存储、传输和处理。
数据编码的目的是提高数据的可靠性、安全性和效率。
二、数据编码的分类1. 数字编码:将数字信息转化为二进制形式进行存储和传输。
常见的数字编码方式有二进制编码、十进制编码和BCD编码等。
2. 字符编码:将字符信息转化为二进制形式进行存储和传输。
常见的字符编码方式有ASCII码、Unicode和UTF-8等。
3. 图像编码:将图像信息转化为二进制形式进行存储和传输。
常见的图像编码方式有JPEG、PNG和GIF等。
4. 音频编码:将音频信息转化为二进制形式进行存储和传输。
常见的音频编码方式有MP3、AAC和WAV等。
5. 视频编码:将视频信息转化为二进制形式进行存储和传输。
常见的视频编码方式有MPEG、H.264和AVI等。
三、数据编码的应用1. 数据存储:数据编码可以将各种类型的数据转化为二进制形式,以便在计算机系统中进行存储。
不同类型的数据可以使用不同的编码方式进行存储,以提高存储效率和可靠性。
2. 数据传输:数据编码可以将数据转化为二进制形式,以便在计算机网络中进行传输。
通过编码,可以将数据分割成多个数据包,并添加校验码等冗余信息,以提高传输的可靠性和安全性。
3. 数据处理:数据编码可以将数据转化为计算机可以处理的形式,以便进行各种数据操作和分析。
通过编码,可以将数据转化为数字、字符、图像、音频或视频等形式,以满足不同的数据处理需求。
四、数据编码的常见问题和解决方法1. 数据丢失:在数据传输或存储过程中,可能会出现数据丢失的情况。
为了解决这个问题,可以使用冗余编码、差错检测和纠错编码等方法,以提高数据的可靠性。
2. 数据安全:在数据传输或存储过程中,可能会面临数据被篡改或窃取的风险。
为了解决这个问题,可以使用加密算法、数字签名和访问控制等方法,以提高数据的安全性。
3. 数据压缩:在数据传输或存储过程中,为了提高传输效率或节省存储空间,需要对数据进行压缩。
计算机的数据与编码一、数据存储单位1.数据:对事实、概念或指令的一种表示形式,可以由人工或自动装置进行处理。
(1)数据的形式:数字、文字、图形或声音等。
(2)数据的分类:数值数据、非数值数据。
2.信息:经过解释赋予一定意义的数据。
(1)控制信息:指挥计算机的各种操作的指令。
(2)数据信息:计算机加工处理的对象。
注意:(1)计算机能识别和处理的只能是二进制数。
(2)计算机中有人读数据和机读数据两种状态。
3.位:一个二进制位称为比特(bit),,以b表示。
一位可以表示0和1两种状态。
位是数据的最小单位,4.字节:八个二进制位称为字节(Byte),以B表示。
字节是数据处理和数据存储的基本单位。
一个字节的8位二进制自左至右排列,最左边为最高位,最右边为最低位。
换算公式:1KB=1024B1MB=1024KB=1024×1024B1GB=1024MB=1024×1024KB=1024×1024×1024B=1073741824B5.字与字长(1)字:在计算机中做为一个单元进行存储、传送等操作的一组字符或一组二进制位称为字(Word)。
(2)字长:一个字中的字符数量或二进制的位数称为字长。
字长决定计算机处理信息的速率,是计算机的一个重要性能指标。
(3)字的组成:一个字由若干个字节组成。
二、字符及其编码1.字符集字符:用来组织、控制或表示数据的字母、数字及计算机能识别的其它符号。
字符集:为了某一目的而设计的一组互不相同的字符。
在微机系统中普遍采用的是有128个符号的键盘字符集,包括:(1)10个十进制数码0~9(2)52个大小写英文字母(3)32个标点符号、专用符号、运算符号(4)34个控制符2.字符编码字符编码:规定用怎样的二进制编码表示数字、字母和各种专用符号。
由于这是一个涉及世界范围内的有关信息表示、交换、处理、传输和存储的基本问题,因此都以国家标准或国际标准的形式颁布施行。
目前在微型机中普遍采用的字符编码是ASCⅡ码。
ASCⅡ是英文American Standard Code for Information Interchange的缩写,意为“美国标准信息交换代码”。
该编码后被国际标准化组织ISO(国际标准化委员会)采纳,作为国际通用的信息交换标准代码。
ASCⅡ有7位版本和8位版本。
(1)7位ASCⅡ码用七位二进制数表示一个字符,由于27=128,所以可表示128个不同的字符,其中包括:数码0~9,26个大写英文字母,26个小写英文字母以及各种运算符号、标点符号及控制命令等。
注意:7位ASCⅡ表示数的范围是0~127在微机中采用7位ASCⅡ字符编码时,最高位b7恒为零,因此,一个字符的ASCⅡ码占一个字节位置。
(2)8位ASCⅡ码使用8位二进制数进行编码,这样可以表示256种字符。
当最高位恒为0时,编码与7位ASCII码相同,称为基本ASCII码。
当最高位为1时,形成扩充ASCII码。
通常,各国都把扩充ASCII码部分作为自己本国语言字符代码。
常用ASCII码:字符大小比较:按ASCII码值的大小进行比较。
CR〈ESC〈SP(空格)〈0〈......A〈......a〈DEL字符串大小比较:先比较第一个字符,若相同,再比较第二个字符,以此类推。
3.汉字编码我国于1981年颁布了〈信息交换用汉字编码字符集——基本集〉,即国家标准GB2312-80。
基本集中共收集汉字和图形符号7445个,汉字6763个,分为两级。
一级汉字有3755个,属常用汉字,按汉字拼音字母顺序排列;二级汉字为3008个,属次常用汉字,按部首排列。
图形符号682个。
规定:一个汉字用两个字节表示。
为了使中文信息与西文信息兼容,每个字节的最高位用于区分汉字编码或是ASCII 字符编码,因此汉字编码每个字节只用低七位。
此外,由于每个字节的低7位中还有34个控制字符编码,因此每个字节只能有128-34=94种状态可用于汉字编码。
这样两个字节可以有94×94=8836种状态。
(1)区位码GB2312-80基本字符集将汉字按规则排成94行,94列,第一个字节用于表示区号,第二个字节用于表示位号,因此,每个汉字就有唯一的一个区号和一个位号,称为汉字的区位码。
给定汉字编码表中的一个区号(十进制01~94)和位号(十进制01~94),则唯一对应一个汉字或图形符号。
例如:区号54,位号48(均为十进制),对应汉字为“中”。
区位码的安排:01~15区:各种字母、数字及图形符号16~55区:一级汉字56~87区:二级汉字区位码是用十进制数表示的国标码,即国标BG2312-80中的区位编码,也可称为国标区位码。
(1)国标码将汉字区位码的区码和位码分别用十六进制数表示,然后再加上十六进制数2020形成。
例:“中”的区位码为5448,表示成十六进制3630,再加上2020,则它的国标码为5650。
国标码的主要作用是用于统一不同的系统之间所用的不同编码。
通过将不同的系统使用的不同编码统一转换成国标码,不同系统之间的汉字信息就可以相互交换。
4.汉字内码计算机系统内部进行存储、加工处理、传输统一使用的代码,简称汉字内码或机内码。
不同系统使用的机内码可能不同,目前国内广泛使用的汉字内码是将国标码的两个字节的最高位分别置为“1”形成。
即一个汉字在机器内部占两个字节,每个字节的最高位恒为1。
汉字机内码=汉字国标码+8080H=区位码+2020H+8080H=区位码+A0A0H加十六进制8080H的目的是将表示汉字国标码的两个字节的最高位分别置为“1”。
在计算机中,由于机内码的存在,输入汉字时就允许用户根据自己的习惯使用不同的输入码,进入系统后再统一转换成机内码存储。
5.汉字外码为方便人工通过键盘键入汉字而设计的代码称为汉字输入码,又称为汉字外码。
(1)以国标GB2312-80为基准的区位码、国标码(2)以汉字拼音为基础的拼音类输入法(3)以汉字拼形为基础的拼形类输入法(4)以汉字拼音和拼形结合为基础的音形类输入法(5)在电信业中通用的电报码6.汉字字形码是指汉字字库中存储的汉字字形的数字化信息。
汉字是一种象形文字,每一个汉字都可以看成是一个特定的图形,这种图形可以用点阵来描述。
用点阵来表示汉字,以16×16点阵为例,表明一个汉字图形有16行,每一行上有16个点。
一位二进制可以表示点阵中一个点的信息,因此用两个字节来存放每一行上的16个点,并且规定某二进制位值“0”表示对应点为白,而“1”表示对应点为黑。
由此可知,一个16×16点阵的汉字字形需要用2×16=32个字节来存放。
其它点阵的汉字可以此类推。
汉字字形点阵有:16×16、24×24、32×32点阵等。
随点阵数的不同,汉字字形码的长度不同。
例16×16点阵占32个字节,24×24点阵需72个字节。
汉字字形码又称为汉字输出码或汉字发生器编码。
7.汉字字模字模:即汉字字库中存放的汉字字形。
字模与字形的概念没有严格区别。
字模可分为宋体字模、仿宋体字模、楷体字模、黑体字模。
字模按点阵大小可分为16×16点阵字模、24×24点阵字模等。
点阵数越大,字形质量越高。
8.汉字字库汉字字库:汉字字形数字化后,以二进制文件的形式存储在存储器中,构成汉字字形库或汉字字模库,简称汉字字库。
汉字字库为汉字的输出设备提供字形数据,汉字字形的输出是将存储在汉字字库中的相应字形信息取出,送到所指定的汉字输出设备上输出。
字库中汉字字形信息的存储方法:(1)整字存储法将汉字字形的点阵信息逐个字节存放在字形信息存储器中,需要输出时直接读出。
(2)压缩信息存储法采用信息压缩办法,只存储汉字的压缩信息,使用时再还原成字形信息。
汉字字库有硬字库和软字库之分。
(1)硬字库将汉字库固化在ROM或EPROM中,称为硬字库。
(2)软字库将汉字库存放在某种外设(软、硬盘)中,称为软字库。
要输出一个汉字时,首先根据该汉字的机内码找出其字模信息在字库中的位置,然后取该汉字的字模信息作为图形在屏幕上显示或打印机上打印输出。
三、计算机中数的表示1.带符号数的表示用0表示正数,用1表示负数,使数的符号数字化,符号和数一起进行存储和运算。
(1)符号位位于数值最高位的左部,0表示正数,1表示负数。
如果用八进制位表示一个有符号的整数,则最高位为符号位,具体表示数值的只有七位,其最小数为(111111111)2=(-127)10,最大数为(01111111)2=+127。
如果用16进制位表示一个有符号的整数,除去最高位的符号位外,具体表示数值的只有15位,所能表示数的范围为(-32767,+32767)显然,在表示一个数值时,使用的二进制位数越多,其表示数值的范围就越大。
例如:用八位二进制数表示+50和-50(+50)10 =(00110010)2(-50)10 =(10110010)2用十六位二进制数表示+513和-513(+513)10 =(0000001000000001)2 (-513)10=(1000001000000001)2显然,用八位二进制数无法表示513、-513。
(2)真值真正表示数值大小的部分,并按一般书写规则表示的原值。
(3)机器数在计算机中使用的,连同数符一起数码化了的数叫机器数。
机器数表示的范围由计算机字长决定。
如果数值越过机器所能表示的范围,运算就会因此出错而停止,称为“溢出”。
例:用8位二进制数表示+49和-49十进制数+49 -49真值+0110001 -0110001机器数00110001 10110001机器数也有不同表示方法,常用的有三种,即原码,补码和反码。
(1)原码用最高位表示数符,0代表正数,1代表负数,数值部分为真值的绝对值,这种表示方法称为原码。
例:十进制+73 -73 +127 -127 +0 -0真值+1001001 -1001001 +1111111 -1111111 +0000000 -0000000原码01001001 11001001 01111111 11111111 00000000 10000000由上可知,数值0在原码中有两种形式:两种形式均当0处理[+0]原=00000000 [-0]原=10000000(2)反码正数的反码和原码相同,负数的反码是对该数的原码除符号位外各位求反(即0变1,1变0)。
用数学式子表示如下:例:(+50)10原码=00110010 反码=00110010 (相同)(-50)10原码=10110010 反码=11001101 (不同)[+0]反=[+0]原=00000000[-0]原=10000000,[-0]反=11111111注意:一个数反码的反码是原码本身。