字和字节详解
- 格式:doc
- 大小:26.50 KB
- 文档页数:3
要知道储存数据的几种格式,这几种格式是:
字节(BYTE)、字(WORD)和双字(DOUBLE WORD),或者说是8位、16位和32位储存方式。
字节也就是8位方式能储存0~255的数字;
字或说是16位储存方式能储存0~65535的数;
双字即32位方式能储存0~4294967295的数
一个字节有8位二进制组成,其最高位是第7位,最低位是第0位,在表示有符号数时,最高位就是符号位。
通常情况下,存储器按字节编址,读写存储器的最小信息单位就是一个字节。
由2个字节组成一个字,其最高位是第15位,最低位是第0位。
高8位称为高字节,低8位称为低字节,
字节和字是汇编语言程序中最常用的两种数据类型,也是最容易出错的数据类型
用2个字(4个字节)来组成一个双字,其高16位称为高字,低16位称为低字,如右图所示。
双字有较大的数据表示范围,它通常是为了满足数据的表示范围而选用的数据类型,也可用于存储远指针。
字节、字和双字是汇编语言最常用的三种数据类型,下图表现出它们三者之间的组成关系。
基本的东西还是要掌握牢靠的。
位、字,字节与KB的关系?
位:我们常说的bit,位就是传说中提到的计算机中的最⼩数据单位:说⽩了就是0或者1;计算机内存中的存储都是01这两个东西。
字节:英⽂单词:(byte),byte是存储空间的基本计量单位。
1byte 存1个英⽂字母,2个byte存⼀个汉字。
规定上是1个字节等于8个⽐特(1Byte = 8bit)。
字:字就是由⼀些字符组成的,是据算计处理数据时⼀次存取,加⼯和传送的数据长度。
字由若⼲字节构成,字的位数叫字长,⼀台8位机⼦:⼀个字等于1个字节,字长为8位,如果是16位的机⼦,⼀个字等于2个字节,字长为16,字是计算机处理数据和运算的单位。
由此可见,计算机的字长决定了其CPU⼀次操作处理实际位数的多少,即:计算机的字长越⼤,其性能越好。
位、字,字节与KB的关系:
KB 1KB=1024B
MB 1MB=1024KB
GB 1GB=1024MB
TB 1TB=1024GB
4亿个字节是多少KB?
1024Byte(字节)=1KB
1024KB=1MB
1024MB=1GB
1024GB=1TB
所以⽤400000000除以1024就可以了
python查看对象占⽤的内存空间⼤⼩?
python查看对象占⽤的内存空间⼤⼩,⼀共两步
1. 引⽤sys模块
2. 使⽤getsizeof()⽅法
举例如下
1import sys as sys
2
3 a = [x for x in range(1000)]
4print sys.getsizeof(a)。
数据结构基本概念和术语之位字节、字、位串、元素等数据结构基本概念和术语:位、字节、字、位串、元素、数据域、物理结构、逻辑结构位(Bit):"位(bit)"是电⼦计算机中最⼩的数据单位。
每⼀位的状态只能是0或1。
字节(Byte):8个⼆进制位构成1个"字节(Byte)",它是存储空间的基本计量单位。
1个字节可以储存1个英⽂字母或者半个汉字,换句话说,1个汉字占据2个字节的存储空间。
字:"字"由若⼲个字节构成,字的位数叫做字长,不同档次的机器有不同的字长。
例如⼀台8位机,它的1个字就等于1个字节,字长为8位。
如果是⼀台16位机,那么,它的1个字就由2个字节构成,字长为16位。
字是计算机进⾏数据处理和运算的单位。
位串:由若⼲位组合起来形成位串。
元素:⽤⼀个由若⼲位组合起来形成的⼀个位串表⽰⼀个数据元素,通常称这个位串为元素(Element)或节点(Node)。
数据域(Data Field):当数据元素由若⼲数据项组成时,位串中对应于各个数据项的⼦位串称为数据域(Data Field)。
物理结构(⼜称存储结构):数据结构在计算机中的表⽰(⼜称映象)。
逻辑结构:结构定义中的"关系"描述的是数据元素之间的逻辑关系,因此⼜称为数据的逻辑结构。
理解:1)引⼊位串这个词只是为准确叙述元素的概念⽽出现,描述由若⼲位组合起来的称呼2)位串-元素3)⼦位串-数据域4)元素是数据元素在计算机中的表⽰(⼜称映象)5)元素或结点是基于物理结构的概念,⽽数据元素是基于逻辑结构的概念数据结构基本概念和术语:数据、数据元素、数据项、数据对象、数据结构、结构数据(Data):是对客观事物的符号表⽰,在计算机科学中是指所有能输⼊到计算机中并被计算机程序处理的符号的总称。
数据元素(Data Element):是数据的基本单位,在计算机程序中通常作为⼀个整体进⾏考虑和处理。
字节、字、位、⽐特的概念和关系1、位(bit)来⾃英⽂bit,⾳译为“⽐特”,表⽰⼆进制位。
位是计算机内部数据储存的最⼩单位,11010100是⼀个8位⼆进制数。
⼀个⼆进制位只可以表⽰0和1两种状态(21);两个⼆进制位可以表⽰00、01、10、11四种(22)状态;三位⼆进制数可表⽰⼋种状态(23)……。
2、字节(byte)字节来⾃英⽂Byte,⾳译为“拜特”,习惯上⽤⼤写的“B”表⽰。
字节是计算机中数据处理的基本单位。
计算机中以字节为单位存储和解释信息,规定⼀个字节由⼋个⼆进制位构成,即1个字节等于8个⽐特(1Byte=8bit)。
⼋位⼆进制数最⼩为00000000,最⼤为11111111;通常1个字节可以存⼊⼀个ASCII码,2个字节可以存放⼀个汉字国标码。
3、字计算机进⾏数据处理时,⼀次存取、加⼯和传送的数据长度称为字(word)。
⼀个字通常由⼀个或多个(⼀般是字节的整数位)字节构成。
例如286微机的字由2个字节组成,它的字长为16;486微机的字由4个字节组成,它的字长为32位机。
计算机的字长决定了其CPU⼀次操作处理实际位数的多少,由此可见计算机的字长越⼤,其性能越优越。
另⼀种说法:字在计算机中,⼀串数码作为⼀个整体来处理或运算的,称为⼀个计算机字,简称宇。
字通常分为若⼲个字节(每个字节⼀般是8位)。
在存储器中,通常每个单元存储⼀个字,因此每个字都是可以寻址的。
字的长度⽤位数来表⽰。
在计算机的运算器、控制器中,通常都是以字为单位进⾏传送的。
宇出现在不问的地址其含义是不相同。
例如,送往控制器去的字是指令,⽽送往运算器去的字就是⼀个数。
在计算机中作为⼀个整体被存取、传送、处理的⼆进制数字符串叫做⼀个字或单元,每个字中⼆进制位数的长度,称为字长。
⼀个字由若⼲个字节组成,不同的计算机系统的字长是不同的,常见的有8位、16位、32位、64位等,字长越长,计算机⼀次处理的信息位就越多,精度就越⾼,字长是计算机性能的⼀个重要指标。
字字节位的关系
在计算机科学中,字、字节和位是存储和数据处理的三个基本单位。
了解这三个单位之间的关系和差异对于理解计算机内存管理和数据表示至关重要。
1. 位(Bit)
位是计算机存储和处理数据的最小单位。
它只有两个可能的状态:0或1。
在计算机中,位用于表示信息的基本元素,例如开/关状态,对/错决定等。
2. 字节(Byte)
字节是计算机存储和处理的常用单位,它由8个位组成。
这意味着一个字节可以表示2的8次方(即256)个不同的状态,因为2的8次方等于256。
字节通常用于表示字符,例如ASCII字符或扩展ASCII字符。
3. 字(Word)
字是计算机存储和处理数据的一个更大的单位,通常由多个字节组成。
例如,在32位架构中,一个字由4个字节组成;在64位架构中,一个字由8个字节组
成。
字通常用于执行内存访问和数据操作,例如读/写、复制和比较等。
字、字节和位之间的关系可以概括为以下几点:
* 一个字节由8个位组成,可以表示256个不同的状态。
* 字通常由多个字节组成,用于执行内存访问和数据操作。
* 位是计算机存储和处理数据的最小单位,用于表示信息的基本元素。
了解字、字节和位之间的关系对于理解计算机内存管理和数据表示至关重要。
它们在不同的计算机架构和操作系统中可能有所不同,但基本的原理是相同的。
数据结构基本概念和术语:位、字节、字、位串、元素、数据域、物理结构、逻辑结构位(Bit):"位(bit)"是电子计算机中最小的数据单位。
每一位的状态只能是0或1。
字节(Byte):8个二进制位构成1个"字节(Byte)",它是存储空间的基本计量单位。
1个字节可以储存1个英文字母或者半个汉字,换句话说,1个汉字占据2个字节的存储空间。
字:"字"由若干个字节构成,字的位数叫做字长,不同档次的机器有不同的字长。
例如一台8位机,它的1个字就等于1个字节,字长为8位。
如果是一台16位机,那么,它的1个字就由2个字节构成,字长为16位。
字是计算机进行数据处理和运算的单位。
位串:由若干位组合起来形成位串。
元素:用一个由若干位组合起来形成的一个位串表示一个数据元素,通常称这个位串为元素(Element)或节点(Node)。
数据域(Data Field):当数据元素由若干数据项组成时,位串中对应于各个数据项的子位串称为数据域(Data Field)。
物理结构(又称存储结构):数据结构在计算机中的表示(又称映象)。
逻辑结构:结构定义中的"关系"描述的是数据元素之间的逻辑关系,因此又称为数据的逻辑结构。
理解:1)引入位串这个词只是为准确叙述元素的概念而出现,描述由若干位组合起来的称呼2)位串-元素3)子位串-数据域4)元素是数据元素在计算机中的表示(又称映象)5)元素或结点是基于物理结构的概念,而数据元素是基于逻辑结构的概念数据结构基本概念和术语:数据、数据元素、数据项、数据对象、数据结构、结构数据(Data):是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。
数据元素(Data Element):是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。
数据项(Data Item):一个数据元素可有若干个数据项组成;数据项是数据的不可分割的最小单位。
字节、字、双字,整数,双整数和浮点数详解1.引言1.1 概述在计算机科学和编程领域,字节、字、双字、整数、双整数和浮点数是非常重要的概念和数据类型。
它们在存储和处理数据时起着关键作用。
本文将对这些概念和数据类型进行详细解释和讨论。
首先,字节是计算机存储和处理数据的基本单位之一。
一个字节由8位二进制数字组成,可以表示256种不同的值。
字节一般用于存储和表示字符,例如ASCII码中的每个字符都用一个字节表示。
接下来,字是字节的扩展,通常由两个字节组成。
字是更大的数据单元,可以表示更多的不同值。
字通常用于存储和表示较大的字符集,如Unicode编码中的字符。
双字是对字的一种拓展,由四个字节组成。
双字可以表示更大范围的数据,通常用于存储和处理较大的整数和浮点数。
然后,整数是一种完整的数值数据类型,用于表示不带小数部分的数值。
整数可以是负数、零或正数,其取值范围取决于所使用的字节数。
整数常用于计算、逻辑运算和数据存储。
双整数是对整数的一种拓展,由两个整数组成。
双整数可以表示更大范围的整数值,通常用于需要更精确的计算和表示的情况。
最后,浮点数是一种带有小数部分的数值数据类型。
浮点数通常由双字表示,其中一部分用于存储小数部分,另一部分用于存储指数部分。
浮点数常用于科学计算、图形处理和物理模拟等领域。
本文将详细探讨字节、字、双字、整数、双整数和浮点数的定义、特点、应用、表示方式、运算规则和数据范围等方面内容。
通过深入理解这些概念和数据类型,我们可以更好地理解计算机的内部处理和存储方式,并在编程中更加灵活和高效地处理数据。
1.2文章结构文章结构部分的内容可以写成以下方式:1.2 文章结构本文将详细介绍字节、字、双字、整数、双整数和浮点数的概念以及其应用。
文章结构如下:2.正文2.1 字节2.1.1 定义本节将介绍字节的定义,以及字节在计算机中的作用和意义。
2.1.2 应用本节将探讨字节在不同应用场景下的具体应用,例如在存储和传输数据中的作用。
字节、字、位、⽐特之间的关系字节、字、位、⽐特之间的关系是:1位=1⽐特;1字=2字节;1字节=8位;1字=16位。
1、位位是计算机存储的最⼩单位,简记为b,也称为⽐特(bit)计算机中⽤⼆进制中的0和1来表⽰数据,⼀个0或1就代表⼀位。
位数通常指计算机中⼀次能处理的数据⼤⼩;2、⽐特⽐特(bit)是由英⽂BIT⾳译⽽来,⽐特同时也是⼆进制数字中的位,是信息量的度量单位,为信息量的最⼩单位;3、字节字节,英⽂Byte,是计算机⽤于计量存储容量的⼀种计量单位,通常情况下⼀字节等于⼋位,字节同时也在⼀些计算机编程语⾔中表⽰数据类型和语⾔字符,在现代计算机中,⼀个字节等于⼋位;4、字字是表⽰计算机⾃然数据单位的术语,在某个特定计算机中,字是其⽤来⼀次性处理事务的⼀个固定长度的位(bit)组,在现代计算机中,⼀个字等于两个字节。
扩展资料:计算机中的存储单位有:bit、B、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB等。
这些单位中最⼩的单位是——位 bit (⽐特)(Binary Digits),⼀个位存放⼀位⼆进制数,即 0 或 1,它是计算机存储中最⼩的存储单位。
其他的单位相互之间的换算关系⼊下:1 Byte(B)= 8 bit;1 Kilo Byte(KB) = 1024B;1 Mega Byte(MB) = 1024 KB;1 Giga Byte (GB)= 1024 MB;1 Tera Byte(TB)= 1024 GB;1 Peta Byte(PB) = 1024 TB;1 Exa Byte(EB) = 1024 PB;1 Zetta Byte(ZB) = 1024 EB;1Yotta Byte(YB)= 1024 ZB;1 Bronto Byte(BB) = 1024 YB;1 Nona Byte(NB)=1024 BB;1 Dogga Byte(DB)=1024 NB;1 Corydon Byte(CB)=1024DB;1 Xero Byte (XB)=1024CB;。
1、位(bit)来自英文bit,音译为“比特”,表示二进制位。
位是计算机内部数据储存的最小单位,11010100 是一个8位二进制数。
一个二进制位只可以表示0和1两种状态(21);两个二进制位可以表示00、01、10、11四种(22)状态;三位二进制数可表示八种状态(23)……。
2、字节(byte)字节来自英文Byte,音译为“拜特”,习惯上用大写的“B”表示。
字节是计算机中数据处理的基本单位。
计算机中以字节为单位存储和解释信息,规定一个字节由八个二进制位构成,即1个字节等于8个比特(1Byte=8bit)。
八位二进制数最小为00000000,最大为11111111;通常1个字节可以存入一个ASCII码,2个字节可以存放一个汉字国标码。
3、字计算机进行数据处理时,一次存取、加工和传送的数据长度称为字(word)。
一个字通常由一个或多个(一般是字节的整数位)字节构成。
例如286微机的字由2个字节组成,它的字长为16;486微机的字由4个字节组成,它的字长为32位机。
计算机的字长决定了其CPU一次操作处理实际位数的多少,由此可见计算机的字长越大,其性能越优越。
另一种说法:字在计算机中,一串数码作为一个整体来处理或运算的,称为一个计算机字,简称宇。
字通常分为若干个字节(每个字节一般是8位)。
在存储器中,通常每个单元存储一个字,因此每个字都是可以寻址的。
字的长度用位数来表示。
在计算机的运算器、控制器中,通常都是以字为单位进行传送的。
宇出现在不问的地址其含义是不相同。
例如,送往控制器去的字是指令,而送往运算器去的字就是一个数。
在计算机中作为一个整体被存取、传送、处理的二进制数字符串叫做一个字或单元,每个字中二进制位数的长度,称为字长。
一个字由若干个字节组成,不同的计算机系统的字长是不同的,常见的有8位、16位、32位、64位等,字长越长,计算机一次处理的信息位就越多,精度就越高,字长是计算机性能的一个重要指标。
字及字节详解
字节(Byte 发音:/…bait/):字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位。
在ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。
符号:英文标点占一个字节,中文标点占两个字节。
举例:英文句号“.”占1个字节的大小,中文句号“。
”占2个字节的大小
一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制最小值:0 最大值:255 如一个ASCII码就是一个字节,此类单位的换算为:
1 艾字节(EiB,Exbibyte)=1024拍字节(2的60次方字节)
(1EiB=1024PiB)
1 拍字节(PB,Pebibyte)=1024太字节(2的50次方字节)
(1PiB=1024TiB)
1太字节(TiB,Tebibyte)=1024吉字节(2的40次方字节)
(1TiB=1024GiB)
1吉字节(GiB,Gibibyte)=1024兆字节(2的30次方字节)
(1GiB=1024MiB)
1兆字节(MiB,Mebibyte)=1024千字节(2的20次方字节)
(1MiB=1024KiB)
1千字节(KiB,Kilibyte)=1024字节(2的10次方字节)(1KiB=1024B)
1字节(Byte)= 8位(bit)
注意:MiB和MB,KiB和KB等的区别:
1KB(kilobyte)=1000byte
1KiB(kibibyte)=1024byte
1MB(megabyte)=1000000byte
1MiB(mebibyte)=1048576byte
这是因为硬盘生产商是以GB(十进制,即10的3次方=1000,如1MB=1000KB)计算的,而电脑(操作系统)是以GiB(2进制,即2的10次方,如1MiB=1024KiB)计算的,但是国内用户一般理解为1MB=1024 KB, 所以为了便于中文化的理解,翻译MiB为MB 也是可以的。
同样根据硬盘厂商与用户对于1MB大小的不同理解,所以好多160G的硬盘实际容量按计算机实际的1MB=1024KB算都不到160G,这也可以解释为什么新买的硬盘“缺斤短两”并没有它所标示的那么大。
注:TiB是现在电脑硬盘最大的存储量单位。
10TiB大约等于一个人脑的存储量。
更大的单位,还有ZiB(Zebibyte,1ZiB=1024EiB)、YiB(Yobibyte,1YiB=1024ZiB)……
容易混淆的概念
字
在计算机中,一串数码作为一个整体来处理或运算的,称为一个计算机字,简称字。
字通常分为若干个字节(每个字节一般是8位)。
在存储器中,通常每个单元存储一个字,因此每个字都是可以寻址的。
字的长度用位数来表示。
在计算机的运算器、控制器中,通常都是以字为单位进行传送的。
字出现在不同的地址其含义是不相同。
例如,送往控制器去的字是指令,而送往运算器去的字就是一个数。
字长
计算机的每个字所包含的位数称为字长。
根据计算机的不同,字长有固定的和可变的两种。
固定字长,即字长度不论什么情况都是固定不变的;可变字长,则在一定范围内,其长度是可变的。
计算的字长是指它一次可处理的二进制数字的数目。
计算机处理数据的速率,自然和它一次能加工的位数以及进行运算的快慢有关。
如果一台计算机的字长是另一台计算机的两倍,即使两台计算机的速度相同,在相同的时间内,前者能做的工作是后者的两倍。
一般地,大型计算机的字长为32―64位,小型计算机为12―32位,而微型计算机为4一16位。
字长是衡量计算机性能的一个重要因素。
字节
字节是指一小组相邻的二进制数码。
通常是8位作为一个字节。
它是构成信息的一个小单位,并作为一个整体来参加操作,比字小,是构成字的单位。
在微型计算机中,通常用多少字节来表示存储器的存储容量。
1.2 字符,字节,字符串
理解编码的关键,是要把字符的概念和字节的概念理解准确。
这两个概念容易混淆,我们在此做一下区分:
概念描述举例
字符人们使用的记号,抽象意义上的一个符号。
'1', '中', 'a', '$', '¥', ……
字节计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。
0x01, 0x45, 0xFA, ……
字符串
在内存中,如果“字符”是以ANSI编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串为ANSI 字符串或者多字节字符串。
如,"中文123" (占7字节)。
字符集和代码页
对于ANSI编码方式,存在不同的字符集(Charset)。
同样的字节序列,在不同的字符集下表示的字符不一样。
要正确解析一个ANSI字符串,还要选择正确的字符集,否则就可能导致所谓的乱码现象。
不同语言版本的操作系统,都有一个默认的字符集。
在不指定字符集的情况下,系统会使用此字符集来解析ANSI 字符串。
也就是说,如果我们在简体中文版的Windows下打开了一个由日文操作系统保存的ANSI 文本文件(仅包含ANSI 字符串的文本文件),我们看到的将是乱码。
但是,如果我们使用Visual Studio之类的带编码选择的文本编辑器打开此文件,并且选择正确的字符集,我们将可以看到它的原貌。
注意:简体中文字符集中的繁体字和繁体中文字符集中的繁体字,编码不一定相同(事实证明,似乎是完全不同)。
每个字符集都有一个唯一的编号,称为代码页(Code Page)。
简体中文(GB2312)的代码页为936,而系统默认字符集的代码页为0,它表示根据系统的语言设置来选择一个合适的字符集。
UNICODE
字符串在内存中,如果“字符”是以在Unicode中的序号存在的,那么我们称这种字符串为Unicode字符串或者宽字节字符串。
在Unicode中,每个字符都占两个字节。
如,"中文123"(占10字节)。
Unicode和ANSI的区别就相当于输入法内的“全角”和“半角”的区别。
由于不同ANSI 编码所规定的标准是不相同的(字符集不同),因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种字符集则,才能够知道它包含了哪些“字符”。
而对于UNICODE 字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。
Unicode 有着统一的标准,它定义了世界上绝大多数的字符的编码,使得拉丁文、数字、简体中文、繁体中文、日文等都能以同一种编码方式保存。