当前位置:文档之家› c语言的基本数据类型及其表示

c语言的基本数据类型及其表示

c语言的基本数据类型及其表示
c语言的基本数据类型及其表示

3.2 C语言的基本数据类型及其表示

C语言的基本数据类型包括整型数据、实型数据和字符型数据,这些不同数据类型如何表示?如何使用?它们的数据范围是什么?下面我们分别进行介绍。

3.2.1 常量与变量

1. 常量

常量是指程序在运行时其值不能改变的量,它是C语言中使用的基本数据对

象之一。C语言提供的常量有:

以上是常量所具有的类型属性,这些类型决定了各种常量所占存储空间的大小和数的表示范围。在C程序中,常量是直接以自身的存在形式体现其值和类型,例如:123是一个整型常量,占两个存储字节,数的表示范围是-32768~32767;123.0是实型常量,占四个存储字节,数的表示范围是-3.4 10-38~3.4 1038。

需要注意的是,常量并不占内存,在程序运行时它作为操作对象直接出现在运算器的各种寄存器中。

2.符号常量

在C程序中,常量除了以自身的存在形式直接表示之外,还可以用标识符来表示常量。因为经常碰到这样的问题:常量本身是一个较长的字符序列,且在程序中重复出现,例如:取常数的值为3.1415927,如果在程序中多处出现,直接使用3.1415927的表示形式,势必会使编程工作显得繁琐,而且,当需要把的值修改为3.1415926536时,就必须逐个查找并修改,这样,会降低程序的可修改性和灵活性。因此,C语言中提供了一种符号常量,即用指定的标识符来表示某个常量,在程序中需要使用该常量时就可直接引用标识符。

C语言中用宏定义命令对符号常量进行定义,其定义形式如下:

#define 标识符常量

其中#define是宏定义命令的专用定义符,标识符是对常量的命名,常量可以是前面介绍的几种类型常量中的任何一种。该使指定的标识符来代表指定的常量,这个被指定的标识符就称为符号常量。例如,在C程序中,要用PAI代表实型常量3.1415927,用W代表字符串常量"Windows 98",可用下面两个宏定义命令:

#define PAI 3.1415927

#define W "Windows 98"

宏定义的功能是:在编译预处理时,将程序中宏定义(关于编译预处理和宏定义的概念详见9.10节)命令之后出现的所有符号常量用宏定义命令中对应的常量一一替代。例如,对于以上两个宏定义命令,编译程序时,编译系统首先将程序中除这两个宏定义命令之外的所有PAI替换为3.1415927,所有W替换为Windows 98。因此,符号常量通常也被称为宏替换名。

习惯上人们把符号常量名用大写字母表示,而把变量名用小写字母表示。例3-1是符号常量的一个简单的应用。其中,PI为定义的符号常量,程序编译时,用3.1416替换所有的PI。

例3-1:已知圆半径r,求圆周长c和圆面积s的值。

#define PI 3.1416

main()

{ float r,c,s;

scanf("%d",&r);

c=2*PI*r; /* 编译时用3.1416替换PI */

s=PI*r*r; /* 编译时用3.1416替换PI */

printf("c=%6.2f,s=%6.2f\n",c,s);

}

3.变量

变量是程序设计语言中一个重要概念,它是指在程序运行时其值可以改变的量。这里所说的变量与数学中的变量是完全不同的概念。在C语言以及其他各种常规程序设计语言中,变量是表述数据存储的基本概念。我们知道,在计算机硬件的层次上,程序运行时数据的存储是靠内存储器、存储单元、存储地址等一系列相关机制实现,这些机制在程序语言中的反映就是变量的概念。

程序里的一个变量可以看成是一个存储数据的容器,它的功能就是可以存储数据。对变量的基本操作有两个:①向变量中存入数据值,这个操作被称作给变量"赋值"。②取得变量当前值,以便在程序运行过程中使用,这个操作称为"取值"。变量具有保持值的性质,也就是说:如果在某个时刻给某变量赋了一个值,此后使用这个变量时,每次得到的将总是这个值。

因为要对变量进行"赋值"和"取值"操作,所以程序里的每个变量都要有一个变量名,程序是通过变量名来使用变量的。在C语言中,变量名是作为变量的标识,其命名规则符合标识符的所有规定。以下是合法的变量名:

f1 total name_1 _sum ave1 r123

stu_12_1 stu_name x1 x1_ pi year

C语言提供的基本变量类型有:

C语言要求:程序里使用的每个变量都必须首先定义,也就是说,首先需要声明一个变量的存在,然后才能够使用它。要定义一个变量需要提供两方面的信息:变量的名字和它的类型,其目的是由变量的类型决定变量的存贮结构,以便使C语言的编译程序为所定义的变量分配存储空间。

4.变量的定义

变量是以标识符的形式来表示其类型。在C语言中,是用类型说明语句对变量进行定义,其定义形式如下:

类型说明符变量名表;

其中,类型说明符是C语言中的一个有效的数据类型,如整型类型说明符int,?字符型类型说明符char等。变量表的形式是:变量名1,变量名2,……,变量名n,即:用逗号分隔的变量名的集合。最后用一个分号结束定义。定义变量的这种语言结构称为"变量说明",例如下面是某程序中的变量说明:

int a, b, c; /* 说明a,b,c为整型变量*/

char cc; /* 说明cc为字符变量*/

double x, y; /* 说明x,y为双精度实型变量*/

可见,一个定义中可以说明多个变量。而且,由于C语言是自由格式语言,把多个变量说明写在同一行也是允许的。但是为了程序清晰,人们一般不采用这种写法,尤其是初学者。在C程序中,除了不能用关键字做变量名外,可以用任何标识符做变量名。但是,一般提倡用能说明变量用途的有意义的名字为变量命名,因为这样的名字对读程序的人有一定提示作用,有助于提高程序的可读性,尤其是当程序比较大,程序中的变量比较多时,这一点就显得尤其重要。这就是

结构化程序设计所强调的编程风格问题。在数学里人们常常采取对变量简单命名的方式,那是因为数学公式里使用的变量通常都很少。程序的情况则不同,一个大程序里可能有成百成千的变量,命名问题就显得重要。

整型数据及其表示

1.整数类型

C语言提供了多种整数类型,用以适应不同情况的需要。常用的整数类型有:整型、长整型、无符号整型和无符号长整型等四种基本类型。不同类型的差别就在于采用不同位数的二进制编码方式,所以就要占用不同的存储空间,就会有不同的数值表示范围。表3-1列出了常用的基本整数类型和有关数据。

在数学中,整数是一个无限的集合,即整数的表示范围为-∞~+∞。C语言标准本身也并不限制各种类型数据所占的存储字节数。但在计算机中,所有数值的取值范围受限于机器所能表示的范围,不同的计算机系统对数数据的存储有具体的规定。表3-1列出了IBM PC机及其兼容机上对C语言整型数的规定,表中的存储字节数和最小数值范围表示相应类型的整数不能低于此值但可高于此值。

表3-1 整数基本类型表

整数类型存储字节最小数值范围

整型2字节-32768~32767

长整型4字节-2147483648~2147483647

无符号整型2字节0~65535

无符号长整型4字节0~4294967295

计算机内部总是采用二进制补码形式表示一个数值型数据,所以对于带符号的数,其负数的表示范围比正数大,请读者注意这一点。表3-2中的整型和长整型均表示带符号的整型数据,一个带符号整数和无符号整数在计算机中的存储形式是不同的,其示意图如图3-1所示。例如,长整型不可少于四个字节,但可以是八个字节。

图中的整型数和无符号整型数都是用两个字节(16位二进制数)表示,整型数的最高位为符号位,"1"表示负数,"0"表示正数,用其余15位表示数值。而无符号整型数全部16位表示数值。

2.整型常量

在计算机语言中,常量一般是以自身的存在形式直接表示数据属性,C语言亦如此。例如:-35是十进制整型常数,应占两个字节的存储空间,而-35.0是十进制实型常数,占四个字节的存储空间。

在C语言中,所有的数值型常量都带有符号,所以整型常量只区别整型和长整型两种形式,而没有无符号值型常量。整型和长整型常量均可用十进制、八进制和十六进制三种形式表示。

(1) 十进制整型常量

十进制整型常量的形式是有效的十进制数字串。如:123,-123,8,0,-5,30000等。40000则不是一个十进制整型常量,因为它超过了整型常量的表示范围。对于这种超过数值表示范围的数据,语言系统会自动将其转换为其它适合的类型。

(2) 八进制整型常量

八进制整型常量的形式是以数字"0"开头的八进制数字串。数字串中只能含有0~7这八个数字。

如:056 表示八进制数56,等于十进制数46。

-017 表示八进制数-17,等于十进制数-15。

(3) 十六进制整型常量

十六进制整型常量的形式是以数字0x或0X开头的十六进制字符串。字符串中只能含有0~9这十个数字和a、b、c、d、e、f(或大写的A、B、C、D、E、F)这六个字母。这一规定与计算机领域中通行的表示十六进制字符方式相同。

如:0x123 表示十六进制数123,等于十进制数291。

0x3A 表示十六进制数3A,等于十进制数58。

-0x2e 表示十六进制数-2f,等于十进制数-46。

以上是整型常数的表示,对于长整型常数同样可以用十进制、八进制和十六进制三种形式表示。其表示形式是在常数之后加上字母"l"或"L"。例如:123L,-1234567L,0l,32769L,-017l,-0x123BL,0Xf3acL,-0x2eL都是长整型常数。

长整型常数在计算机中占4个字节,数的表示范围可达到-2147483648~2147483647。所以尽管40000不是一个合法的十进制整型常量,但40000L是一个合法的十进制长整型常量。长整型常数一般是用于函数调用中。

3.整型变量

在C语言中,整型变量有上述整型数据所具有的四种类型:整型、长整型、无符号整型和无符号长整型。整型变量以关键字int作为基本类型说明符,另外配合4个类型修饰符,?用来改变和扩充基本类型的含义,以适应更灵活的应用。可作用于基本型int上的4个类型修饰符有:

long长

short短

signed 有符号

unsigned 无符号

这些修饰符与int可以组合成如表3-2所示的不同整数类型,这是ANSI C 标准允许的整数类型。由表中可见,有些修饰符是多余的,例如修饰符signed 和short就是不必要的,因为signed int、short int、signed short int与int类型都是等价的。提出这些修饰符只是为了提高程序的可读性。因为signed与unsigned 对应,short与long对应,使用它会使程序看起来更加明了。

表3-2 ANSI标准规定的整型变量属性表

数据类型占用字节数二进制位取值范围

int 216 -32768~32767

short [int] 216 同int

long [int] 432 -2147483648~2147483647

signed [int] 216 同int

signed short [int] 216 同int

signed long [int] 432 同long int

unsigned [int] 216 0~65535

unsigned short [int] 216 同unsigned int

unsigned long [int] 432 0~4294967295

前面已经提到,一个C程序中用到的所有变量都必须在使用前进行变量说明。一是说明变量类型,二是说明变量名。对于程序中要说明为整型的变量,只需在说明语句中指明整型数据类型和相应的变量名即可。

例如:int a,b,c; /* 说明a,b,c 为整型变量*/

long e,f; /* 说明e,f 为长整型变量*/

unsigned short g,h; /* 说明g,h 为无符号短整型变量*/

signed int x,y; /* 说明x,y,z为带符号整型变量,其作用同int x,y */ 4.整型数据应用中的几个问题

整型数据在使用中应注意以下几个问题:

(1) 变量要先定义后使用;

(2) 数据溢出;

(3) 常量与变量的类型要匹配。

下面通过一个简单的程序实例讨论以上三个问题。

例3-1:编写求两数和的C程序并上机运行。程序如下:

/* SUM.C源程序*/

main() /* 求两数和主函数*/

{

int a,b; /* 说明a、b为整型变量*/

a=32767; /* 为变量a赋最大值*/

b=3; /* 为变量b赋值*/

c=a+b; /* 计算a+b并将结果赋值给变量c */

printf("c=%d\n",c); /* 输出变量c的值*/

}

讨论1:在Turbo C2.0开发环境下运行此程序时,编译过程中提示有一个错误,信息窗口显示如图3-2所示的错误信息,说明源程序第五行有错,错误原因是主程序中的变量C没有定义。编辑窗口源程序反相显示出第五行,见图3-3

所示。分析错误原因可知,程序第五行并没有错,而是在使用变量c之前没有定义其类型,修改程序第二行为:

int a,b,c;

重新编译即可通过。可见,C程序中的所有变量都必须先定义后使用。

讨论2:由SUM.C源程序可见,该程序的运行结果应该是:c=32770,可实际运行结果如下:

c=-32766

显然这个结果是错误的,但系统没有提示出错。为什么会出现这种情况呢?图3-4是该程序运行后变量a、b、c中的存储情况。由图中可见,a和b的值都没有超出整型数的表示范围,而a加b后应得到32770,这个数已经超出了整型数的表示范围,称为溢出。但这种溢出在内存变量c中的表现形式正好是数值-32766的补码形式,当输出变量c的内容时自然就输出了-32766,造成结果错误。

这就是数据溢出导致的结果。对于这种问题,系统往往不给出错误提示,而是要靠正确使用类型说明来保证其正确性。所以要求对数据类型的使用要仔细,对运算结果的数量级要有基本估计。

如果把上述程序作以下修改:

/* SUM.C源程序*/

main()

{long a,b,c; /* 说明a、b、c为长整型变量*/

a=32767;

b=3;

c=a+b;

printf("c=%ld\n",c); /* 按长整型格式输出变量c的值*/

}

即把变量a、b、c定义为长整型,就可以得到正确的运行结果。请读者思考:如果只把c定义为长整型,a和b还保持整型,结果会怎样?

讨论3:在C程序中,要注意常量与变量的类型匹配问题,例如上述程序中变量c的结果是正整数32770,与之匹配的有long int型,还有unsigned int、unsigned short int和unsigned long int等所有无符号整型,因为32770是正数,又

没有超出所有无符号整型数的表示范围。而int或short int型是不能与之匹配的,否则会产生溢出。

3.2.3 实型数据及其表示

1.实数类型

C语言提供了三种用于表示实数的类型:单精度型、双精度型和长双精度型。表3-3列出了实型数据的长度和表示范围。表中的有效位是指数据在计算机中存储和输出时能够精确表示的数字位数。

表3-3实数基本类型表

实数类型存储字节数最小数值范围有效位

单精度型4字节10-38 ~1038 6 ~7

双精度型8字节10-308 ~10308 15 ~16

长双精度型16字节10-4931 ~104932 18 ~19

在计算机中,实数是以浮点数形式存储的,所以通常将单精度实数称为浮点数。由计算机基础知道,浮点数在计算机中是按指数形式存储的,即把一个实型数据分成小数和指数两部分。例如十进制实型数据0.123456 10-2在计算机中的存放形式可用图3-5示意。实际上计算机中存放的是二进制数,这里仅用十进制数说明其存放形式。

其中,小数部分一般都采用规格化的数据形式,即:小数点放在第一个有效数字前面,使小数部分存放小于1的纯小数。例如0.123456 10-2还可表示为123.456 10-5、1.23456 10-3、0.000123456 101等,但这些都不是规格化的数。

表示小数部分的位数愈多,数的有效位就愈多,数的精确度就愈高。表示指数部分的位数愈多,数的表示范围就愈大。究竟用多少位来表示小数部分,多少

位表示指数部分,C标准对此并无具体规定,由各C编译系统自定。对于单精度实数,一般的C编译系统用4个字节中的前24位表示小数部分,其中最高位为整个数的符号位,用后8位表示指数部分,其中最高位为指数的符号位(见图

3-5)。这样,单精度实数的精度就取决于小数部分的23位二进制数位所能表达的数值位数,将其转换为十进制,最多可表示7位十进制数字,所以单精度实数的有效位是7位。

由实型数据的存储形式可见,由于机器存储位数的限制,浮点数都是近似值,而且多个浮点数运算后误差累积很快,所以引进了双精度型和长双精度型,用于扩大存储位数,目的是增加实数的长度,减少累积误差,改善计算精度。

2.实型常量

实型常量亦被称为实型数或浮点数。在C语言中,实型常量一般都作为双精度来处理,并且只用十进制数表示。实型常量有两种书写格式:小数形式和指数形式。

(1)小数形式:它由符号、整数部分、小数点及小数部分组成。例如以下都是合法的小数形式实型常量:

12.34,0.123,.123,123.,-12.0,-0.0345,0.0,0.

注意其中任何位置上的小数点都是不可缺少的。例如123.不能写成123,因为123是整型常量,而123.是实型常量。

(2)指数形式:由十进制小数形式加上指数部分组成,其形式如下:

十进制小数e指数或:十进制小数E指数

格式中的e或E前面的数字表示尾数,e或E表示底数10,而e或E后面的指数必须是整数,表示10的幂次。例如25.34e3表示25.34×103=25340。以下都是合法的指数形式实型常量:

2.5e3,-12.5e-5,0.123E-5,-267.89E-6,0.61256e3

注意指数必须是不超过数据表示范围的正负整数,并且在e或E前必须有数字。例如:

e3,3.0e,E-9,10e3.5,.e8,e 都是不合法的指数形式。

对于上述两种书写形式,系统均默认为是双精度实型常量,可表示15~16位有效数字,数的表示范围可达到10-308 ~10308。如果要表示单精度实型常量和长双精度实型常量,只要在上述书写形式后分别加上后缀f(F)或l(L)即可。例如:

2.3f,-0.123F,2e-3f,-1.5e4F 为合法的单精度实型常量,注意只有7位有效数字。

1256.34L,-0.123L,2e3L,为合法的长双精度实型常量,有18~19位有效数字。

对于超过有效数字位的数位,系统存储时自动舍去。

3.实型变量

在C语言中,实型变量分为单精度、双精度和长双精度等三种类型。ANSI C 标准允许的定义三种实型变量的关键字如下:

float 单精度型

double? 双精度型

long double? 长双精度型

实型变量的定义,只需在说明语句中指明实型数据类型和相应的变量名即可。

例如:float a,b; /* 说明变量a,b 为单精度型实数*/

double c,d; /* 说明变量c,d 为双精度型实数*/

long double e,f /* 说明变量e,f 为长双精度型实数*/

4.实型数据应用中的误差问题

例3-2:输出实型数据a,b

/* L3_2.C源程序*/

main()

{float a; /* 说明变量a为单精度型*/

double b; /* 说明变量b为双精度型*/

a=12345.6789; /* 为a赋值*/

b=0.1234567891234567899e15; /* 为b赋值*/

printf("a=%f,b=%f\n",a,b); /* 输出变量a、b的值*/

}

程序为单精度变量a和双精度变量b分别赋值,并不经过任何运算就直接输出变量a,b的值。理想结果应该是照原样输出,即:

a=12345.6789,b=0.1234567891234567899e15

但运行该程序,实际输出结果是:

a=12345.678711,b=123456789123456.797000

由于实型数据的有效位是有限的,程序中变量a为单精度型,只有7位有效数字,所以输出的前8位是准确的,第9位以后的数字"711"是无意义的。变量b 为双精度型,可有15~16位的有效位,所以输出的前16位是准确的,第17位以后的数字"97000"是无意义的。由此可见,由于机器存储的限制,使用实型数

据会产生一些误差,运算次数愈多,误差积累就愈大,所以要注意实型数据的有效位,合理使用不同的类型,尽可能减少误差。

相关主题
文本预览
相关文档 最新文档