字符串是以ASCII字符NUL
结尾的字符序列。ASCII字符NUL
表示为\0
。字符串通常存储在数组或者从堆上分配的内存中。不过,并非所有的字符数组都是字符串,字符数组可能没有NUL
字符。字符数组也用来表示布尔值等小的整数单元,以节省内存空间。
C中有两种类型的字符串。
- 单字节字符串
由char
数据类型组成的序列。 - 宽字符串
由wchar_t
数据类型组成的序列。
wchar_t
数据类型用来表示宽字符,要么是16位宽,要么是32位宽。这两种字符串都以NUL
结尾。可以在string.h中找到单字节字符串函数,而在wchar.h中找到宽字符串函数。除非特别指明,本章用到的都是单字节字符串。创建宽字符主要用来支持非拉丁字符集,对于支持外语的应用程序很有用。
字符串的长度是字符串中除了NUL
字符之外的字符数。为字符串分配内存时,要记得为所有的字符再加上NUL
字符分配足够的空间。
警告 记住,
NULL
和NUL
不同。NULL
用来表示特殊的指针,通常定义为((void*)0)
,而NUL
是一个char
,定义为\0
,两者不能混用。
字符常量是单引号引起来的字符序列。字符常量通常由一个字符组成,也可以包含多个字符,比如转义字符。在C中,它们的类型是int
,如下所示:
printf("%d\n",sizeof(char));
printf("%d\n",sizeof('a'));
执行上述代码可以看到char
的长度是1,而字符字面量的长度是4。这个看似异常的现象乃语言设计者有意为之。
字符串声明
声明字符串的方式有三种:字面量、字符数组和字符指针。字符串字面量是用双引号引起来的字符序列,常用来进行初始化,它们位于字符串字面量池中,我们会在下一节讨论。
不要把字符串字面量和单引号引起来的字符搞混——后者是字符字面量。在后面的各节我们会看到,把字符字面量当做字符串字面量用会出问题。
下面是一个字符数组的例子,我们声明了一个header
数组,最多可以持有31个字符。因为字符串需要以NUL
结尾,所以如果我们声明一个数组拥有32个字符,那么只能用31个元素来保存实际字符串的文本。字符串在内存中的位置取决于声明的位置,我们会在5.1.3节中探究这个问题。
char header[32];
字符指针如下所示,由于没有初始化,也就没有引用字符串,当前还没有指定字符串的长度和位置。
char *header;