早期的 Unix 操作系统主要是使用汇编编写的,Dennis Ritchie 觉得很不方便,于是便于 1969 到 1973 年间,在贝尔实验室开发了C语言。
C语言是一门面向结构化的高级编程语言(也有人认为它是中级语言),用于通用编程需求。基本上,C语言是其基本语法和库函数的集合,因此程序员定义自己的函数并且将其包含在C语言库中也是很方便的。
C语言的主要用途是编写其他编程语言的编译器、操作系统、文本编辑器、后台服务程序、驱动程序、数据库、脚本语言的解释器,以及其他各种实用的程序。
C语言甚至能够编写自己的编译器。
如果读者对C语言感兴趣,并且希望得到一份C语言程序员的工作,那么下面这 7 道面试题将会非常有趣。
问题1,C语言的显著特点是什么?
- 可移植。C语言是一种与平台无关的编程语言,不使用平台依赖库的C语言程序可以轻易移植到各种平台。
- 模块化。我们能够轻易的将一个非常大的C语言项目拆分成若干个小的模块,并逐个实现,最终组合解决该大项目。
- 灵活。C语言给与程序员最大的自由,因此只要某种代码C语言的语法没有禁止,程序员就可使用。也即所谓的“法无禁止即可行”。
问题2,什么是C语言中的“悬空指针”?
C语言中的指针可以指向一块内存,如果这块内存稍后被操作系统回收(被释放),但是指针仍然指向这块内存,那么,此时该指针就是“悬空指针”。下面这段C语言代码是一个例子,请看:
void *p = malloc(size);
assert(p);
free(p);
// 现在 p 是“悬空指针”
C语言中的“悬空指针”会引发不可预知的错误,而且这种错误一旦发生,很难定位。这是因为在 free(p) 之后,p 指针仍然指向之前分配的内存,如果这块内存暂时可以被程序访问并且不会造成冲突,那么之后使用 p 并不会引发错误。
最难调试的 bug 总是不能轻易复现的 bug,对不?
所以在实际的C语言程序开发中,为了避免出现“悬空指针”引发不可预知的错误,在释放内存之后,常常会将指针 p 赋值为 NULL:
void *p = malloc(size);
assert(p);
free(p);
// 避免“悬空指针”
p = NULL;
这么做的好处是一旦再次使用被释放的指针 p,就会立刻引发“段错误”,程序员也就能立刻知道应该修改C语言代码了。
问题3,C语言中的“野指针”是什么?
“悬空指针”是指向被释放内存的指针,“野指针”则是不确定其具体指向的指针。“野指针”最常来自于未初始化的指针,例如下面这段C语言代码:
void *p;
// 此时 p 是“野指针”
因为“野指针”可能指向任意内存段,因此它可能会损坏正常的数据,也有可能引发其他未知错误,所以C语言中的“野指针”危害性甚至比“悬空指针”还要严重。在实际的C语言程序开发中,定义指针时,一般都要尽量避免“野指针”的出现(赋初值):
void *p = NULL;
void *data = malloc(size);
问题4,C语言中的 static 函数有什么用?
相信读者在不少的C语言项目中看到类似于下面这样的 static 函数,为什么使用 static 关键字修饰函数呢?这么做有什么用呢?
static void foo()
{
...
}
稍大的C语言项目中一般都会出现这样的 static 函数(静态函数),C语言中的静态函数最主要的特点就在于其作用域——仅限所述文件。例如在 fun.c 文件中定义的 static 函数,不能在如 main.c 等其他文件中使用。
读者可以尝试使用 extern 关键字引入其他文件中定义的 static 函数。
C语言中 static 函数的这个特性使得它常常被定义在 .h 文件中,一般和 inline 关键字一起使用,以获得 define 函数式宏定义类似的高效率。
问题5,C语言中的“循环”数据类型是指什么?
所谓的“循环”数据类型,其实就是某种类型的数据溢出后,又从头开始存储。一个典型的例子是 unsigned char 变量若已经等于 255,仍然对其加 1,那么该变量就会溢出从头开始,也即等于零:
unsigned char a = 255;
a = a+1;
// a 等于 0
unsigned char 型变量 a 是无符号的 8 位整数,它能表示的最大值是 8 个位全为 1,也即 0xff=255,若此时再对其加一,将得到 0x100。a 只索引 8 位,也即 0x100 中的 0x00=0。
C语言中的 int,long,short 等类型也有类似的“循环”特性,该特性不会引发语法编译错误,因此较难判断这些类型的变量是否溢出。而C语言中的 float,double 类型则没有“循环”特性,因此实际C语言程序开发中一个常用的检查整型数据是否溢出的技巧,就是借助于 float 和 double 类型的,这一点在我之前的文章中说过,感兴趣的读者可以看看。
问题6,C语言中的头文件有什么用?
一般C语言程序项目中的头文件后缀名都为 .h,h 是 header 的缩写。头文件的使用一般和 #include
结合使用,例如在 main.c 文件中写下:
#include "header.h"
意味着在该处将 header.h 中的内容展开到此。所以C语言中的头文件中一般包含程序需要使用的函数定义和原型,也可以包含相关的数据结构类型定义。
这里再啰嗦下“在该处将 header.h 中的内容展开到此”的含义——假如 header.h 头文件中的内容是:
// header.h 头文件
printf("hello world\n");
那么,在其他文件中写下
#include "header.h"
就等价于
// header.h 头文件
printf("hello world\n");
问题7,C语言中的指针可以做加法运算吗?
C语言中的指针包含地址详细信息,一般是不可以直接做加法运算的,例如下面这段C语言代码:
void *p1 = (void *)1;
void *p2 = (void *)2;
// 下面是非法的
void *p = p1+p2;
读者可自行尝试,指针 p1 和指针 p2 是无法直接相加的,否则编译器就会报错。但是如果想对指针 p1 和 p2 的地址值相加,可以将其强制转换为整数类型,例如:
void *p1 = (void *)1;
void *p2 = (void *)2;
long p = (long)p1 + (long)p2;
应该确保强制转换的整数类型宽度大于指针类型宽度,否则可能会因为数值截断导致得到错误的结果。
虽然C语言中的指针不能直接与指针相加,但是却可以与其他整数相加,例如下面这段C语言代码:
char *p1 = (char *)1;
char *p = p1+1;
指针p1 指向地址 1,因此指针 p 指向地址 2,这没什么好说的。但是,读者应该注意下面这样的“陷阱”:
int *p1 = (int *)1;
int *p = p1+1;
与上面的C语言代码例子相比,这里仅仅将 char 换成 int。那么,指针 p 指向哪个地址呢?编写打印代码:
int *p1 = (int *)1;
int *p = p1+1;
printf("p1=%p, p=%p\n", p1, p);
编译并执行上面这段C语言代码,会发现输出如下:
p1=0x1, p=0x5
可见,“1+1”并不等于 2,而是等于 5 了。这其实是因为C语言中的指针是有其自己的含义的,不同的指针类型索引内存的大小也往往不同,我的机器上 int 类型占用 4 个字节内存空间,因此指针 p1+1 实际上是往后移动了 4 个字节。
读者可自行将 int 换成其他类型试试。
更详细的解释可以参考我之前的文章,都已经分析的非常明白了:
小结
本节列举的 7 个C语言问题其实属于C语言的基本语法和特点,如果能够熟练掌握,相信对找到一份相关的工作是有帮助的。
测试下评论
我也测试