前面几节较为详细的讨论了 linux 内核常用的链表、队列、映射等几种数据结构,本节将介绍C语言中另一种重要的数据结构——二叉搜索树(通常简称为BST),并且将一行一行写出相关的C语言代码。
二叉树的概念
树结构是一个多层的特定数据结构,每个节点之间通过指针连接(这点有些像链表),有 1 个或者 0 个入边,和 0 个或多个出边。对于二叉树,则每个节点最多只能由 2 个出边,一个典型的二叉树如下图所示。
二叉搜索树
如果二叉树的各个节点记录的数值是有序排列的,则该二叉树可称为“二叉搜索树”,它有以下三条性质:
* 左子节点值都小于根节点值
* 右子节点值都大于根节点值
* 所有节点的子树也都是二叉搜索树
能够看出,二叉搜索树其实是“递归”定义的。
因此,二叉搜索树要求在插入数值时保证所有节点都是有序的,即左节点值始终小于父节点值,而右节点值始终大于父节点值。这样一来,二叉搜索树就特别适合存储需要快速检索的数据。
使用C语言描述二叉搜索树
在 C语言中,常常用指针连接二叉树的各个节点,这就和链表很像,所以可以用如下结构体来描述一个二叉树,请看:
typedef struct __BINTREE
{
struct __BINTREE* left;
struct __BINTREE* right;
int data;
}BINTREE;
BINTREE 结构体非常简单,它有 left 和 right 两个指针,分别指向它的左右两个子节点,还有一个 data 成员用于记录数值。
将数值插入二叉搜索树
现在知道了二叉树的数据结构(BINTREE结构体),如果我想将某个数值插入二叉树,并且还要使其满足“二叉搜索树”的三条性质,该怎样编写C语言代码呢?
前面提到,二叉搜索树的三条性质其实是递归定义的,那么使用C语言的递归函数也就非常容易实现,请看:
int insert_node(BINTREE** pptree, int value)
{
if(NULL==(*pptree)){
(*pptree) = (BINTREE*)malloc(sizeof(BINTREE));
if(NULL==(*pptree)){
printf("insert %d failed for malloc failed\n", value);
return -1;
}
(*pptree)->data = value;
(*pptree)->left = (*pptree)->right = NULL;
}else{
if(value < (*pptree)->data)
insert_node(&(*pptree)->left, value);
else if(value > (*pptree)->data)
insert_node(&(*pptree)->right, value);
else
printf("value %d exist!\n", value);
}
return 0;
}
参照二叉搜索树的三条性质,会发现其实 insert_node() 函数非常简单,如果要插入的 value 小于 (* pptree)->data,就将其插入 * pptree 的左子节点,否则将其插入 * pptree 的右子节点。这样一来,二叉树就始终满足二叉搜索树的三条性质了。
关于C语言的递归函数,可以参考这一节。
从二叉搜索树中搜索一个值
因为二叉搜索树是严格有序的,所以从中搜索一个值还是非常简单的,C语言代码可以如下写,请看:
BINTREE* search_node(BINTREE* ptree, int value)
{
BINTREE* n = ptree;
while(n){
if(value > n->data)
n = n->right;
else if(value < n->data)
n = n->left;
else
return n;
}
return NULL;
}
其实就是将要查询的 value 和树的左右子节点比较而已,如果 value 比节点值大,就继续与右子节点比较,否则就继续与左子节点比较,否则就是 value 等于节点值,即搜索成功,可以返回了。
从二叉搜索树中删除一个节点
以下图中的二叉搜索树为例。要删除的节点分三种情况,情况1:如果要删除的是没有子节点的节点(如3,33),那么直接释放该节点,并让其父节点指向 NULL 即可。情况2:如果要删除的是只有一个子节点的节点(如5,30,31),也是非常简单的,先让父节点指向它的子树,再释放之就可以了。
情况3:如果要删除的是有左右两个子节点的节点(例如9,29),就有些复杂了,因为没法把它的子节点全部挂在它的父节点上。
以删除 29 为例,因为它的父节点 9 已经有另外一个子节点,而 29 有两个子节点,显然是没法直接将其都挂在节点 9 上的。
那这种情况该如何处理呢?其实只要使用最接近 29 的节点替换它就可以了,那么谁最接近 29 呢?按照二叉搜索树的性质,最接近 29 的节点,应该是 29 左节点的最右子节点或者 29 右节点的最左子节点。
有了上面的分析,使用 C语言实现从二叉搜索树中删除节点就不难了,请看:
int delete_node(BINTREE** pptree, int value)
{
BINTREE* dn = NULL, *sn = NULL;
BINTREE* fdn = NULL, *fsn = NULL;
/** 找到删除节点和它的父节点 */
dn = *pptree;
while(dn && value!=dn->data){
fdn = dn;
if(value > dn->data)
dn = dn->right;
else if(value < dn->data)
dn = dn->left;
}
/** 如果没找到 */
if(NULL==dn){
printf("no value %d in bintree\n", value);
return -1;
}
printf("found %d, now delete...\n", dn->data);
/** 叶子节点 */
if(NULL==dn->left && NULL==dn->right){
if(NULL==fdn)
*pptree = NULL;
else if(fdn->left == dn)
fdn->left = NULL;
else
fdn->right = NULL;
goto end;
}
end:
free(dn);
dn = NULL;
return 0;
}
根据分析,不管是哪种情况,首先都要找到删除节点和它的父节点。如果删除节点 dn 的左右子节点都为 NULL,则属于情况1,直接释放之并让其父节点指向 NULL即可。再来看看情况2,要删除的节点有一个节点时对应的C语言代码:
/** 有左节点 */
if(NULL!=dn->left && NULL==dn->right){
if(NULL==fdn)
*pptree = dn->left;
else if(fdn->left == dn)
fdn->left = dn->left;
else
fdn->right = dn->left;
goto end;
}
/** 有右节点 */
if(NULL==dn->left && NULL!=dn->right){
if(NULL==fdn)
*pptree = dn->right;
else if(fdn->left == dn)
fdn->left = dn->right;
else
fdn->right = dn->right;
goto end;
}
同样是非常简单的,这里就不再赘述了。最后,来看看比较复杂的情况3,要删除的节点有两个子节点,该如何处理呢?按照分析,我们首先应该找替代节点,替代节点可以是要删除节点的左子树的最右节点,也可以是要删除节点的右子树的最左节点,这里使用前者作为要删除节点的替代节点,请看如下C语言代码:
fsn = dn;
sn = dn->left;
while(NULL!=sn->right){
fsn = sn;
sn = sn->right;
}
找到替代节点及其父节点后,我们先用替代节点替换要删除节点,也即让要删除节点的父节点指向替代节点,C语言代码如下,请看:
/** 先将替代节点放在删除节点的父节点下 */
if(NULL==fdn)
*pptree = sn;
else if(fdn->left == dn)
fdn->left = sn;
else
fdn->right = sn;
sn->right = dn->right;
因为这里使用的替代节点是最右节点,所以它一定没有右子树,但是可能有左子树,这时替代节点已经被拿走替换要删除节点了(和被删除相似),所以它可能的左子树也需要处理一下,请看如下C语言代码:
/** 因为将替代节点拿过来了,所以要处理替代节点原来的子节点 */
if(fsn != dn){
sn->left = dn->left;
if(fsn->left==sn)
fsn->left = sn->left;
else
fsn->right = sn->left;
}
这里需要注意的是,要先判断替代节点的父节点是否要删除节点,如果是,就不能进行以下的操作了,否则可能会出现替代节点指向替代节点自己的情况,导致丢失替代节点的可能左子树。
打印二叉搜索树
到这里,二叉搜索树的插入、查询、删除几大基本功能就写好了,检查其是否正确的最好方法就是做实验,那么打印二叉搜索树就是必不可少的了,这里仍然使用递归的方法打印,请看如下C语言代码:
void _print_tree(BINTREE* ptree)
{
if(NULL!=ptree){
printf("%d ", ptree->data);
_print_tree(ptree->left);
_print_tree(ptree->right);
}
}
void print_tree(BINTREE* ptree)
{
printf("\n");
_print_tree(ptree);
printf("\n\n");
}
递归函数的“基础条件”就是遍历到 NULL 指针,说明已经到达树的末端了,其他部分就非常简单了。
测试我们编写的二叉搜索树C语言代码
到这里终于可以测试我们编写的二叉搜索树代码了,下面先放入 main 函数的 C语言代码,请看:
int main()
{
int ret = 0;
BINTREE *ptree = NULL;
ret += insert_node(&ptree, 9);
ret += insert_node(&ptree, 1);
ret += insert_node(&ptree, 29);
ret += insert_node(&ptree, 31);
ret += insert_node(&ptree, 12);
printf("ret: %d, ptree: %p\n", ret, ptree);
print_tree(ptree);
BINTREE* s = search_node(ptree, 29);
printf("search 29: %p -> %d\n", s, s->data);
delete_node(&ptree, 12);
print_tree(ptree);
return 0;
}
测试代码很简单,先插入了5个节点到二叉树,然后查询其中的一个节点,再删除一个节点。编译C语言程序,执行结果如下:
一切符合预期,至此,我们就一点一点的完成了二叉搜索树的C语言代码。
附完整代码
代码很简单,就直接放在这里吧。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
typedef struct __BINTREE
{
struct __BINTREE* left;
struct __BINTREE* right;
int data;
}BINTREE;
int insert_node(BINTREE** pptree, int value)
{
if(NULL==(*pptree)){
(*pptree) = (BINTREE*)malloc(sizeof(BINTREE));
if(NULL==(*pptree)){
printf("insert %d failed for malloc failed\n", value);
return -1;
}
(*pptree)->data = value;
(*pptree)->left = (*pptree)->right = NULL;
}else{
if(value < (*pptree)->data)
insert_node(&(*pptree)->left, value);
else if(value > (*pptree)->data)
insert_node(&(*pptree)->right, value);
else
printf("value %d exist!\n", value);
}
return 0;
}
BINTREE* search_node(BINTREE* ptree, int value)
{
BINTREE* n = ptree;
while(n){
if(value > n->data)
n = n->right;
else if(value < n->data)
n = n->left;
else
return n;
}
return NULL;
}
int delete_node(BINTREE** pptree, int value)
{
BINTREE* dn = NULL, *sn = NULL;
BINTREE* fdn = NULL, *fsn = NULL;
/** 找到删除节点和它的父节点 */
dn = *pptree;
while(dn && value!=dn->data){
fdn = dn;
if(value > dn->data)
dn = dn->right;
else if(value < dn->data)
dn = dn->left;
}
/** 如果没找到 */
if(NULL==dn){
printf("no value %d in bintree\n", value);
return -1;
}
printf("found %d, now delete...\n", dn->data);
/** 叶子节点 */
if(NULL==dn->left && NULL==dn->right){
if(NULL==fdn)
*pptree = NULL;
else if(fdn->left == dn)
fdn->left = NULL;
else
fdn->right = NULL;
goto end;
}
/** 有左节点 */
if(NULL!=dn->left && NULL==dn->right){
if(NULL==fdn)
*pptree = dn->left;
else if(fdn->left == dn)
fdn->left = dn->left;
else
fdn->right = dn->left;
goto end;
}
/** 有右节点 */
if(NULL==dn->left && NULL!=dn->right){
if(NULL==fdn)
*pptree = dn->right;
else if(fdn->left == dn)
fdn->left = dn->right;
else
fdn->right = dn->right;
goto end;
}
/**
* 程序到达这里说明有双子节点
* */
/** 先找替代节点 */
fsn = dn;
sn = dn->left;
while(NULL!=sn->right){
fsn = sn;
sn = sn->right;
}
/** 先将替代节点放在删除节点的父节点下 */
if(NULL==fdn)
*pptree = sn;
else if(fdn->left == dn)
fdn->left = sn;
else
fdn->right = sn;
sn->right = dn->right;
/** 因为将替代节点拿过来了,所以要处理替代节点原来的子节点 */
if(fsn != dn){
sn->left = dn->left;
if(fsn->left==sn)
fsn->left = sn->left;
else
fsn->right = sn->left;
}
end:
free(dn);
dn = NULL;
return 0;
}
void _print_tree(BINTREE* ptree)
{
if(NULL!=ptree){
printf("%d ", ptree->data);
_print_tree(ptree->left);
_print_tree(ptree->right);
}
}
void print_tree(BINTREE* ptree)
{
printf("\n");
_print_tree(ptree);
printf("\n\n");
}
int main()
{
int ret = 0;
BINTREE *ptree = NULL;
ret += insert_node(&ptree, 9);
ret += insert_node(&ptree, 1);
ret += insert_node(&ptree, 29);
ret += insert_node(&ptree, 31);
ret += insert_node(&ptree, 12);
printf("ret: %d, ptree: %p\n", ret, ptree);
print_tree(ptree);
BINTREE* s = search_node(ptree, 29);
printf("search 29: %p -> %d\n", s, s->data);
delete_node(&ptree, 12);
print_tree(ptree);
return 0;
}