二叉排序树(BST)
定义
二叉排序树又称二叉查找树。二叉排序树或是一棵空树,或是一棵具有下列特性的非空二叉树:
1)若左子树非空,则左子树上所有结点关键字值均小于根结点的关键字值。
2)若右子树非空,则右子树上所有结点关键字值均大于根结点的关键字值。
3)左、右子树本身也分别是一棵二叉排序树
左子树结点值 < 根结点值 < 右子树结点值,对二叉排序树进行中序遍历,可以得到一个递增的有序序列。
查找
二叉排序树的查找是从根结点开始,沿某个分支逐层向下进行比较的过程。若二叉树非空,则将给定值与根结点的关键字比较;若相等,则查找成功;若不等,则当前结点的关键字值大于给定关键字值时,在根节点的左子树查找,否则在根节点的右子树中查找。这是一个递归的过程。
二叉排序树的递归查找算法:
Copy BSTNode * BST_Search ( BitTree T , ElemType key){
if (T == NULL ){
return NULL ;
}
if ( T -> data == key){
return T;
} else if ( T -> data > key){
return BST_Search ( T -> lchild , key);
} else if ( T -> data < key){
return BST_Search ( T -> rchild , key);
}
}
二叉排序树的非递归查找算法:
Copy BSTNode * BST_Search ( BitTree T , ElemType key , BSTNode * & p){
p = NULL ;
while ( T != NULL && key != T -> data ){
p = T;
if ( key < T -> data ){
T = T -> lchild;
} else {
T = T -> rchild;
}
}
return T;
}
插入
二叉排序树是一种动态几何,其特点是树的结构通常不是一次生成的,而是在查找过程中,当树中不存在关键字值等于给定值的结点时在进行插入的。
由于二叉排序树是递归定义的,因此插入结点的过程如下:若二叉排序树为空,则直接插入结点;否则,若关键字k小于根结点关键字,则插入左子树,若关键字大于根结点关键字,则插入右子树。
Copy bool BST_Insert ( BitTree & T , ElemType k){
if ( T == NULL ){
T = (BitTree * ) malloc ( sizeof (BitTree));
T -> data = k;
T -> lchild = T -> rchild = NULL ;
return true ;
} else if ( T -> data == k){ //树中存在相同关键字的结点
return false ;
} else if ( k < T -> key ){
return BST_Insert ( T -> lchild , k);
} else if ( k > T -> data ){
return BST_Insert ( T -> rchild , k);
}
return true ;
}
二叉排序树的构造
构造一棵二叉树就是依次输入数据元素,并将它们插入二叉排序树中适当位置上的过程。具体过程:每读入一个元素,就建立一个结点,若二叉排序树非空,则将新结点的值与根结点的值作比较,若小于根结点的值,则插入左子树,否则插入右子树;若二叉排序树为空,则将新结点作为二叉排序树的根结点。
Copy void BST_Create ( BitTree & T , ElemType str[]){
int sz = sizeof (str) /sizeof ( str [ 0 ]);
T = NULL ;
int i = 0 ;
while ( i < sz ){
Create_BST (T , str [i]);
i ++ ;
}
}
删除(难点)
在二叉排序树中删除一个结点时,不能把以结点为根的子树上的结点都删除,必须先把被删除结点从存储二叉排序树的链表上摘下,将因删除结点而断开的二叉链表重新链接起来,同时确保二叉排序树的性质不会丢失。
删除操作按三种情况来处理:
若被删除结点 x 是叶结点,则直接删除,不会破坏二叉排序树的性质
若结点 x 只有一棵左子树或右子树,则让 x 的子树成为 x 父节点 的子树,替代 x 的位置
若结点 x 有左、右两棵子树,则令 x 的直接后继(或直接前驱)替代 x ,然后从二叉排序树中删除这个直接后继(或直接前驱),这样就转换成了第一或第二种情况。
Copy //中序遍历序列的下一个节点,即比当前节点大的最小节点,简称后继节点。
int successor ( BSTTree * p){
p = p -> rchild;
while ( p -> lchild != NULL ){
p = p -> left;
}
return p -> data;
}
//中序遍历序列的前一个节点,即比当前节点小的最大节点,简称前驱节点。
int predecessor ( BSTTree * p){
p = p -> lchild;
while ( p -> rchild != NULL ){
p = p -> rchild;
}
return p -> data;
}
BSTNode * BST_Delete ( BSTTree & T , ElemType x){
if ( T == NULL ){
return NULL ;
} else {
if ( x < T -> data ){ //要删除的在左边
T -> lchild = BST_Delete ( T -> lchild , x);
} else if ( x > T -> data ){ //要删除的在右边
T -> rchild = BST_Delete ( T -> rchild , x);
} else {
if ( T -> lchild == NULL && T -> rchild == NULL ){ //叶子结点
T = NULL ;
} else if ( T -> rchild != NULL ){
//如果该节点不是叶子节点且有右节点,则用它的后继结点的值替代,然后删除后继结点
T -> data = successor (T);
T -> rchild = BST_Delete ( T -> rchild , T -> data);
} else {
//如果该节点不是叶子节点且只有左节点,则用它的前驱节点的值替代,然后删除前驱节点
T -> data = predecessor (T);
T -> lchild = BST_Delete ( T -> lchild , T -> data);
}
}
}
return T;
}
二叉排序树的查找效率
对于高度为h的二叉排序树,插入和删除操作的运行时间都是O(h)。但在最坏情况下,构造二叉排序树的输入序列是有序的,则会形成一个倾斜的单支树,此时二叉排序树的性能新竹变坏,树的高度也增加为元素个数n。
二叉排序树的查找算法平均查找长度,主要取决于树的高度,即与二叉树的形态有关。若退化成链表,则为O(n);若为平衡二叉树,则为O(log2n)。
相同的关键字其插入顺序不同可能生成不同的二叉排序树。