什么是优先级队列(堆)
优先级队列一般通过堆(Heap)这种数据结构来实现,堆是一种特殊的完全二叉树,其每个节点都满足堆的性质。如下图所示就是一个堆:
堆的存储方式
由于堆是一棵完全二叉树,所以也满足二叉树的性质:
1、 一颗非空二叉树的第i层上最多有2^(i-1)个结点。
2、 一颗深度为k的二叉树,其树的最大结点为2^k-1
3、 由第二条性质推出,具有n个结点的完全二叉树的深度k = log(n+1) [以2为底的log] 向上取整。
4、 对于任意一颗二叉树,其叶子结点为n0(结点度为0),度为2的结点个数为n2,则n0 = n2 + 1。
5、 对于具有n个结点的完全二叉树,按照从上到下、从左到右的顺序从0开始编号,则对于序号i的结点:
左孩子结点下标为2i + 1,当2i + 1 > n 时,就不存在左孩子结点。
右孩子结点下标为2i + 2,当2i + 2 > n 时,就不存在右孩子结点。
其父亲结点的下标为(i - 1) / 2。i == 0时,其结点为根节点,没有父亲结点。
当元素存入数组后,需要利用性质5来完成一些功能,完成对数组的访问。
最大堆或最小堆
对于一个完全二叉树来说:每个节点的值都大于或等于其子节点的值,堆顶元素是整个堆中的最大值,被称为最大堆;
每个节点的值都小于或等于其子节点的值,堆顶元素就是堆中的最小值,被称为最小堆。
对于最大堆或者最小堆来说,数组是最常用的实现方式。数组存储堆中的值是以层序遍历的方式来存储的。
最大堆或最小堆的创建
根据数组来创建最大堆或最小堆。以下图为例:
下面代码实现了最大堆
public void createHeapMAX() {
//需要对每棵子树进行调整,调整方式是一样的。
//parent是从最后一个孩子的父亲结点开始的,每次parent--来访问其他的树。
//当parent为根节点调整完了,说明完成了最大堆的创建
for (int parent = ((useSize - 1) - 1) / 2; parent >= 0; parent--) {
//每个初始parent的树的向下调整
siftDownMAX(parent,useSize);
//传useSize的目的是为了,在parent和child交换后,parent需要到child位置在判断下一个结点是否满足最大堆,
//对应的每棵树结束的标志是child下标超过useSize
}
}
/**
* 向下调整,让节点的值不断向下调整
* @param parent
* @param useSize
*/
private void siftDownMAX(int parent,int useSize){
//1、定义child下标
int child = parent * 2 + 1;
while(child < useSize) {
//2、比较左右子树的值,child谁是最大值
if(child + 1 < useSize && elem[child + 1] > elem[child]) {
child++;
}
//3、判断是否交换
if(elem[parent] < elem[child]) {
swap(parent,child);
//当前父节点变为子节点,继续检查其新的子节点(检查子树的子树)
parent = child;
child = parent * 2 + 1;
}else {
return;
//如果当前父节点已经大于其子节点,那么其子树必然已经是合法的最大堆(因为构建过程是自底向上的)
}
}
}
private void swap(int parent,int child){
int temp = elem[parent];
elem[parent] = elem[child];
elem[child] = temp;
}
和上述逻辑差不多,就是更改了比较符号。下面是实现最小堆的代码:
public void createHeapMIN() {
for (int parent = ((useSize - 1) - 1) / 2; parent >= 0; parent--) {
siftDownMIN(parent,useSize);
}
}
private void siftDownMIN(int parent,int useSize){
int child = parent * 2 + 1;
while(child < useSize) {
if(child + 1 < useSize && elem[child + 1] < elem[child]) {
child++;
}
if(elem[parent] > elem[child]) {
swap(parent,child);
parent = child;
child = parent * 2 + 1;
}else {
return;
}
}
}
private void swap(int parent,int child){
int temp = elem[parent];
elem[parent] = elem[child];
elem[child] = temp;
}
上述代码的总时间复杂度为O(N)。单个siftDownMAX和siftDownMIN的时间复杂度为O(logN)
堆的删除与插入
堆的删除
在堆中删除一定是删除堆顶的元素,也就是根节点。
实现的方法是:
1、将最后一个叶子节点和根节点交换。
2、此时再删除最后一个叶子节点(原根节点)。
3、进行向下调整
public int poll() {
if(isEmpty()) {
return -1;
}
swap(0,useSize - 1);
useSize--;
siftDownMAX(0,useSize);
return elem[0];
}
堆的插入
实现的方法是:
1、将添加的数据放在最底层。
2、在进行向上调整
public void offer(int value) {
if(isFull()){
elem = Arrays.copyOf(elem,2*elem.length);
}
elem[useSize] = value;
useSize++;
int child = useSize - 1;
siftUp(child);
}
/**
* 实现的是最大堆
* @param child
*/
private void siftUp(int child){
int parent = (child - 1) / 2;
while (child > 0) {
if(elem[parent] < elem[child]) {
swap(parent,child);
child = parent;//向上调整
parent = (child - 1) / 2;
}else {
break;
}
}
}
private void swap(int parent,int child){
int temp = elem[parent];
elem[parent] = elem[child];
elem[child] = temp;
}
上述代码的总时间复杂度为O(N*logN)。单个siftUp的时间复杂度为O(logN)。
显然较上面创建的最大堆的时间复杂度大一些。
获取堆顶元素
实现的方法是:
直接返回数组首元素即可
public int peek() {
if(isEmpty()) {
return -1;
}
return elem[0];
}
private boolean isEmpty() {
return useSize == 0;
}
堆的集合类
对于堆的集合类有两种PriorityQueue
和 PriorityBlockingQueue
。PriorityBlockingQueue
属于线程安全的,PriorityQueue
属于线程不安全的。
我们先学习PriorityQueue
类
1、由于在堆的实现过程中需要进行比较,所以放置的元素一定要能比较。像对象就不能进行比较,也就不能成为元素。
2、不能传入null
3、可以任意插入多个元素,类有自动扩容的机制
public class TestPriorityQueue {
public static void main(String[] args) {
PriorityQueue<Student> priorityQueue = new PriorityQueue<>();
PriorityQueue<Integer> priorityQueueAge = new PriorityQueue<>();
Student student = new student();
priorityQueueAge.offer(Student.age);//没有错误,比较的是int类型
priorityQueue.offer(new Student());//会抛出ClassCastException异常
priorityQueue.offer(null);//会抛出NullPointerException异常
}
}
class Student {
public int age;
}
构造方法
构造方法 | 功能 |
---|---|
PriorityQueue() | 创建一个空的优先级队列,初始容量为11 |
PriorityQueue(int initialCapacity) | 初始优先级队列的容量,但不能传小于1的数字 |
PriorityQueue(Collection<? extends E> c) | 传入一个集合类来创建堆 |
PriorityQueue(Comparator<? super E> comparator) | 传入比较器,按照比较器的方法完成堆的排序 |
PriorityQueue(int initialCapacity,Comparator<? super E> comparator) | 传入比较器和初始容量 |
public static void main(String[] args) {
PriorityQueue<Integer> priorityQueue = new PriorityQueue<>();
priorityQueue.offer(10);
priorityQueue.offer(3);
priorityQueue.offer(4);
System.out.println(priorityQueue.peek());//输出:3
}
//传入一个集合类
public static void main(String[] args) {
ArrayList<Integer> arrayList = new ArrayList<>();
arrayList.add(10);
arrayList.add(3);
arrayList.add(4);
PriorityQueue<Integer> priorityQueue = new PriorityQueue<>(arrayList);
System.out.println(priorityQueue.peek());//输出:3
}
通过上述代码和PriorityQueue
类的源码,发现,当没有传入比较器时,堆默认是按最小堆来排的。要实现最大堆就需要传入一个比较器。
1、通过实现Comparator接口
(完整类),来创建一个比较器
class Compare implements Comparator<Integer> {
@Override
public int compare(Integer o1, Integer o2) {
return o2 - o1;//此时是按最大堆来建立的
//return o2.compareTo(o1);//此时也是按最大堆来建立的//Integer类继承了Comparable接口
//return o1 - o2;就是按最小堆来建立的
}
}
public static void main(String[] args) {
Compare compare = new Compare();
PriorityQueue<Integer> priorityQueue = new PriorityQueue<>(compare);
priorityQueue.offer(10);
priorityQueue.offer(3);
priorityQueue.offer(4);
System.out.println(priorityQueue.peek());//输出:10
}
2、使用匿名内部类,在需要比较器的地方直接创建匿名内部类,无需定义独立的类。
public static void main(String[] args) {
PriorityQueue<Integer> priorityQueue = new PriorityQueue<>(new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return o2 - o1;
}
});
priorityQueue.offer(10);
priorityQueue.offer(3);
priorityQueue.offer(4);
System.out.println(priorityQueue.peek());//输出:10
}
常用方法
方法 | 功能 |
---|---|
boolean offer(E e) | 添加数据 |
E peek() | 获取堆顶的元素 |
E poll() | 删除优先级最高的元素并返回 |
int size() | 获取有效元素个数 |
void clear() | 清空元素 |
boolean isEmpty() | 判断是否为空 |
在官方中插入元素(offer()
)的时间复杂度为O(logN),用的是向上调整,创建堆(批量插入N个元素)的时间复杂度为O(N*logN)。使用构造方法传入集合类时,时间复杂度为O(N),用的是向下调整。
删除堆顶的元素(poll()
)的时间复杂度为O(logN),用的是向下调整。
关于堆的一些问题
top-K问题
代码展示:
代码一:
/**
* 总时间复杂度为:O((N+k)*logN)
* @param array
* @param k
* @return
*/
public int[] topK1(int[] array,int k) {
int[] ret = new int[k];
if(array == null || k <= 0) {
return ret;
}
PriorityQueue<Integer> priorityQueue = new PriorityQueue<>(array.length);
//将所有元素放到堆中,offer方法自动按照最小堆排序
for (int i = 0;i < array.length;i++) {
priorityQueue.offer(array[i]);
}
//将堆中前三个元素放到ret数组中。
for (int i = 0;i < k;i++) {
ret[i] = priorityQueue.poll();
}
return ret;
}
代码二:
/**
* 总时间复杂度为:O(N*logK)
* @param array
* @param k
* @return
*/
public int[] topK(int[] array,int k) {
int[] ret = new int[k];
if(array == null || k <= 0) {
return ret;
}
//根据最大根创建优先级队列
PriorityQueue<Integer> priorityQueue = new PriorityQueue<>(k, new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return o2 - o1;
}
});
//创建有K个元素的堆
//时间复杂度为:O(K * logK)
for (int i = 0; i < k; i++) {
priorityQueue.offer(array[i]);
}
//遍历后面的数组元素
//时间复杂度为:O((N-K) * logK)
for (int i = k; i < array.length; i++) {
//当数组元素大于堆顶的元素,说明这个元素不是前K个最小的元素
if(array[i] < priorityQueue.peek()){
priorityQueue.poll();
priorityQueue.offer(array[i]);
}
}
//将堆中的前k放到ret数组中
//时间复杂度为:O(K * logK) 几乎可以忽略
for (int i = 0; i < k; i++) {
ret[i] = priorityQueue.poll();
}
return ret;
}
代码解释:
对于代码一来说,是将所有元素全部放到堆中,进行堆排。如果有大量数据,会导致有很多次进行调整,时间复杂度高,为O((N+k)logN)。
对于代码二来说,只是对前K个元素进行了堆排,降低了时间复杂度,为O(NlogK)。
堆排序
如果是按照从小到大来排序,是要创建最大堆,反之创建最小堆。
以从小到大来排序为例。当创建最大堆后,将堆顶的元素和最后一个元素交换,再对剩余元
素进行调整为最大堆。重复这操作,直到整个数组有序。
这里为什么不创建最小堆呢?
当创建的是最小堆时,需要再创建一个数组,用来存放最小堆的堆顶,再对剩余元
素进行调整为最小堆。这样相比于创建最大堆,其空间复杂就会大一些。
代码展示:
/**
* 从小到大排序
* 时间复杂度为:O(N*logN)
* 空间复杂度为:O(1)
* @param array
*/
public void heapSort(int[] array) {
//先创建一个最大堆,时间复杂度为:O(N)
for (int parent = ((array.length - 1) - 1) / 2; parent >= 0 ; parent--) {
shiftDown(array,parent,array.length);
}
int end = array.length - 1;
//进行排序,时间复杂度为:O(N*logN) <---- 有N次调整,每次调整的时间复杂度为:O(logN)
while (end > 0) {
swap(array,0,end);
end--;
shiftDown(array,0,end + 1);
}
}
private void swap(int[] array,int a,int b) {
int temp = array[a];
array[a] = array[b];
array[b] = temp;
}
private void shiftDown(int[] array ,int parent,int useSize) {
int child = 2 * parent + 1;
while (child < useSize) {
if(child + 1 <useSize && array[child] < array[child + 1]) {
child++;
}
if(array[parent] < array[child]) {
swap(array,parent,child);
parent = child;
child = 2 * parent + 1;
}else {
break;
}
}
}