源碼解析C#中PriorityQueue(優先級隊列)的實現

本文轉載自查看原文 2021-12-30 10:15 932 C#

前言

前段時間看到有大佬對.net 6.0新出的PriorityQueue(優先級隊列)數據結構做了解析，但是沒有源碼分析，所以本着探究源碼的心態，看了看並分享出來。它不像普通隊列先進先出(FIFO)，而是根據優先級出隊。
ps:讀者多注意代碼的注釋。

D叉樹的認識(d-ary heap)

首先我們在表示一個堆(大頂堆或小頂堆)的時候，實際上是通過一個一維數組來維護一個二叉樹(d=2,d表示每個父節點最多有幾個子節點)，首先看下圖的二叉樹，數字代表索引：

任意一個節點的父節點的索引為：(index - 1) / d
任意一個節點的左子節點的索引為：(index * d) + 1
任意一個節點的右子節點的索引為：(index * d) + 2
它的時間復雜度為O(logndn)
通過以上公式，我們就可以輕松通過一個數組來表達一個堆，只需保證能拿到正確的索引即可進行快速的插入和刪除。

源碼解析

構造初始化

關於這部分主要介紹關鍵的字段和方法，比較器的初始化以及堆的初始化，請看如下代碼：

public class PriorityQueue<TElement, TPriority>
{
    /// <summary>
    /// 保存所有節點的一維數組且每一項是個元組
    /// </summary>
    private (TElement Element, TPriority Priority)[] _nodes;

    /// <summary>
    /// 優先級比較器，這里用的泛型，比較器可以自己實現
    /// </summary>
    private readonly IComparer<TPriority>? _comparer;

    /// <summary>
    /// 當前堆的大小
    /// </summary>
    private int _size;

    /// <summary>
    /// 版本號
    /// </summary>
    private int _version;

    /// <summary>
    /// 代表父節點最多有4個子節點，也就是d=4(d=4時好像效率最高)
    /// </summary>
    private const int Arity = 4;

    /// <summary>
    /// 使用位運算符，表示左移2或右移2(效率更高)，即相當於除以4，
    /// </summary>
    private const int Log2Arity = 2;

    /// <summary>
    ///  構造函數初始化堆和比較器
    /// </summary>
    public PriorityQueue()
    {
        _nodes = Array.Empty<(TElement, TPriority)>();
        _comparer = InitializeComparer(null);
    }

    /// <summary>
    ///  重載構造函數，來定義比較器否則使用默認的比較器
    /// </param>
    public PriorityQueue(IComparer<TPriority>? comparer)
    {
        _nodes = Array.Empty<(TElement, TPriority)>();
        _comparer = InitializeComparer(comparer);
    }
    private static IComparer<TPriority>? InitializeComparer(IComparer<TPriority>? comparer)
    {
        //如果是值類型，如果是默認比較器則返回null
        if (typeof(TPriority).IsValueType)
        {
            if (comparer == Comparer<TPriority>.Default)
            {
                return null;
            }

            return comparer;
        }
        //否則就使用自定義的比較器
        else
        {
            return comparer ?? Comparer<TPriority>.Default;
        }
    }

    /// <summary>
    /// 獲取索引的父節點
    /// </summary>
    private int GetParentIndex(int index) => (index - 1) >> Log2Arity;

    /// <summary>
    /// 獲取索引的左子節點
    /// </summary>
    private int GetFirstChildIndex(int index) => (index << Log2Arity) + 1;
}

單元總結：

實際所有元素使用一維數組來維護這個堆。
調用方可以自定義比較器，但是類型得一致。如果沒有比較器，則使用默認的比較器。
默認一個父節點最多有4個子節點，D=4時效率好像是最好的。
獲取父節點索引位置和子節點索引位置使用位運算符，效率更高。

入隊操作

入隊操作操作相對簡單，主要是做擴容和插入處理，請看如下代碼：

public void Enqueue(TElement element, TPriority priority)
{
    //拿到最大位置的索引，然后再將數組長度+1
    int currentSize = _size++;
    _version++;
    //如果長度相等，說明已經到達最大位置，數組需要擴容了才能容下更多的元素
    if (_nodes.Length == currentSize)
    {
        //擴容,參數是代表數組最小容量
        Grow(currentSize + 1);
    }

    if (_comparer == null)
    {
        
        MoveUpDefaultComparer((element, priority), currentSize);
    }
    else
    {
        MoveUpCustomComparer((element, priority), currentSize);
    }
}
private void Grow(int minCapacity)
{
    //增長倍數
    const int GrowFactor = 2;
    //每次擴容的最小值
    const int MinimumGrow = 4;
    //每次擴容都2倍擴容
    int newcapacity = GrowFactor * _nodes.Length;

    //數組不能大於最大長度
    if ((uint)newcapacity > Array.MaxLength) newcapacity = Array.MaxLength;

    //使用他們兩個的最大值
    newcapacity = Math.Max(newcapacity, _nodes.Length + MinimumGrow);

    //如果比參數小，則使用參數的最小值
    if (newcapacity < minCapacity) newcapacity = minCapacity;
    //重新分配內存，設置大小，因為數組的保存在內存中是連續的
    Array.Resize(ref _nodes, newcapacity);
}
private void MoveUpDefaultComparer((TElement Element, TPriority Priority) node, int nodeIndex)
{
    //nodes保存副本
    (TElement Element, TPriority Priority)[] nodes = _nodes;
    //這里入隊操作是從空閑索引第一個位置開始插入
    while (nodeIndex > 0)
    {
        //找父節點索引位置
        int parentIndex = GetParentIndex(nodeIndex);
        (TElement Element, TPriority Priority) parent = nodes[parentIndex];
        //插入節點和父節點比較，如果小於0(默認比較器情況下構建的小頂堆)，則交換位置
        if (Comparer<TPriority>.Default.Compare(node.Priority, parent.Priority) < 0)
        {
            nodes[nodeIndex] = parent;
            nodeIndex = parentIndex;
        }
        //算是性能優化吧，不必檢查所有節點，當發現大於時，就直接退出就可以了
        else
        {
            break;
        }
    }
    //將插入節點放到它應該的位置
    nodes[nodeIndex] = node;
}

單元總結：

首先記錄當前元素最大的索引位置，根據適當的情況來擴容。
擴容正常情況下是以2倍的增長速度擴容。
插入數據時，從最后一個節點的父節點向上還是找，比較元素的Priority，交換位置，默認情況下是構建小頂堆。

出隊操作

出隊操作簡單來說就是將根元素返回並移除(也就是數組的第一個元素)，然后根據比較器將最小或最大的元素放到堆頂，請看如下代碼：

public TElement Dequeue()
{
    if (_size == 0)
    {
        throw new InvalidOperationException(SR.InvalidOperation_EmptyQueue);
    }
    //將堆頂元素返回
    TElement element = _nodes[0].Element;
    //然后調整堆
    RemoveRootNode();
    return element;
}
private void RemoveRootNode()
{
    //記錄最后一個元素的索引位置，並且將堆的大小-1
    int lastNodeIndex = --_size;
    _version++;

    if (lastNodeIndex > 0)
    {
        //堆的大小已經被減1，所以將最后一個元素作為副本，開始從堆頂重新整理堆
        (TElement Element, TPriority Priority) lastNode = _nodes[lastNodeIndex];
        if (_comparer == null)
        {
            MoveDownDefaultComparer(lastNode, 0);
        }
        else
        {
            MoveDownCustomComparer(lastNode, 0);
        }
    }

    if (RuntimeHelpers.IsReferenceOrContainsReferences<(TElement, TPriority)>())
    {
        //將最后一個位置的元素設置為默認值
        _nodes[lastNodeIndex] = default;
    }
}
private void MoveDownDefaultComparer((TElement Element, TPriority Priority) node, int nodeIndex)
{
    (TElement Element, TPriority Priority)[] nodes = _nodes;
    //堆的實際大小
    int size = _size;

    int i;
    //當左子節點的索引小於堆的實際大小時
    while ((i = GetFirstChildIndex(nodeIndex)) < size)
    {
        //左子節點元素
        (TElement Element, TPriority Priority) minChild = nodes[i];
        //當前左子節點的索引
        int minChildIndex = i;
        //這里即找到所有同一個父節點的相鄰子節點，但是要判斷是否超出了總的大小
        int childIndexUpperBound = Math.Min(i + Arity, size);
        //按照索引區間順序查找，並根據比較器找到最小的子元素位置
        while (++i < childIndexUpperBound)
        {
            (TElement Element, TPriority Priority) nextChild = nodes[i];
            if (Comparer<TPriority>.Default.Compare(nextChild.Priority, minChild.Priority) < 0)
            {
                minChild = nextChild;
                minChildIndex = i;
            }
        }
        //如果最后一個節點的元素，比這個最小的元素還小，那么直接放到父節點即可
        if (Comparer<TPriority>.Default.Compare(node.Priority, minChild.Priority) <= 0)
        {
            break;
        }
        //將最小的子元素賦值給父節點
        nodes[nodeIndex] = minChild;
        nodeIndex = minChildIndex;
    }
    //將最后一個節點放到空閑出來的索引位置
    nodes[nodeIndex] = node;
}

單元總結：

返回根節點元素，然后移除根節點元素，調整堆。
從根節點開始，依次查找對應父節點的所有子節點，放到堆頂，也就是數組索引0的位置，然后如果樹還有層數，繼續循環查找。
將最后一個元素放到堆適當的位置，然后再將最后一個位置的元素置為默認值。

總結

通過源碼的解讀，除了了解類的設計之外，更對對優先級隊列數據結構的實現有了更加深刻和清晰的認識。
這里也只是粘貼出主要的代碼，需要看詳細代碼的請點擊這里，筆者可能有一些解讀錯誤的地方，歡迎評論指正。

關注公眾號，不定期分享原創干貨知識

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 java 中PriorityQueue優先級隊列使用方法 java~優先級隊列PriorityQueue 優先級隊列PriorityQueue 測試，會自動排序 C#隊列學習筆記：RabbitMQ優先級隊列關於優先級隊列的實現優先級隊列實現 d-ary heap實現一個快速的優先級隊列（C#） C/C++優先級隊列 c++ 優先級隊列 Redis 實現隊列優先級