Snowflake算法 ID生成


Snowflake算法 ID生成

http://blog.csdn.net/w200221626/article/details/52064976
使用UUID或者GUID產生的ID沒有規則

Snowflake算法是Twitter的工程師為實現遞增而不重復的ID實現的
img_name
從圖上看除了第一位不可用之外其它三組均可浮動站位,據說前41位就可以支撐到2088年,10位的可支持1023台機器,最后12位序列號可以在1毫秒內產生4095個自增的ID。
數據中主鍵有多種方式:數據庫自增、程序生成。程序生成一般采用的是snowflake 算法。這個算法在網上有很多解釋,這里就不做過多的解釋。

生成的id大致有以下組成:

Snowflake算法一般生成的每一個ID都是64位的整型數,它的核心算法也比較簡單高效,結構如下:

41位的時間序列,精確到毫秒級,41位的長度可以使用69年。時間位還有一個很重要的作用是可以根據時間進行排序。

5位的數據中心標識,5位的長度最多支持部署32個節點。

5位的機器標識,8位的長度最多支持部署255個節點。

12位的計數序列號,序列號即一系列的自增id,可以支持同一節點同一毫秒生成多個ID序號,12位的計數序列號支持每個節點每毫秒產生4095個ID序號。

最高位是符號位,始終為0,不可用。

根據生成規則和實際代碼:
(有關算法詳解:https://segmentfault.com/a/1190000011282426#articleHeader2)

在多線程中使用要加鎖。
C# 實現 Snowflake算法
img_name

/// <summary>
    /// 動態生產有規律的ID Snowflake算法是Twitter的工程師為實現遞增而不重復的ID實現的
    /// http://blog.csdn.net/w200221626/article/details/52064976     
    /// C# 實現 Snowflake算法 
    /// </summary>
    public class Snowflake
    {
        private static long machineId;//機器ID
        private static long datacenterId = 0L;//數據ID
        private static long sequence = 0L;//計數從零開始

        private static long twepoch = 687888001020L; //唯一時間隨機量

        private static long machineIdBits = 5L; //機器碼字節數
        private static long datacenterIdBits = 5L;//數據字節數
        public static long maxMachineId = -1L ^ -1L << (int)machineIdBits; //最大機器ID
        private static long maxDatacenterId = -1L ^ (-1L << (int)datacenterIdBits);//最大數據ID

        private static long sequenceBits = 12L; //計數器字節數,12個字節用來保存計數碼        
        private static long machineIdShift = sequenceBits; //機器碼數據左移位數,就是后面計數器占用的位數
        private static long datacenterIdShift = sequenceBits + machineIdBits;
        private static long timestampLeftShift = sequenceBits + machineIdBits + datacenterIdBits; //時間戳左移動位數就是機器碼+計數器總字節數+數據字節數
        public static long sequenceMask = -1L ^ -1L << (int)sequenceBits; //一微秒內可以產生計數,如果達到該值則等到下一微妙在進行生成
        private static long lastTimestamp = -1L;//最后時間戳

        private static object syncRoot = new object();//加鎖對象
        static Snowflake snowflake;

        public static Snowflake Instance()
        {
            if (snowflake == null)
                snowflake = new Snowflake();
            return snowflake;
        }

        public Snowflake()
        {
            Snowflakes(0L, -1);
        }

        public Snowflake(long machineId)
        {
            Snowflakes(machineId, -1);
        }

        public Snowflake(long machineId, long datacenterId)
        {
            Snowflakes(machineId, datacenterId);
        }

        private void Snowflakes(long machineId, long datacenterId)
        {
            if (machineId >= 0)
            {
                if (machineId > maxMachineId)
                {
                    throw new Exception("機器碼ID非法");
                }
                Snowflake.machineId = machineId;
            }
            if (datacenterId >= 0)
            {
                if (datacenterId > maxDatacenterId)
                {
                    throw new Exception("數據中心ID非法");
                }
                Snowflake.datacenterId = datacenterId;
            }
        }

        /// <summary>
        /// 生成當前時間戳
        /// </summary>
        /// <returns>毫秒</returns>
        private static long GetTimestamp()
        {
            //讓他2000年開始
            return (long)(DateTime.UtcNow - new DateTime(2000, 1, 1, 0, 0, 0, DateTimeKind.Utc)).TotalMilliseconds;
        }

        /// <summary>
        /// 獲取下一微秒時間戳
        /// </summary>
        /// <param name="lastTimestamp"></param>
        /// <returns></returns>
        private static long GetNextTimestamp(long lastTimestamp)
        {
            long timestamp = GetTimestamp();
            int count = 0;
            while (timestamp <= lastTimestamp)//這里獲取新的時間,可能會有錯,這算法與comb一樣對機器時間的要求很嚴格
            {
                count++;
                if (count > 10)
                    throw new Exception("機器的時間可能不對");
                Thread.Sleep(1);
                timestamp = GetTimestamp();
            }
            return timestamp;
        }

        /// <summary>
        /// 獲取長整形的ID
        /// </summary>
        /// <returns></returns>
        public long GetId()
        {
            lock (syncRoot)
            {
                long timestamp = GetTimestamp();
                if (Snowflake.lastTimestamp == timestamp)
                { //同一微妙中生成ID
                    sequence = (sequence + 1) & sequenceMask; //用&運算計算該微秒內產生的計數是否已經到達上限
                    if (sequence == 0)
                    {
                        //一微妙內產生的ID計數已達上限,等待下一微妙
                        timestamp = GetNextTimestamp(Snowflake.lastTimestamp);
                    }
                }
                else
                {
                    //不同微秒生成ID
                    sequence = 0L;
                }
                if (timestamp < lastTimestamp)
                {
                    throw new Exception("時間戳比上一次生成ID時時間戳還小,故異常");
                }
                Snowflake.lastTimestamp = timestamp; //把當前時間戳保存為最后生成ID的時間戳
                long Id = ((timestamp - twepoch) << (int)timestampLeftShift)
                    | (datacenterId << (int)datacenterIdShift)
                    | (machineId << (int)machineIdShift)
                    | sequence;
                return Id;
            }
        }

    }
復制代碼
復制代碼
    [TestClass]
    public class SnowflakeUnitTest1
    {
        /// <summary>
        /// 動態生產有規律的ID Snowflake算法是Twitter的工程師為實現遞增而不重復的ID實現的
        /// </summary>
        [TestMethod]
        public void SnowflakeTestMethod1()
        {
            var ids = new List<long>();
            for (int i = 0; i < 1000000; i++)//測試同時100W有序ID
            {
                ids.Add(Snowflake.Instance().GetId());
            }
            for (int i = 0; i < ids.Count - 1; i++)
            {
                Assert.IsTrue(ids[i] < ids[i+1]);
            }
        }
    }

namespace ConsoleApplicationTester
{
    class Program
    {
        static void Main(string[] args)
        {
            for (int i = 0; i < 1000; i++)
            {
                Console.WriteLine("開始執行 " + DateTime.Now.ToString("yyyy-MM-dd HH:mm:ss:ffffff") + "    " + Snowflake.Instance().GetId());

                Console.WriteLine("Snowflake.maxMachineId:" + Snowflake.maxMachineId);
            }
        }
    }
}

“雪花”項目:Microsoft探索在.NET中實現手工內存管理

http://www.infoq.com/cn/news/2017/09/snowflake

來自Microsoft研究院、劍橋大學和普林斯頓大學的一些研究人員構建了一個.NET的分支,實現了在運行時中添加支持手工內存管理的API。研究方法的細節及所獲得的性能提升發表在名為“Project Snowflake: Non-blocking Safe Manual Memory Management in .NET”(“雪花”項目:非阻塞的、安全的.NET手工內存管理)的論文中。

“雪花“項目意在實現.NET中的手工內存管理,這一改進被認為對一些應用是非常有用。C#、.NET等現代編程語言都采用了垃圾回收機制,使編程人員得以從管理對象的任務中解放出來,這一機制的優點廣為人知,涉及提高生產力、改進程序穩定性、內存安全及防止惡意操作等方面。但是垃圾回收機制需要付出一些性能上的代價,盡管這在很多情況下不易被察覺,但是在一些情況下還是存在問題的。“雪花”項目的研究人員就指出,對於在具有上百GB堆內存的系統上運行數據分析和流處理任務,就可受益於手工內存管理。

“雪花”項目所引入的手工內存管理是與垃圾回收機制並行工作的,開發人員一般情況下使用的是垃圾回收機制,但在環境需要時也可以選擇手工內存管理。該引入到運行時中的改進並不會對已有應用產生影響,並且會改進多線程應用的性能。“雪花”項目實現了“在程序任一位置分配和釋放獨立對象,並確保手工管理對象同樣享有完全的類型安全和時序安全,即使存在並發訪問時。”

“雪花”中提出了兩個新概念,即對象“所有者”(Owner)和“護盾”(Shield),它們實現為CoreCLR和CoreFX層級的API。“所有者”表示了棧或堆中的一個位置,保存了對手工堆中分配對象的唯一引用。“所有者”獲取自“護盾”,而引入“護盾”是為了避免手工對象在被多個線程訪問時重分配(deallocate)。“護盾”確保了當最后使用一個對象的線程重分配該對象后,才從堆中移除該對象。論文中是如下詳細闡述該機制的:

我們的解決方案……受到了無鎖數據結構研究中的“風險指針”(Hazard Pointer)這一概念的啟發。我們引入了一種機制,當線程想要通過其中一個“所有者”位置訪問手工對象時,這一意圖將會發布在線程本地狀態(TLS,Thread-Local State)中。此注冊過程可看成是創建了一個“護盾”,該“護盾”將保護對象不會被重分配,並授權發布注冊的線程可直接訪問對象,例如調用對象的方法,或是轉換(mutate)對象的字段。同時,不允許任何線程(同一線程或另一個線程)重分配對象及回收(reclaim)對象的內存。一旦客戶代碼不再需要訪問該對象,就可以釋放(dispose)“護盾”,即從對象的TLS中移除了指向該對象的引用。直接訪問從“護盾”獲取的對象是不安全的操作,因為在釋放“護盾”后,實際的重分配操作依然允許繼續。

論文中提供了一系列給定場景下的測試結果,表明使用“雪花”項目的性能相比於垃圾回收機制取得了改進。其中,“在峰值工作集上獲得了高達三倍的性能提高,在運行時上取得了兩倍的性能提高”。測試結果給出了很好的性能改進。這是因為當對象池非常大時,垃圾回收為釋放內存需要花費很多時間遍歷對象圖。

Microsoft並未詳述是否有規划在.NET中加入“雪花”項目。但考慮到這是一種非侵入式的和安全的機制,我們希望在.NET的未來版本中能集成類似的功能。

查看英文原文: Microsoft Explores Manual Memory Management in .NET with Snowflake


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM