開源一個新雪花算法

本文轉載自查看原文 2021-03-11 19:28 4654 C# 雪花算法/ JS Number

內容已過期，最新內容請查看：
https://www.cnblogs.com/yitter/p/14610169.html

比雪花算法更好用的ID生成算法（單機或分布式唯一ID）

💎 算法介紹

❄ 一個全新的雪花漂移算法，生成的ID更短、速度更快。

❄ 核心在於縮短ID長度的同時，具有極高瞬時並發處理量（保守值 50W/0.1s）。

❄ 原生支持 C#/Java/Go/Rust/C 等語言，並由 Rust 提供 PHP、Python、Node.js、Ruby 等語言多線程安全調用庫(FFI)。如果你的應用有語言開發，基於本算法提供的邏輯實現，集成會更簡單，邏輯會更一致。

❄ 支持 k8s 等容器化部署，自動注冊 WorkerId。

❄ 可在單機或分布式環境中生成唯一ID。

💎 技術支持

開源地址1：https://gitee.com/yitter/idgenerator

開源地址2：https://github.com/yitter/idgenerator

QQ群：646049993

需求來源

💧 作為架構設計的你，想要解決數據庫主鍵唯一的問題，特別是在分布式系統多數據庫的時候。

💧 你希望這個主鍵是用最少的存儲空間，索引速度更快，Select、Insert 和 Update 更迅速。

💧 你要考慮在分庫分表（合庫合表）時，主鍵值可直接使用，並能反映業務時序。

💧 如果這樣的主鍵值太長，超過前端 JS Number 類型最大值，須把 Long 型轉換為 String 型，你會覺得有點沮喪。

💧 盡管 Guid 能自增，但占用空間大，索引速度慢，你也不想用它。

💧 應用實例可能超過50個，每個並發請求可達10W/s。

💧 在容器環境部署應用（水平擴展、自動伸縮）。

💧 不想依賴 redis 的自增操作。

💧 你希望系統運行 100 年以上。

傳統算法問題

❌ 生成的ID太長。

❌ 瞬時並發量不夠。

❌ 不能解決時間回撥問題。

❌ 不支持后補生成前序ID。

❌ 依賴外部存儲系統。

新算法特點

✔ 整形數字，隨時間單調遞增（不一定連續），長度更短，用50年都不會超過 js Number類型最大值。（默認配置 WorkerId 是6bit，自增數是6bit）

✔ 速度更快，是傳統雪花算法的2-5倍，0.1秒可生成50萬個。（i7筆記本，默認算法配置6bit+6bit）

✔ 支持時間回撥處理。比如服務器時間回撥1秒，本算法能自動適應生成臨界時間的唯一ID。

✔ 支持手工插入新ID。當業務需要在歷史時間生成新ID時，用本算法的預留位能生成5000個每秒。

✔ 漂移時能外發通知事件。讓調用方確切知道算法漂移記錄，Log並發調用量。

✔ 不依賴任何外部緩存和數據庫。（k8s環境下自動注冊 WorkerId 的動態庫依賴 redis）

✔ 基礎功能，開箱即用，無需配置文件、數據庫連接等。

性能數據

(參數：10位自增序列，1000次漂移最大值)

連續請求量	5K	5W	50W
傳統雪花算法	0.0045s	0.053s	0.556s
雪花漂移算法	0.0015s	0.012s	0.113s

效果

🟣 js Number 類型最大數值：9007199254740992，本算法在保持並發性能（5W+/0.01s）和最大64個 WorkerId（6bit）的同時，能用70年才到 js Number Max 值。

🟣 增加WorkerId位數到8bit（256節點）時，15年達到 js Number Max 值。

🟣 極致性能：500W/s~3000W/s。（所有測試數據均基於8代低壓i7計算。）

💎 生成的ID

默認配置：

WorkerIdBitLength = 6
SeqBitLength = 6

ID示例（基於默認配置）：

129053495681099        (本算法運行1年)
387750301904971        (運行3年)
646093214093387        (運行5年)
1292658282840139       (運行10年)
9007199254740992       (js Number 最大值)
165399880288699493     (普通雪花算法生成的ID)

本算法生成的 ID 值，是 js Number 最大值的 1%-10%，是普通雪花算法值的千分之一，而計算能力卻超過普通雪花算法。

適用范圍

🔷小型、中型、大型需要全局唯一Id（不用Guid）的項目。

🔷 分布式項目。

🔷不想將 Long 型轉 String 給前端用的項目。（若前端支持bigint，則可不轉類型）

如何處理時間回撥

🔶 當發生系統時間回撥時，算法采用過去時序的預留序數生成新的ID。

🔶 默認每秒生成100個（速度可調整）。

🔶 回撥生成的ID序號，默認靠前，也可以調整為靠后。

🔶 允許時間回撥至本算法預設基數（參數可調）。

能用多久

🔵 在默認配置下，ID可用 71000 年不重復。

🔵 在支持 1024 個工作節點時，ID可用 4480 年不重復。

🔵 在支持 4096 個工作節點時，ID可用 1120 年不重復。

🔵 以上所有工作節點，均擁有 50W/0.1s 瞬時處理速度。

默認配置

💍 WorkerIdBitLength=6，能支持64個 WorkerId，編號0~63。

💍 可通過減少 WorkerIdBitLength 到1~4（為4時最大支持WorkerId為2^4=16個），以減少Id長度。

💍 SeqBitLength=6，能支持每秒並發5W請求時，平均處理速度不超過 0.005 s。（不同語言略有差別，最高性能不超過0.002s，平均不超過0.005s）

💍 可通過增加 SeqBitLength，支持更高的每秒並發數。默認配置能很高效地支持每秒 5W 並發請求，若要求更高，可適當增加 SeqBitLength 到 8~16，但這將增加Id長度。

集成建議

💎 常規集成

1️⃣ 用單例模式調用。外部集成方使用更多的實例並行調用本算法，不會增加ID產出效能，因為本算法采用單線程模式生成ID。

2️⃣ 指定唯一的 WorkerId。必須由外部系統確保 WorkerId 的全局唯一性，並賦值給本算法入口方法。

3️⃣ 單機多實例部署時使用不同 WorkerId。並非所有實現都支持跨進程的並發唯一，保險起見，在同一主機上部署多應用實例時，請確保各 WorkerId 唯一。

4️⃣ 異常處理。算法會拋出所有 Exception，外部系統應 catch 異常並做好應對處理，以免引發更大的系統崩潰。

5️⃣ 認真理解 IdGeneratorOptions 的定義，這對集成和使用本算法有幫助。

6️⃣ 使用雪花漂移算法。雖然代碼里包含了傳統雪花算法的定義，並且你可以在入口處指定（Method=2）來啟用傳統算法，但仍建議你使用雪花漂移算法（Method=1，默認的），畢竟它具有更好的伸縮力和更高的性能。

7️⃣ 不要修改核心算法。本算法內部參數較多，邏輯較為復雜，在你尚未掌握核心邏輯時，請勿嘗試修改核心代碼且用於生產環境，除非通過大量細致、科學的測試驗證。

💎 自動注冊WorkerId

🔍 唯一ID生成器，依賴WorkerId，當業務服務需要水平自動化復制時，就要求它能自動化注冊全局唯一WorkerId，然后各個容器化的無差別部署的業務服務，才能根據它生產唯一ID。

🔍 本算法提供一個開源的動態庫（go語言實現），能在容器 k8s（或其它容器化集群）環境下，通過 redis 自動注冊 WorkerId。動態庫提供的C接口方法有：


// 注冊一個新的WorkerId
extern __declspec(dllexport) GoInt RegisterWorkerId(char* ip, GoInt port, char* password, GoInt maxWorkerId);

// 注銷WorkerId
extern __declspec(dllexport) void UnRegisterWorkerId();

// 檢查本地WorkerId是否有效
extern __declspec(dllexport) GoUint8 ValidateLocalWorkerId(GoInt workerId);

redis作用

🔎 只用於注冊 WorkerId ，不用於生產 ID。

🔎 如果手工指定 WorkerId，即可不依賴 redis。

其它分布式集成

🟢1.可增加 WorkerIdBitLength 到最大20，支持 1,048,576 個節點，且不影響上述並發性能。[算法支持]

🟢2.采用中心化 IdGenerator 集群，生成可用 Id 列表，存入 Redis 隊列供節點消費。此時64個中心化節點數足夠大型互聯網項目使用。[需集成方擴展實現]

🟢3.以上2條二選一即可，采用方法2一般是因為不想增加最終 ID 長度，但節點數超過64個。

🟢4.任何加大 WorkerIdBitLength 或 SeqBitLength 的設置，都可能會增加 ID 的長度。

💎 配置變更

配置變更指是系統運行一段時間后，再變更運行參數（IdGeneratorOptions選項值），請注意：

🔴 1.最重要的一條原則是：BaseTime 只能往前（比老值更小、距離現在更遠）賦值，原因是往后賦值極大可能產生相同的時間戳。[不推薦在系統運行之后調整 BaseTime]

🔴 2.任何時候增加 WorkerIdBitLength 或 SeqBitLength，都是可以的，但是慎用 “減小”的操作，因為這可能導致在未來某天生成的 ID 與過去老配置時相同。[允許在系統運行之后增加任何一個 BitLength 值]

🔴 3.如果必須減小 WorkerIdBitLength 或 SeqBitLength 其中的一項，一定要滿足一個條件：新的兩個 BitLength 之和要大於老的值之和。[不推薦在運行之后縮小任何一個 BitLength 值]

🔴 4.上述3條規則，並未在本算法內做邏輯控制，集成方應根據上述規則做好影響評估，確認無誤后，再實施配置變更。

💎💎 代碼示例

🌲🏳️‍🌈 C#：查看示例

🌲🏳️‍🌈 Java：查看示例

🌲🏳️‍🌈 Go：查看示例

🌲🏳️‍🌈 Rust：查看示例

🌲🏳️‍🌈 C：查看示例

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 雪花算法【分布式ID問題】【劉新宇】雪花算法雪花算法雪花算法什么是雪花算法？《算法 - 雪花算法》【Mybatis工具（五）】雪花算法雪花算法(snowflake) 雪花算法基本結構雪花算法原理