Python標准庫uuid模塊


UUID (Universally Unique Identifier,通用唯一標識)是一個128位的用於計算機系統中以識別信息的數目,雖然生成UUID的概率不為零,但是無限接近零,因此可以忽略不記,如此一來,每個人都可以建立不與其他人沖突的UUID。


UUID格式組成

規范的文本中,UUID的十六個八位字節標識位32個十六進制(基數16)數字,顯示在由字符分割的五個組中,8-4-4-4-12總格36個字符(32個字母數字字符和4個連字符),如:

123e4567-e89b-12d3-a456-426655440000
xxxxxxxx-xxxx-Mxxx-Nxxx-xxxxxxxxxxxx

其中M代表版本,由下面的知識可知,這個UUID 可能是通過Python的 uuid.uuid1(node, clock_seq)生成

 

Python 中的uuid 模塊

在Python 2.5以后引入,接口包括:不可變對象UUID(UUID類)和函數uuid1()、uuid3()、uuid4()、uuid5(),后面四個函數用於生成“RFC 4122” 規范中指定的第1、3、4、5版UUID。具體算法如下:

UUID()

class uuid.UUID([hex[, bytes[, bytes_le[, fields[, int[, version]]]]]]) 
  該類用於從參數給定的內容中實例化UUID對象(hex, bytes, bytes_le, fields, int 必須且只能指定一個):
  hex:指定32個字符以創建UUID對象,當指定一個32個字符構成的字符串來創建一個UUID對象時,花括號、連字符和URN前綴等都是可選的;
  bytes:指定一個大端字節序的總長16字節的字節串來創建UUID對象;
  bytes_le:指定一個小端字節序的總長16字節的字節串來創建UUID對象;
  fields:指定6個整數域,共計128位來創建UUID(其中,32位作為time_low段,16位作為time_mid段,16位作為time_hi_version段,8位作為clock_seq_hi_variant段,8位作為clock_seq_low段,48位作為node段);
  int:直接指定一個長度為128個二進制位的整數用於創建UUID對象;
  version:(可選)指定UUID的版本,從1到5,一旦指定了該參數,生成的UUID將具有自己的變體(variant)和版本數,具體請參考RFC 4122

 

下面的各種方法創建相同的UUID對象

1 u = UUID('{12345678-1234-5678-1234-567812345678}')
2 u = UUID(hex = '12345678123456781234567812345678')
3 u = UUID('urn:uuid:12345678-1234-5678-1234-567812345678')
4 u = UUID(bytes='\x12\x34\x56\x78'*4)
5 u = UUID(bytes_le='\x78\x56\x34\x12\x34\x12\x78\x56' +
  '\x12\x34\x56\x78\x12\x34\x56\x78')
6 u = UUID(fields=(0x12345678, 0x1234, 0x5678, 0x12, 0x34, 0x567812345678))
7 u = UUID(int=0x12345678123456781234567812345678)

 

uuid1()

從主機ID、序列號和當前時間生成UUID。如果未給定“node”,則使用getnode() 獲取硬件地址。如果給出“時鍾序列”,則將其用作序列號;否則,將選擇隨機的14位序列號。
# 源碼參考

def uuid(node=None, clock_seq=None):
  ...
  return UUID(fields=(time_low, time_mid, time_hi_version, clock_seq_hi_variant, clock_seq_low, node), version=1)

fields 各個參數含義如下圖:

uuid3()

基於命名空間標識符(實質上是一個UUID)和一個名稱(實質上是一個字符串)的MD5哈希值生成的UUID
# 源碼參考

1 def uuid3(namespace, name):
2     """Generate a UUID from the MD5 hash of a namespace UUID and a name."""
3     from hashlib import md5
4     hash = md5(namespace.bytes + bytes(name, "utf-8")).digest()
5     return UUID(bytes=hash[:16], version=3)

 

uuid4()

基於隨機數生成的UUID
# 源碼參考

1 import os
2 def uuid4(): 3 """Generate a random UUID.""" 4 return UUID(bytes=os.urandom(16), version=4)

 

uuid5()
基於命名空間標識符(實質上是一個UUID)和一個名稱(實質上是一個字符串)的SHA-1哈希值生成的UUID
# 源碼參考

1 def uuid5(namespace, name):
2     """Generate a UUID from the SHA-1 hash of a namespace UUID and a name."""
3     from hashlib import sha1
4     hash = sha1(namespace.bytes + bytes(name, "utf-8")).digest()
5     return UUID(bytes=hash[:16], version=5)

由源碼可知,uuid1() 使用的是 UUID(fields=(...))

      uuid3()、uuid4()、uuid5() 均使用的是 UUID(bytes=...)

“RFC 4122” 推薦使用版本5(SHA1)而不是版本3(MD5)

 

uuid1() 中的getnode()

獲取硬件的地址並以48位二進制長度的整數形式返回,這里所說的硬件地址是指網絡接口的MAC 地址,如果一個機器有多個網絡接口,可能返回其中的任一個。如果獲取失敗,將按照“RFC 4122” 的規定隨機返回48位數字,並將第8位設置為1(其組播位(第一個八位位組的最低有效位)設置為1)

 

關於uuid3()和uuid5()中提到的命名空間標識符uuid模塊定義了如下的備選項:

uuid.NAMESPACE_DNS
當指定該命名空間時,參數name 是一個完全限定的(fully-qualified)域名
uuid.NAMESPACE_URL
當指定該命名空間時,參數name 是一個URL
uuid.NAMESPACE_OID
當指定該命名空間時,參數name 是一個ISO OID
uuid.NAMESPACE_X500
當指定該命名空間時,參數name 是一個DER 中的X.500 DN或文本輸出格式

這些標識符在源碼中統一指向 UUID('6ba7b810-9dad-11d1-80b4-00c04fd430c8'),因此命名空間僅僅作為標識用,定義了name 參數的格式

 

UUID實際應用

uuid1 適應用分布式計算環境,具有高度的唯一性;
uuid3 和uuid5 適合於一定范圍的名字唯一,且需要或可能重復生成UUID 的環境下;
uuid4 最簡單,但完全隨機,不可控,建議可以在DRF 生成和驗證JWT 時做用戶的SECRET_KEY 用,用來保證用戶每次登錄,異設備同時登錄,修改密碼等操作,JWT 失效問題

 

UUID 的劣勢

1.varchar(36)字符串占用空間比較大,但攜帶的信息很少,且不直觀
2.以此建立索引的時候,非常耗性能且慢
3.UUID 是無序的,但是業務系統很多時候希望生成的 是有序的,或者粗略有序


參考資料:
uuid — UUID objects according to RFC 4122 https://docs.python.org/3/library/uuid.html
Python--uuid http://www.cnblogs.com/Security-Darren/p/4252868.html
Python 使用UUID 庫生成唯一ID https://www.cnblogs.com/kaituorensheng/p/5530902.html
Universally unique identifier https://en.wikipedia.org/wiki/Universally_unique_identifier
使用UUID的劣勢 https://blog.csdn.net/woshiyexinjie/article/details/83351677


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM