最近用Pandas做一個七星彩數據分析,偶爾用到list做數據存儲。感覺list有點慢,突然心血來潮,想比較下list速度。
list對比對象只能是set,set存儲根據哈希值來排序。我以為set只是比list快100倍左右,沒想到結果是:
測試環境和條件:windows10+py3.7+pycharm2017.2,list和set都是隨機的填寫100萬條數據,搜索一千次,記錄各自的損耗時間。
代碼如下:
#測試集合和list的搜索速度,各插入100萬條數據
import time
import random
l=[random.randrange(0,1000000) for x in range(0,1000000)]
s={x for x in range(0,1000000)}
print('set size=',len(s))
#測試 list,搜索 1000次,看花費時間
tick = time.time()
for i in range(0,1000):
x = random.randrange(0,1000000)
b = x in l
print('list index of time:',time.time()-tick)
#測試 list,搜索 1000次,看花費時間
tick = time.time()
for i in range(0,1000):
x = random.randrange(0,1000000)
b = x in s
print('set index of time:',time.time()-tick)
output:
set size= 1000000
list index of time: 11.799197673797607
set index of time: 0.0019888877868652344
#測試結果,set 速度比list快 5500 倍,不比不知道,一比嚇一跳。
當list加到一千萬條,,,1000次搜索已經無法等待了,崩潰。而set的1000萬條,1000次搜索依然是0.002秒左右。