python列表底層實現原理


Python 列表的數據結構是怎么樣的?

書上說的是:列表實現可以是數組和鏈表。
順序表是怎么回事?順序表一般是數組。

列表是一個線性的集合,它允許用戶在任何位置插入、刪除、訪問和替換元素。
列表實現是基於數組或基於鏈表結構的。當使用列表迭代器的時候,雙鏈表結構比單鏈表結構更快。
有序的列表是元素總是按照升序或者降序排列的元素。


實現細節
python中的列表的英文名是list,因此很容易和其它語言(C++, Java等)標准庫中常見的鏈表混淆。事實上CPython的列表根本不是列表(可能換成英文理解起來容易些:python中的list不是list)。在CPython中,列表被實現為長度可變的數組。

可參考《Python高級編程(第2版)》

從細節上看,Python中的列表是由對其它對象的引用組成的連續數組。指向這個數組的指針及其長度被保存在一個列表頭結構中。這意味着,每次添加或刪除一個元素時,由引用組成的數組需要該標大小(重新分配)。幸運的是,Python在創建這些數組時采用了指數分配,所以並不是每次操作都需要改變數組的大小。但是,也因為這個原因添加或取出元素的平攤復雜度較低。

不幸的是,在普通鏈表上“代價很小”的其它一些操作在Python中計算復雜度相對過高。

利用 list.insert(i,item) 方法在任意位置插入一個元素——復雜度O(N)
利用 list.pop(i) 或 list.remove(value) 刪除一個元素——復雜度O(N)


列表的算法效率
可以采用時間復雜度來衡量:

index() O(1)
append O(1)
pop() O(1)
pop(i) O(n)
insert(i,item) O(n)
del operator O(n)
iteration O(n)
contains(in) O(n)
get slice[x:y] O(k)
del slice O(n)
set slice O(n+k)
reverse O(n)
concatenate O(k)
sort O(nlogn)
multiply O(nk)

O括號里面的值越大代表效率越低


列表和元組
列表和元組的區別是顯然的:
列表是動態的,其大小可以該標 (重新分配);
而元組是不可變的,一旦創建就不能修改。

list和tuple在c實現上是很相似的,對於元素數量大的時候,
都是一個數組指針,指針指向相應的對象,找不到tuple比list快的理由。
但對於小對象來說,tuple會有一個對象池,所以小的、重復的使用tuple還有益處的。

為什么要有tuple,還有很多的合理性。
實際情況中的確也有不少大小固定的列表結構,例如二維地理坐標等;
另外tuple也給元素天然地賦予了只讀屬性。

認為tuple比list快的人大概是把python的tuple和list類比成C++中的數組和列表了。


相關文檔
深入 Python 列表的內部實現:http://python.jobbole.com/82549/
[python]list, tuple, dictionary, set的底層細節:https://blog.csdn.net/siyue0211/article/details/80560783
Python列表:初學者應該懂得操作和內部實現:https://mp.weixin.qq.com/s/IkFak4iYYqW7u61P7eu22g
python學習筆記 – list內部實現:https://www.jianshu.com/p/cd75475168ae
從底層理解Python的執行:https://www.csdn.net/article/2015-05-28/2824795


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM