數據類型分為可變、不可變。可變對象表示可以原處修改該數據對象,不可變對象表示必須創建新對象來保存修改后的數據。
在基礎數據類型中:
- 數值、字符串、元組、frozenset是不可變對象
- 列表、set、dict是可變對象
對於可變對象,比如有一個列表L,查看它的id以及第一個元素的id。
>>> L = ['a', 'b', 'c']
>>> id(L)
23099392
>>> id(L[0])
57027008
這意味着在內存中有一片區域,這片區域存放的數據類型是列表(每個數據對象都有自己的類型聲明),列表包含至少3個數據內存塊,分別存放了3個字符串類型的數據(實際上是存放了這3個字符對象的地址)。如下圖所示:
可變對象(不僅僅是這里的序列、列表)意味着修改該數據對象,不會在內存中新創建另一個內存空間來存放新數據對象。例如,修改這個列表中的第一個元素為"aa"。
>>> L[0]="aa"
>>> L
['aa', 'b', 'c']
>>> id(L)
23099392
發現列表的id並沒有改變,也就是列表的內存地址仍然是那一塊。這表示列表是可變序列。
但是,如果查看第一個元素的id,會發現已經改變了:
>>> id(L[0])
61863232
這說明,雖然列表的內存地址沒有改變,但是列表中的第一個元素的地址已經改變了。實際上,上面修改列表元素后的列表結構變成如下圖所示:
也就是說,修改列表中的第一個元素過程中,創建了一個新的內存塊來存放新的字符串,原始的那個字符串"a"因為沒有被引用了,它將等待垃圾回收器的回收。不管如何,列表的地址一直沒變。
為什么修改列表中的元素需要創建新的內存塊?這是因為這個元素是字符串,而字符串是不可變對象。
不可變對象意味着,不能在原始內存地址塊中修改數據,必須新創建一個地址塊來保存修改后的數據對象。正如上面修改字符串"a"為"aa"的結果。
假如列表L中的第一個元素仍然是一個嵌套在L中的列表,因為列表是可變對象,現在修改L的第一個元素,這第一個元素的地址不會改變。
>>> L = [['a'], 'b', 'c']
>>> id(L[0])
23099392
>>> L[0][0] = "aa"
>>> id(L[0])
23099392
這里改變的只有內嵌的列表中第一個元素的地址。
雖然可變對象可以原處修改數據,不會創建新對象,但並不意味着操作可變對象總是不會創建新對象,這取決於對可變對象做什么操作,比如分片操作一定會創建新對象。