現象:先上一段代碼。
>>> import copy >>> a = [1,2,3,4,['a','b']] >>> b = a >>> c = copy.copy(a) >>> d = copy.deepcopy(a) >>> a.append(5) >>> print(a) [1, 2, 3, 4, ['a', 'b'], 5] >>> print(b) [1, 2, 3, 4, ['a', 'b'], 5] >>> print(c) [1, 2, 3, 4, ['a', 'b']] >>> print(d) [1, 2, 3, 4, ['a', 'b']] >>> a[4].append('c') >>> print(a) [1, 2, 3, 4, ['a', 'b', 'c'], 5] >>> print(b) [1, 2, 3, 4, ['a', 'b', 'c'], 5] >>> print(c) [1, 2, 3, 4, ['a', 'b', 'c']] >>> print(d) [1, 2, 3, 4, ['a', 'b']]
######內存地址########
>>> id(a)
44350024
>>> id(b)
44350024
>>> id(c)
44410440
>>> id(d)
44410760
一、概念(原理)
1、在詳細的了解python中賦值、copy和deepcopy之前,我們還是要花一點時間來了解一下python內存中變量的存儲情況。
在高級語言中,變量是對內存及其地址的抽象。對於python而言,python的一切變量都是對象,變量的存儲,采用了引用語義的方式,存儲的只是一個變量的值所在的內存地址,而不是這個變量的只本身。
2、賦值
在python中,對象的賦值就是簡單的對象引用,這點和C++不同。如下:
list_a = [1,2,3,"hello",["python","C++"]]
list_b = list_a
這種情況下,list_b和list_a是一樣的,他們指向同一片內存,list_b不過是list_a的別名,是引用。
我們可以使用 list_b is list_a 來判斷,返回true,表明他們地址相同,內容相同。也可使用id(x) for x in list_a, list_b 來查看兩個list的地址。
賦值操作(包括對象作為參數、返回值)不會開辟新的內存空間,它只是復制了新對象的引用。也就是說,除了list_b這個名字以外,沒有其它的內存開銷。
修改了list_a,就影響了list_b;同理,修改了list_b就影響了list_a。
3、淺拷貝
淺拷貝會創建新對象,其內容是原對象的引用。
淺拷貝有三種形式:切片操作,工廠函數,copy模塊中的copy函數
比如對上述list_a,
切片操作:list_b = list_a[:] 或者 list_b = [each for each in list_a]
工廠函數:list_b = list(list_a)
copy函數:list_b = copy.copy(list_a)
淺拷貝產生的list_b不再是list_a了,使用is可以發現他們不是同一個對象,使用id查看,發現它們也不指向同一片內存。但是當我們使用 id(x) for x in list_a 和 id(x) for x in list_b 時,可以看到二者包含的元素的地址是相同的。
在這種情況下,list_a和list_b是不同的對象,修改list_b理論上不會影響list_a。比如list_b.append([4,5])。
但是要注意,淺拷貝之所以稱為淺拷貝,是它僅僅只拷貝了一層,在list_a中有一個嵌套的list,如果我們修改了它,情況就不一樣了。
list_a[4].append("C")。查看list_b,你將發現list_b也發生了變化。這是因為,你修改了嵌套的list。修改外層元素,會修改它的引用,讓它們指向別的位置,修改嵌套列表中的元素,列表的地址並為發生變化,指向的都是同一個位置。
4、深拷貝
深拷貝只有一種形式,copy模塊中的deepcopy函數。
和淺拷貝對應,深拷貝拷貝了對象的所有元素,包括多層嵌套的元素。因而,它的時間和空間開銷要高。
同樣對list_a,若使用list_b = copy.deepcopy(list_a),再修改list_b將不會影響到list_a了。即使嵌套的列表具有更深的層次,也不會產生任何影響,因為深拷貝出來的對象根本就是一個全新的對象,不再與原來的對象有任何關聯。
二、關於拷貝的警告
1、對於非容器類型,如數字,字符,以及其它“原子”類型,沒有拷貝一說。產生的都是原對象的引用。
2、如果元組變量值包含原子類型對象,即使采用了深拷貝,也只能得到淺拷貝。