Python從設計之初就是一門面向對象的語言,它有一個重要的概念,即一切皆對象。
Java雖然也是面向對象編程的語言,但是血統沒有Python純正。比如Java的八種基本數據類型之一int,在持久化的時候,就需要包裝成Integer類對象。但是在python中,一切皆對象。數字、字符串、元組、列表、字典、函數、方法、類、模塊等等都是對象,包括你的代碼。
對象的概念
究竟何謂對象?不同的編程語言以不同的方式定義“對象”。某些語言中,它意味着所有對象必須有屬性和方法;另一些語言中,它意味着所有的對象都可以子類化。
在Python中,定義是松散的,某些對象既沒有屬性也沒有方法,而且不是所有的對象都可以子類化。但是Python的萬物皆對象從感性上可以解釋為:Python 中的一切都可以賦值給變量或者作為參數傳遞給函數。
Python 的所有對象都有三個特性:
- 身份:每個對象都有一個唯一的身份標識自己,任何對象的身份都可以使用內建函數 id() 來得到,可以簡單的認為這個值是該對象的內存地址。
>>> a = 1
>>> id(a)
>>> 26188904 # 身份由這樣一串類似的數字表示
- 類型:對象的類型決定了對象可以保存什么類型的值,有哪些屬性和方法,可以進行哪些操作,遵循怎樣的規則。可以使用內建函數 type() 來查看對象的類型。
>>> type(a)
<type 'int'>
>>> type(type)
<type 'type'> #萬物皆對象,type 也是一種特殊的對象 type
- 值:對象所表示的數據
>>> a
1
"身份"、"類型"和"值"在所有對象創建時被賦值。如果對象支持更新操作,則它的值是可變的,否則為只讀(數字、字符串、元組等均不可變)。只要對象還存在,這三個特性就一直存在。
對象的屬性:大部分 Python 對象有屬性、值或方法,使用句點(.)標記法來訪問屬性。最常見的屬性是函數和方法,一些 Python 對象也有數據屬性,如:類、模塊、文件等
對象的創建和引用
>>> a = 3
簡單來看,上邊的代碼執行了以下操作:
- 創建了一個對象來代表數字 3
- 如果變量 a 不存在,創建一個新的變量 a
- 將變量 a 和數字 3 進行連接,即 a 成為對象 3 的一個引用,從內部來看,變量是到對象的內存空間的一個指針,尤其注意:變量總是連接到對象,而不會連接到其他變量。
從概念上可以這樣理解,對象是堆上分配的一個內存空間,用來表示對象所代表的值;變量是一個系統創建的表中的元素,擁有指向對象的引用;引用是從變量到對象的指針。
從技術上來說,每一個對象有兩個標准的頭部信息,一個類型標識符來標識類型,還有一個引用的計數器,用於決定是否需要對對象進行回收。這里還涉及到對象的一種優化方法,Python 緩存了某些不變的對象對其進行復用,而不是每次創建新的對象。
>>> a = 1
>>> b = 1
>>> id(a)
26188904
>>> id(b)
26188904 # a 和 b 都指向了同一對象
共享引用
在 Python 中變量都是指向某一對象的引用,當多個變量都引用了相同的對象,成為共享引用。
>>> a = 1
>>> b = a
>>> a = 2
>>> b
1 # 由於變量僅是對對象的一個引用,因此改變 a 並不會導致 b 的變化
但對於像列表這種可變對象來說則不同
>>> a = [1, 2, 3]
>>> b = a
>>> a[0] = 0
>>> a
[0, 2, 3] # 這里並沒有改變 a 的引用,而是改變了被引用對象的某個元素
>>> b
[0, 2, 3] # 由於被引用對象發生了變化,因此 b 對應的值也發生了改變
由於列表的這種可變性,在代碼執行某些操作時可能出現一些意外,因此需要對其進行拷貝來保持原來的列表
>>> a = [1, 2, 3]
>>> b = a[:]
>>> id(a)
140200275166560
>>> id(b)
140200275238712 # 由於 b 引用的是 a 引用對象的一個拷貝,兩個變量指向的內存空間不同
>>> a[0] = 0
>>> b
[1, 2, 3] # 改變 a 中的元素並不會引起 b 的變化
對於字典和集合等沒有分片概念的類型來說,可以使用 copy 模塊中的 copy() 方法進行拷貝
>>> import copy
>>> b = copy.copy(a)
對象相等
== 操作符用於測試兩個被引用的對象的值是否相等
is 用於比較兩個被引用的對象是否是同一個對象
>>> a = [1, 2, 3]
>>> b = a
>>> a is b
True # a 和 b 指向相同的對象
>>> a = [1, 2, 3]
>>> b = [1, 2, 3]
>>> a is b
False # a 和 b 指向不同的對象
當操作對象為一個較小的數字或較短的字符串時,又有不同:
>>> a = 7
>>> b = 7
>>> a is b
True # a 和 b 指向相同的對象
這是由於 Python 的緩存機制造成的,小的數字和字符串被緩存並復用,所以 a 和 b 指向同一個對象
對象回收機制
上邊提到對象包含一個引用的計數器,計數器記錄了當前指向該對象引用的數目,一旦對象的計數器為 0 ,即不存在對該對象的引用,則這個對象的內存空間會被回收。這就是 Python 中對象的回收機制,一個最明顯的好處即在編寫代碼過程中不需要考慮釋放內存空間。
可以通過 sys 模塊中的 getrefcount() 函數查詢一個對象計數器的值
>>> import sys
>>> sys.getrefcount(1)
718