許多Python初學者都會問:我應該學習哪個版本的Python。對於這個問題,我的回答通常是“先選擇一個最適合你的Python教程,教程中使用哪個版本的Python,你就用那個版本。等學得差不多了,再來研究不同版本之間的差別”。
但如果想要用Python開發一個新項目,那么該如何選擇Python版本呢?我可以負責任的說,大部分Python庫都同時支持Python 2.7.x和3.x版本的,所以不論選擇哪個版本都是可以的。但為了在使用Python時避開某些版本中一些常見的陷阱,或需要移植某個Python項目時,依然有必要了解一下Python兩個常見版本之間的主要區別。
目錄
- 使用__future__模塊
- print函數
- 整數除法
- Unicode
- xrange
- 觸發異常
- 處理異常
- next()函數和.next()方法
- For循環變量與全局命名空間泄漏
- 比較無序類型
- 使用input()解析輸入內容
- 返回可迭代對象,而不是列表
- 更多關於Python 2和Python 3的文章
__future__模塊
[回到目錄]
Python 3.x引入了一些與Python 2不兼容的關鍵字和特性,在Python 2中,可以通過內置的__future__模塊導入這些新內容。如果你希望在Python 2環境下寫的代碼也可以在Python 3.x中運行,那么建議使用__future__模塊。例如,如果希望在Python 2中擁有Python 3.x的整數除法行為,可以通過下面的語句導入相應的模塊。
Python
1 |
from __future__ import division |
下表列出了__future__中其他可導入的特性:
特性 |
可選版本 |
強制版本 |
效果 |
nested_scopes |
2.1.0b1 |
2.2 |
PEP 227: |
generators |
2.2.0a1 |
2.3 |
PEP 255: |
division |
2.2.0a2 |
3.0 |
PEP 238: |
absolute_import |
2.5.0a1 |
3.0 |
PEP 328: |
with_statement |
2.5.0a1 |
2.6 |
PEP 343: |
print_function |
2.6.0a2 |
3.0 |
PEP 3105: |
unicode_literals |
2.6.0a2 |
3.0 |
PEP 3112: |
(來源: https://docs.python.org/2/library/future.html)
示例:
Python
1 |
from platform import python_version |
print函數
[回到目錄]
雖然print語法是Python 3中一個很小的改動,且應該已經廣為人知,但依然值得提一下:Python 2中的print語句被Python 3中的print()函數取代,這意味着在Python 3中必須用括號將需要輸出的對象括起來。
在Python 2中使用額外的括號也是可以的。但反過來在Python 3中想以Python2的形式不帶括號調用print函數時,會觸發SyntaxError。
Python 2
Python
1 2 3 4 |
print 'Python', python_version() print 'Hello, World!' print('Hello, World!') print "text", ; print 'print more text on the same line' |
Python
1 2 3 4 |
Python 2.7.6 Hello, World! Hello, World! text print more text on the same line |
Python 3
Python
1 2 3 4 5 |
print('Python', python_version()) print('Hello, World!')
print("some text,", end="") print(' print more text on the same line') |
Python
1 2 3 |
Python 3.4.1 Hello, World! some text, print more text on the same line |
Python
1 |
print 'Hello, World!' |
Python
1 2 3 4 |
File "<ipython-input-3-139a7c5835bd>", line 1 print 'Hello, World!' ^ SyntaxError: invalid syntax |
注意:
在Python中,帶不帶括號輸出”Hello World”都很正常。但如果在圓括號中同時輸出多個對象時,就會創建一個元組,這是因為在Python 2中,print是一個語句,而不是函數調用。
Python
1 2 3 |
print 'Python', python_version() print('a', 'b') print 'a', 'b' |
Python
1 2 3 |
Python 2.7.7 ('a', 'b') a b |
整數除法
[回到目錄]
由於人們常常會忽視Python 3在整數除法上的改動(寫錯了也不會觸發Syntax Error),所以在移植代碼或在Python 2中執行Python 3的代碼時,需要特別注意這個改動。
所以,我還是會在Python 3的腳本中嘗試用float(3)/2或 3/2.0代替3/2,以此來避免代碼在Python 2環境下可能導致的錯誤(或與之相反,在Python 2腳本中用from __future__ import division來使用Python 3的除法)。
Python 2
Python
1 2 3 4 5 |
print 'Python', python_version() print '3 / 2 =', 3 / 2 print '3 // 2 =', 3 // 2 print '3 / 2.0 =', 3 / 2.0 print '3 // 2.0 =', 3 // 2.0 |
Python
1 2 3 4 5 |
Python 2.7.6 3 / 2 = 1 3 // 2 = 1 3 / 2.0 = 1.5 3 // 2.0 = 1.0 |
Python 3
Python
1 2 3 4 5 |
print('Python', python_version()) print('3 / 2 =', 3 / 2) print('3 // 2 =', 3 // 2) print('3 / 2.0 =', 3 / 2.0) print('3 // 2.0 =', 3 // 2.0) |
Python
1 2 3 4 5 |
Python 3.4.1 3 / 2 = 1.5 3 // 2 = 1 3 / 2.0 = 1.5 3 // 2.0 = 1.0 |
Unicode
[回到目錄]
Python 2有基於ASCII的str()類型,其可通過單獨的unicode()函數轉成unicode類型,但沒有byte類型。
而在Python 3中,終於有了Unicode(utf-8)字符串,以及兩個字節類:bytes和bytearrays。
Python 2
Python
1 |
print 'Python', python_version() |
Python
1 |
Python 2.7.6 |
Python
1 |
print type(unicode('this is like a python3 str type')) |
Python
1 |
<type 'unicode'> |
Python
1 |
print type(b'byte type does not exist') |
Python
1 |
<type 'str'> |
Python
1 |
print 'they are really' + b' the same' |
Python
1 |
they are really the same |
Python
1 |
print type(bytearray(b'bytearray oddly does exist though')) |
Python
1 |
<type 'bytearray'> |
Python 3
Python
1 2 |
print('Python', python_version()) print('strings are now utf-8 u03BCnicou0394é!') |
Python
1 2 |
Python 3.4.1 strings are now utf-8 μnicoΔé! |
Python
1 2 |
print('Python', python_version(), end="") print(' has', type(b' bytes for storing data')) |
Python
1 |
Python 3.4.1 has <class 'bytes'> |
Python
1 2 |
print('and Python', python_version(), end="") print(' also has', type(bytearray(b'bytearrays'))) |
Python
1 |
and Python 3.4.1 also has <class 'bytearray'> |
Python
1 |
'note that we cannot add a string' + b'bytes for data' |
Python
1 2 3 4 5 6 |
--------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-13-d3e8942ccf81> in <module>() ----> 1 'note that we cannot add a string' + b'bytes for data'
TypeError: Can't convert 'bytes' object to str implicitly |
xrange
[回到目錄]
在Python 2.x中,經常會用xrange()創建一個可迭代對象,通常出現在“for循環”或“列表/集合/字典推導式”中。
這種行為與生成器非常相似(如”惰性求值“),但這里的xrange-iterable無盡的,意味着可能在這個xrange上無限迭代。
由於xrange的“惰性求知“特性,如果只需迭代一次(如for循環中),range()通常比xrange()快一些。不過不建議在多次迭代中使用range(),因為range()每次都會在內存中重新生成一個列表。
在Python 3中,range()的實現方式與xrange()函數相同,所以就不存在專用的xrange()(在Python 3中使用xrange()會觸發NameError)。
Python
1 2 3 4 5 6 7 8 9 10 |
import timeit
n = 10000 def test_range(n): return for i in range(n): pass
def test_xrange(n): for i in xrange(n): pass |
Python 2
Python
1 2 3 4 5 6 7 8 |
print 'Python', python_version()
print 'ntiming range()' %timeit test_range(n)
print 'nntiming xrange()' %timeit test_xrange(n) |
Python
1 2 3 4 5 6 7 |
Python 2.7.6
timing range() 1000 loops, best of 3: 433 µs per loop
timing xrange() 1000 loops, best of 3: 350 µs per loop |
Python 3
Python
1 2 3 4 |
print('Python', python_version())
print('ntiming range()') %timeit test_range(n) |
Python
1 2 3 4 |
Python 3.4.1
timing range() 1000 loops, best of 3: 520 µs per loop |
Python
1 |
print(xrange(10)) |
Python
1 2 3 4 5 6 |
--------------------------------------------------------------------------- NameError Traceback (most recent call last) in () ----> 1 print(xrange(10))
NameError: name 'xrange' is not defined |
Python 3中的range對象中的__contains__方法
另一個值得一提的是,在Python 3.x中,range有了一個新的__contains__方法。__contains__方法可以有效的加快Python 3.x中整數和布爾型的“查找”速度。
Python
1 2 3 4 5 6 7 8 9 10 11 12 13 |
x = 10000000 def val_in_range(x, val): return val in range(x)
def val_in_xrange(x, val): return val in xrange(x)
print('Python', python_version()) assert(val_in_range(x, x/2) == True) assert(val_in_range(x, x//2) == True) %timeit val_in_range(x, x/2)
%timeit val_in_range(x, x//2) |
Python
1 2 3 |
Python 3.4.1 1 loops, best of 3: 742 ms per loop 1000000 loops, best of 3: 1.19 µs per loop |
根據上面的timeit的結果,查找整數比查找浮點數要快大約6萬倍。但由於Python 2.x中的range或xrange沒有__contains__方法,所以在Python 2中的整數和浮點數的查找速度差別不大。
Python
1 2 3 4 5 6 7 8 9 10 11 12 13 |
print 'Python', python_version()
assert(val_in_xrange(x, x/2.0) == True) assert(val_in_xrange(x, x/2) == True) assert(val_in_range(x, x/2) == True) assert(val_in_range(x, x//2) == True) %timeit val_in_xrange(x, x/2.0)
%timeit val_in_xrange(x, x/2)
%timeit val_in_range(x, x/2.0)
%timeit val_in_range(x, x/2) |
Python
1 2 3 4 5 |
Python 2.7.7 1 loops, best of 3: 285 ms per loop 1 loops, best of 3: 179 ms per loop 1 loops, best of 3: 658 ms per loop 1 loops, best of 3: 556 ms per loop |
下面的代碼證明了Python 2.x中沒有__contain__方法:
Python
1 2 |
print('Python', python_version()) range.__contains__ |
Python
1 2 |
Python 3.4.1 <slot wrapper '__contains__' of 'range' objects |
Python
1 2 |
print('Python', python_version()) range.__contains__ |
Python
1 2 3 4 5 6 7 8 |
Python 2.7.7 --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-7-05327350dafb> in <module>() 1 print 'Python', python_version() ----> 2 range.__contains__
AttributeError: 'builtin_function_or_method' object has no attribute '__contains__' |
Python
1 2 |
print('Python', python_version()) xrange.__contains__ |
Python
1 2 3 4 5 6 7 8 9 |
Python 2.7.7
--------------------------------------------------------------------------- AttributeError Traceback (most recent call last) in () 1 print 'Python', python_version() ----> 2 xrange.__contains__
AttributeError: type object 'xrange' has no attribute '__contains__' |
關於Python 2中xrange()與Python 3中range()之間的速度差異的一點說明:
有讀者指出了Python 3中的range()和Python 2中xrange()執行速度有差異。由於這兩者的實現方式相同,因此理論上執行速度應該也是相同的。這里的速度差別僅僅是因為Python 3的總體速度就比Python 2慢。
Python
1 2 3 4 5 |
def test_while(): i = 0 while i < 20000: i += 1 return |
Python
1 2 |
print('Python', python_version()) %timeit test_while() |
Python
1 2 3 4 |
Python 3.4.1 %timeit test_while()
100 loops, best of 3: 2.68 ms per loop |
Python
1 2 |
print 'Python', python_version() %timeit test_while() |
Python
1 2 |
Python 2.7.6 1000 loops, best of 3: 1.72 ms per loop |
觸發異常
[回到目錄]
Python 2支持新舊兩種異常觸發語法,而Python 3只接受帶括號的的語法(不然會觸發SyntaxError):
Python 2
Python
1 |
print 'Python', python_version() |
Python
1 |
Python 2.7.6 |
Python
1 |
raise IOError, "file error" |
Python
1 2 3 4 5 6 |
--------------------------------------------------------------------------- IOError Traceback (most recent call last) <ipython-input-8-25f049caebb0> in <module>() ----> 1 raise IOError, "file error"
IOError: file error |
Python
1 |
raise IOError("file error") |
Python
1 2 3 4 5 6 |
--------------------------------------------------------------------------- IOError Traceback (most recent call last) <ipython-input-9-6f1c43f525b2> in <module>() ----> 1 raise IOError("file error")
IOError: file error |
Python 3
Python
1 |
print('Python', python_version()) |
Python
1 |
Python 3.4.1 |
Python
1 |
raise IOError, "file error" |
Python
1 2 3 4 5 |
File "<ipython-input-10-25f049caebb0>", line 1 raise IOError, "file error" ^ SyntaxError: invalid syntax The proper way to raise an exception in Python 3: |
Python
1 2 |
print('Python', python_version()) raise IOError("file error") |
Python
1 2 3 4 5 6 7 8 9 |
Python 3.4.1
--------------------------------------------------------------------------- OSError Traceback (most recent call last) <ipython-input-11-c350544d15da> in <module>() 1 print('Python', python_version()) ----> 2 raise IOError("file error")
OSError: file error |
異常處理
[回到目錄]
Python 3中的異常處理也發生了一點變化。在Python 3中必須使用“as”關鍵字。
Python 2
Python
1 2 3 4 5 |
print 'Python', python_version() try: let_us_cause_a_NameError except NameError, err: print err, '--> our error message' |
Python
1 2 |
Python 2.7.6 name 'let_us_cause_a_NameError' is not defined --> our error message |
Python 3
Python
1 2 3 4 5 |
print('Python', python_version()) try: let_us_cause_a_NameError except NameError as err: print(err, '--> our error message') |
Python
1 2 |
Python 3.4.1 name 'let_us_cause_a_NameError' is not defined --> our error message |
next()函數和.next()方法
[回到目錄]
由於會經常用到next()(.next())函數(方法),所以還要提到另一個語法改動(實現方面也做了改動):在Python 2.7.5中,函數形式和方法形式都可以使用,而在Python 3中,只能使用next()函數(試圖調用.next()方法會觸發AttributeError)。
Python 2
Python
1 2 3 4 |
print 'Python', python_version() my_generator = (letter for letter in 'abcdefg') next(my_generator) my_generator.next() |
Python
1 2 |
Python 2.7.6 'b' |
Python 3
Python
1 2 3 |
print('Python', python_version()) my_generator = (letter for letter in 'abcdefg') next(my_generator) |
Python
1 2 |
Python 3.4.1 'a' |
Python
1 |
my_generator.next() |
Python
1 2 3 4 5 6 |
--------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-14-125f388bb61b> in <module>() ----> 1 my_generator.next()
AttributeError: 'generator' object has no attribute 'next' |
For循環變量與全局命名空間泄漏
[回到目錄]
好消息是:在Python 3.x中,for循環中的變量不再會泄漏到全局命名空間中了!
這是Python 3.x中做的一個改動,在“What’s New In Python 3.0”中有如下描述:
“列表推導不再支持[… for var in item1, item2, …]這樣的語法,使用[… for var in (item1, item2, …)]代替。還要注意列表推導有不同的語義:現在列表推導更接近list()構造器中的生成器表達式這樣的語法糖,特別要注意的是,循環控制變量不會再泄漏到循環周圍的空間中了。”
Python 2
Python
1 2 3 4 5 6 7 8 |
print 'Python', python_version()
i = 1 print 'before: i =', i
print 'comprehension: ', [i for i in range(5)]
print 'after: i =', i |
Python
1 2 3 4 |
Python 2.7.6 before: i = 1 comprehension: [0, 1, 2, 3, 4] after: i = 4 |
Python 3
Python
1 2 3 4 5 6 7 8 |
print('Python', python_version())
i = 1 print('before: i =', i)
print('comprehension:', [i for i in range(5)])
print('after: i =', i) |
Python
1 2 3 4 |
Python 3.4.1 before: i = 1 comprehension: [0, 1, 2, 3, 4] after: i = 1 |
比較無序類型
[回到目錄]
Python 3中另一個優秀的改動是,如果我們試圖比較無序類型,會觸發一個TypeError。
Python 2
Python
1 2 3 4 |
print 'Python', python_version() print "[1, 2] > 'foo' = ", [1, 2] > 'foo' print "(1, 2) > 'foo' = ", (1, 2) > 'foo' print "[1, 2] > (1, 2) = ", [1, 2] > (1, 2) |
Python
1 2 3 4 |
Python 2.7.6 [1, 2] > 'foo' = False (1, 2) > 'foo' = True [1, 2] > (1, 2) = False |
Python 3
Python
1 2 3 4 |
print('Python', python_version()) print("[1, 2] > 'foo' = ", [1, 2] > 'foo') print("(1, 2) > 'foo' = ", (1, 2) > 'foo') print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2)) |
Python
1 2 3 4 5 6 7 8 9 |
Python 3.4.1 --------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-16-a9031729f4a0> in <module>() 1 print('Python', python_version()) ----> 2 print("[1, 2] > 'foo' = ", [1, 2] > 'foo') 3 print("(1, 2) > 'foo' = ", (1, 2) > 'foo') 4 print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2)) TypeError: unorderable types: list() > str() |
通過input()解析用戶的輸入
[回到目錄]
幸運的是,Python 3改進了input()函數,這樣該函數就會總是將用戶的輸入存儲為str對象。在Python 2中,為了避免讀取非字符串類型會發生的一些危險行為,不得不使用raw_input()代替input()。
Python 2
Python
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
Python 2.7.6 [GCC 4.0.1 (Apple Inc. build 5493)] on darwin Type "help", "copyright", "credits" or "license" for more information.
>>> my_input = input('enter a number: ')
enter a number: 123
>>> type(my_input) <type 'int'>
>>> my_input = raw_input('enter a number: ')
enter a number: 123
>>> type(my_input) <type 'str'> |
Python 3
Python
1 2 3 4 5 6 7 8 |
Python 3.4.1 [GCC 4.2.1 (Apple Inc. build 5577)] on darwin Type "help", "copyright", "credits" or "license" for more information.
>>> my_input = input('enter a number: ') enter a number: 123 >>> type(my_input) <class 'str'> |
返回可迭代對象,而不是列表
[回到目錄]
在xrange一節中可以看到,某些函數和方法在Python中返回的是可迭代對象,而不像在Python 2中返回列表。
由於通常對這些對象只遍歷一次,所以這種方式會節省很多內存。然而,如果通過生成器來多次迭代這些對象,效率就不高了。
此時我們的確需要列表對象,可以通過list()函數簡單的將可迭代對象轉成列表。
Python 2
Python
1 2 3 4 |
print 'Python', python_version()
print range(3) print type(range(3)) |
Python
1 2 3 |
Python 2.7.6 [0, 1, 2] <type 'list'> |
Python 3
Python
1 2 3 4 |
print('Python', python_version()) print(range(3)) print(type(range(3))) print(list(range(3))) |
Python
1 2 3 4 |
Python 3.4.1 range(0, 3) <class 'range'> [0, 1, 2] |
下面列出了Python 3中其他不再返回列表的常用函數和方法:
- zip()
- map()
- filter()
- 字典的.key()方法
- 字典的.value()方法
- 字典的.item()方法
更多關於Python 2和Python 3的文章
[回到目錄]
下面列出了其他一些可以進一步了解Python 2和Python 3的優秀文章,
//遷移到 Python 3
- Should I use Python 2 or Python 3 for my development activity?
- What’s New In Python 3.0
- Porting to Python 3
- Porting Python 2 Code to Python 3
- How keep Python 3 moving forward
// 對Python 3的褒與貶
- 10 awesome features of Python that you can’t use because you refuse to upgrade to Python 3
- 關於你不想知道的所有Python3 unicode特性
- Python 3 正在毀滅 Python
- Python 3 能振興 Python
- Python 3 is fine