本文是本人學完Python后的一遍回顧,加深理解而已,Python大神請過~
學習Python的這幾天來,覺得Python還是比較簡單,容易上手的,就基本語法而言,但是有些高級特性掌握起來還是有些難度,需要時間去消化。Python給我最大的印象就是簡潔,這也正是我為什么不太喜歡Java的原因之一。
一、Python簡介
Python是一種用來編寫應用程序的高級程序設計語言,TIOBE程序語言排行榜2015年12月的排名如下:
Python實現強勢逆襲,而且我相信,隨着時間的推移,國內Python語言未來前景也是一片向好。
Python的特點是優雅簡單,易學易用(雖然我感覺還是有一些概念不容易理解),Python的哲學是盡量用最少的,最簡單易懂的代碼實現需要的功能。Python適宜於開發網絡應用,腳本寫作,日常簡單小工具等等。Python的缺點是效率較低,但是在大量的場合效率卻不是那么重要或者說Python不是其性能瓶頸,所以不要太在意。其次是2.x-3.x的過渡使得許多3.x還缺少很多2.x下的模塊,不過也在完善中。其次就是源代碼無法加密,發布Python程序其實就是發布源代碼。
二、基礎語法要點
1.如果一個字符串中有許多需要轉義的字符,而又不想寫那么多'\',那么可以用 r'...' 表示 '...'內的內容不轉義。
2.Python可用'''...'''來表示多行內容,如:
>>> print('''line1
line2
line3''')
line1
line2
line3
3.Python的邏輯運算and, or, not 分別對應C語言中的&&, ||, !.
4.Python的整數與浮點數大小都沒有范圍。
5.Python中除法有兩種: '/'除出來必是浮點數, '//'除出來是整數,即地板除。
6.Python中一切皆引用。每個對象都有一個引用計數器(內部跟蹤變量)進行跟蹤,引用計數值表示該對象有多少個引用,當初次產生賦給變量時,引用計數為1,其后沒進行下列行為中的任意一種都會增加引用計數:
賦值: a = b 用作函數參數傳遞: func(a) 成為容器對象的一個元素: lis = [1,2,a]
以下任意一種行為都會減少引用計數:
del銷毀: del a 變量另賦給其他對象:a = False 對象從容器中刪除: lis.remove(a) 身在的容器被銷毀: del lis
7.深拷貝與淺拷貝的概念與對比,有點復雜,看這篇文章
8.list,tuple和dict,set
list: 為列表,是一個有序集合,類似於數組但又比數組功能強大,可以隨時append,pop元素,下標從0開始,且下標為加n模n制,即lis[-1] = lis[len-1],下標范圍[-len,len-1].
tuple:為元組,類似於list,但list為可變類型,而tuple不可變,即沒有append,pop等函數。一個建議是為了安全起見,能用tuple代替list盡量用tuple。如果tuple只有一個元素,要寫成如(1,)以避免歧義。
dict:字典類型,存放key-value鍵值對,可以根據key迅速地找出value,當然,key必須是不可變類型,如下是錯誤的:
>>> dic = {[1,2]:'value'}
Traceback (most recent call last):
File "<pyshell#10>", line 1, in <module>
dic = {[1,2]:'value'}
TypeError: unhashable type: 'list'
list與dict的優劣對比:
dict: 1.插入,查找速度快,跟key的數目無關 2.需占用大量內存,內存浪費嚴重 list: 1.插入,查找速度慢,O(n)的復雜度,隨元素個數增加而增加 2.占用內存小
dict內部存放的順序和key放入的順序是沒有關系的
set:set與dict類似,相當於只有key沒有value的dict,每個key不同,set間有 &, | 等操作對應集合的交,並操作。
三、函數
1.函數是對象,函數名即是指向對應函數對象的引用,所以可以將函數名賦給一個變量,相當於給函數起一個‘別名’。
>>> mmm = max >>> mmm(1,2,3) 3
2.Python函數可以返回”多個值“,之所以打引號,是因為實際上返回的多個值拼成了一個元組,返回這個元組。
3.定義默認參數需要牢記:默認參數必須指向不變對象。否則第一次調用和第二次調用結果會不一樣,因為可變的默認參數調用后改變了。
4.可變參數:傳入的參數個數是可變的,可以是0個或多個。可變參數會將你傳入的參數自動組裝為一個tuple。在你傳入的list或tuple名字前加一個 * 即說明傳入的是可變參數。習慣寫法為*args。
5.關鍵字參數:傳入0個或多個含參數名的參數,這些參數被自動組裝成一個dict。習慣寫法**kw,如**a表示把a中所有的鍵值對以關鍵字參數的形式傳入kw,獲得一個dict,這個dict是a的一份拷貝,對kw改動不會傳遞到a
6.命名關鍵字在函數定義中跟在一個*分割符后,如
def func(a,b,*,c,d):
pass
c,d為命名關鍵字參數,可以限制調用者可以傳入的參數名,同時可以提供默認值。
7.參數定義順序:必選參數,默認參數,可變參數/命名關鍵字參數,關鍵字參數。
8.切片操作格式為lis[首下標:尾下標:間隔],如果都不填,即lis[::]則代表整個容器lis
9.用圓括號()括起來一個列表生成式創建一個生成器generator,generator保存生成算法,我們可以用next(g)取得生成器g的下一個返回值。生成器的好處就是我們不需要提前生成所有列表元素,而是需要時再生成,這在某些情況下可以節省許多內存。算法也可以不是列表生成式而是自定義函數,只需在函數定義中包含yield關鍵字。
10.map()和reduce(): 二者都是高階函數。map()接收兩個參數,一個是函數,一個是Iterable序列,map將傳入的函數依次作用在序列每一個元素上,並把結果作為新的Iterator返回。reduce()類似累積計算版的map(),把一個函數作用在一個序列上,每次接收兩個參數,將結果繼續與序列的下一個元素做累積計算。
利用map和reduce編寫一個str2float函數,如把字符串'123.456'轉換成浮點數123.456:
from functools import reduce
def str2float(s):
def f1(x,y):
return x*10 + y
def char2num(s):
return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
def f2(x,y):
return x*0.1 + y
a,b = s.split('.')
print('a=',a)
print('b=',b)
return reduce(f1, map(char2num,a)) + 0.1*reduce(f2, map(char2num,b[::-1]))
print('str2float(\'123.456\') =', str2float('123.456'))
11.fliter()函數過濾序列,類似於map()作用於每一元素,根據返回值是True或者False決定舍棄還是保留該元素。函數返回一個Iterator。
12.sorted()函數可實現排序,類似於C++庫中的sort()函數,但是比其更加簡潔,語法為sorted(lis,key=func,reverse=T/F)
key函數可實現自定義的排序規則,reverse表示升序還是降序。
13.一個函數可以返回一個函數,但是返回時該函數並未執行,所以返回函數中不要引用任何可能發生變化的變量,否則會出現邏輯錯誤。
14.裝飾器(decorator): 當需要增強函數的功能卻不希望修改函數本身,那么可以采用裝飾器這種運行時動態增加功能的方式,增加的功能卸載裝飾器函數中。如在執行前后打印'begin call'和'end call',可以這樣做:
import functools
def log(func):
@functools.wraps(func) #為了校正函數簽名,最好寫上
def wrapper(*args,**kw):
print('begin call')
f = func(*args,**kw)
print('end call')
return f
return wrapper
@log
def hah():
print('hahahaha')
hah()
begin call hahahaha end call
15.偏函數: functools.partial(),作用是將一個函數的某些參數固定住,作為新函數的參數,即固定住該參數,返回一個新函數,使調用更簡單。
四、面向對象編程
1.Python實例變量可以自由地綁定任何屬性
2.為了不讓內部屬性不被外部訪問,在屬性的名稱前加上兩個下划線__,這樣就變成了一個私有變量(private),注意,不能直接訪問不代表一定不能訪問,事實上,加雙下划線后Python就會將其改名為‘_class名__name’,所以還是可以這樣來訪問這個‘私有’變量。
3.對於靜態語言,如果要求傳入一個class類型的對象,那么傳入的對象必須是class類型或者其子類,否則將無法調用class中的方法,而Python這樣的動態語言有‘鴨子類型’一說,即不一定要傳入class類型或其子類,而只要保證傳入的對象中有要使用的方法即可。
4.如果想要限制實例可以綁定的屬性,那么在定義class時定義一個__slots__變量即可,例如:
class Student(object):
__slots__ = (‘name’,’age’)
注意,__slots__限制的屬性對當前類實例起完全限制作用,且與子類共同定義其__slots__,也就是說子類可以定義自己的__slots__,子類實例允許定義的屬性就是自身的__slots__加上父類的__slots__,即並集。
5.@ property裝飾器可以使一個getter方法變成屬性,如果方法名為me,那么@me.setter裝飾器則可使一個setter方法變成屬性。這樣可以使代碼更簡短,同時可對參數進行必要的檢查。
6.通過多重繼承,可使子類擁有多個父類的所有功能。
7.在類中__call__方法可使實例對象像函數那樣直接調用,作用即是該方法定義的過程。
8.ORM(Object Relational Mapping 對象關系映射),就是把關系數據庫的一行映射為一個對象,也就是一個類對應一個表。ORM的實現需要通過metaclass元類修改類的定義。元類可以改變類創建時的行為。
五、調試
1.Python調試方法:
(1)直接打印
(2)斷言
(3)pdb
(4)IDE
六、IO編程
1.序列化: 把變量從內存中變成可存儲或傳輸的過程稱之為序列化。Python用pickle模塊實現序列化。序列化之后,就可以把序列化后的內容存儲到磁盤上或者通過網絡進行傳輸。pickle.dumps()將對象序列化成一個bytes,而pickle.loads()可以根據bytes反序列化出對象。
2.pickle雖好,但是它專為Python而生,所以要在不同語言間傳遞對象,最好還是xml或者json,而json表示格式是一個字符串,更易讀取,且比xml快,所以更加適宜於對象序列化。Python內置了json模塊,相應方法仍然是dumps()和loads()。
3.但是在默認情況下,有些對象是無法序列化的,所以我們有時還需要定制轉換方法,告訴json該如何將某類對象轉換成可序列為json格式的{}對象。如下即是一個轉換方法:
def mantodict(std):
return {
'name': std.name,
'age': std.age,
'id': std.id
}
七、進程與線程
1.Python用mutiprocessing模塊來實現多進程。
2.如果要大量創建子進程,可以使用進程池:
from multiprocessing import Pool
示例如下:
....
p = Pool(4)
for i in range(5):
p.apply_async(long_time_task, args=(i,))
print('Waiting for all subprocesses done...')
p.close()
p.join()
print('All subprocesses done.')
要使用進程池需新建Pool對象,對Pool對象調用join()使等待池中所有子進程運行完畢,調用join()方法之前必須調用close(),且此后無法再新加子進程。
3.使用subprocess模塊可以方便的啟動並管理一個子進程,控制其輸入輸出。
4.進程間通信使用Queue,Pipes實現。
5.threading模塊管理線程。threading.lock()創建線程鎖,防止同時訪問互斥資源造成的錯誤,示例如下:
lock = threading.Lock() ... lock.acquire() ... change(mutex) ... lock.release()
6.ThreadLocal可以解決參數在一個線程中各個函數之間互相傳遞的問題。
7.managers模塊實現分布式進程。
八、正則表達式與常用內建模塊
1.re模塊進行正則表達式編譯和匹配,如果該表達式需要匹配很多次,那么最好進行編譯從而大大節省時間。
正則表達式匹配郵箱例子:
import re
hah = re.compile('[0-9a-zA-Z]+[\.[0-9a-zA-Z]+]*\@[0-9a-zA-Z]+\.[a-z]{2,3}')
print(hah.match('someone@gmail.com').group())
print(hah.match('bill.gates@microsoft.com').group())
i = 1
while i < 10:
r = input('請輸入郵箱:')
print(hah.match(r).group())
i = i+1
2.datetime模塊進行日期和時間的處理,每一個時間對應一個timestamp,我們把1970年1月1日 00:00:00 UTC+00:00時區的時刻稱為epoch time,記為0(1970年以前的時間timestamp為負數),當前時間就是相對於epoch time的秒數,稱為timestamp。字符串和datetime也可以相互轉換,采用strptime()方法,字符串轉換為datetime時需要設定一個識別格式,其中
%Y-%m-%d %H:%M:%S
分別表示年-月-日 時-分-秒。
從datetime得出月份,星期等字符串用strftime()方法,其中:
%a, %b %d %H:%M
分別表示星期, 月份 日期 時:分。
示例:
from datetime import datetime
r = '2015-11-23 12:01'
dt = datetime.strptime(r, '%Y-%m-%d %H:%M')
print(dt)
week = dt.strftime('%a %b %d, %H:%M')
print(week)
2015-11-23 12:01:00
Mon Nov 23, 12:01
3.collections是Python內建的一個集合模塊,提供了許多有用的集合類。
4.Base64是一種任意二進制到文本字符串的編碼方法,常用於在URL、Cookie、網頁中傳輸少量二進制數據。
5.struct模塊用來解決bytes和其他二進制數據類型的轉換。
6.Python的hashlib提供了常見的哈希算法,如MD5,SHA1等等。hashlib實現簡單登錄:
import hashlib
db = {
'michael': 'e10adc3949ba59abbe56e057f20f883e',
'bob': '878ef96e86145580c38c87f0410ad153',
'alice': '99b1c2188db85afee403b1536010c2c9'
}
def get_md5(ostr):
md5 = hashlib.md5()
md5.update(ostr.encode())
return md5.hexdigest()
def login(user, password):
r = get_md5(password)
for name in db:
if db[name] == r:
return True
return False
print(login('bob','abc999'))
True
7.Python的內建模塊itertools提供了非常有用的用於操作迭代對象的函數。
8.urllib提供了一系列用於操作URL的功能。如GET,POST...
9.PIL(Python Imaging Library Python圖像庫)是一個強大的圖像處理標准庫,功能強大卻又簡單易用。現在的名字叫做Pillow。可以如下安裝Pillow:
pip3 install pillow
從下面生成數字驗證碼的程序可以窺其一斑:
from PIL import Image, ImageDraw, ImageFont, ImageFilter import random # 隨機字母: def rndChar(): return chr(random.randint(48, 57)) # 隨機顏色1: def rndColor(): return (random.randint(64, 255), random.randint(64, 255), random.randint(64, 255)) # 隨機顏色2: def rndColor2(): return (random.randint(32, 127), random.randint(32, 127), random.randint(32, 127)) # 240 x 60: width = 60 * 4 height = 60 image = Image.new('RGB', (width, height), (255, 255, 255)) # 創建Font對象: font = ImageFont.truetype('ariblk.ttf', 40) # 創建Draw對象: draw = ImageDraw.Draw(image) # 填充每個像素: for x in range(width): for y in range(height): draw.point((x, y), fill=rndColor()) # 輸出文字: for t in range(4): draw.text((60 * t + 10, 10), rndChar(), font=font, fill=rndColor2()) # 模糊: image = image.filter(ImageFilter.BLUR) image.save('code.jpg', 'jpeg')
效果:

九、網絡編程和電子郵件
1.網絡編程主要是TCP和UDP的編程,示例見【Python網絡編程】利用Python進行TCP、UDP套接字編程
2.SMTP是發送郵件的協議,Python內置對SMTP的支持,可以發送純文本郵件、HTML郵件以及帶附件的郵件。Python對SMTP支持有smtplib和email兩個模塊,email負責構造郵件,smtplib負責發送郵件。Python內置一個poplib模塊,實現了POP3協議,可以直接用來收郵件。由於現在絕大多數大型郵件服務商都采取了反垃圾郵件措施,所以這部分的簡單實驗並沒有成功,還需進一步研究,等遇到具體情況再說。
3.Python內嵌了sqlite數據庫,還可以自行安裝連接mysql,MySQL是當前最流行的開源數據庫,在行業內有着廣泛的應用。
十、Web開發和異步IO
1.WSGI(Web Server Gateway Interface) 服務器網關接口。
2.Python web 開發框架:
-Flask:流行的Web框架
-Django:全能型Web框架
-web.py:一個小巧的Web框架
-Bottle:和Flask類似的Web框架
-Tornado:Facebook的開源異步Web框架
3.協程
參考讀物
1.廖雪峰Python教程【見友情鏈接】
