大概介紹下相關模塊的概念:
Python-tesseract 是光學字符識別Tesseract OCR引擎的Python封裝類。能夠讀取任何常規的圖片文件(JPG, GIF ,PNG , TIFF等)並解碼成可讀的語言。在OCR處理期間不會創建任何臨文件
PIL (Python Imaging Library)是 Python 中最常用的圖像處理庫,目前版本為 1.1.7,我們可以 在這里 下載學習和查找資料。
Image 類是 PIL 庫中一個非常重要的類,通過這個類來創建實例可以有直接載入圖像文件,讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。
python對圖像的處理比較常見的是用pytesseract識別驗證碼,要安裝pytesseract庫,必須先安裝其依賴的PIL及tesseract-ocr,其中PIL為圖像處理庫,而后面的tesseract-ocr則為google的ocr識別引擎。下載鏈接:http://www.waitalone.cn/python-php-ocr.html 該鏈接文檔描述了如何配置相關環境,以及識別驗證碼的python代碼,總結起來就三步:安裝PIL.exe;安裝tesseract-ocr-setup.exe;安裝pip install pytesseract
1、識別圖片簡單的示例
1 import Image 2 import pytesseract 3 4 image=Image.open("1.jpg") #打開驗證碼圖片 5 image.load() #加載一下圖片,防止報錯,此處可省略
6 image.show() #調用show來展示圖片,調試用,可省略
7 vcode=pytesseract.image_to_string(image) 8 print vcode
我按照該代碼示例實際操作時報了2個錯誤:
1、The _imaging C module is not installed
是因為環境配置的問題,我的系統是win7 64bit,開始的時候只安裝了PIL-1.1.7.win-amd64-py2.7.exe,把PIL-1.1.7.win32-py2.7.exe安裝后,在python命令行輸入:import _imaging,如果不報錯則問題應該就解決了
2、在 win 7 下使用 PIL 中的 Image 模塊的 show() 函數時,報如下錯:
解決方法:將 PIL 安裝目錄下的 ImageShow.py 文件的第 99 行:(我的 python 安裝在 C:\python 2.7, ImageShow.py 文件在:C:\Python27\Lib\site-packages\PIL\ImageShow.py)
return "start /wait %s && del /f %s" % (file, file)
替換為:
return "start /wait %s && PING 127.0.0.1 -n 5 > NUL && del /f %s" % (file, file)
2、實際情況中,電腦本地並沒有驗證碼圖片,都是從網頁中的驗證碼圖片鏈接抓取的,實際示例:
1 import urllib2 2 import pytesseract 3 import Image 4 import time 5 6 fp=urllib2.urlopen('https://vcs.suning.com/vcs/imageCode.htm?uuid=1e68d06a-1134-410b-9606-f0eb4ae23bbe') #示例網址的驗證碼圖片地址 7 print fp 8 9 name="D:\\curl\\1.jpg" 10 f=open(name,'wb') 11 f.write(fp.read()) #讀取驗證碼圖片並保存為1.jpg 12 time.sleep(2) 13 f.close() 14 15 fl=open(name,'rb') 16 image=Image.open(fl) 17 image.show() 18 #image.load() 19 vcode=pytesseract.image_to_string(image) 20 print vcode 21 fl.close()
以上本親測可行,不過驗證碼識別率不是很高,簡單的圖片識別率還是可以的
附錄:Image模塊用法介紹【轉】
1. 簡介。
圖像處理是一門應用非常廣的技術,而擁有非常豐富第三方擴展庫的 Python 當然不會錯過這一門盛宴。PIL (Python Imaging Library)是 Python 中最常用的圖像處理庫,目前版本為 1.1.7,我們可以 在這里 下載學習和查找資料。
Image 類是 PIL 庫中一個非常重要的類,通過這個類來創建實例可以有直接載入圖像文件,讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。
2. 使用。
導入 Image 模塊。然后通過 Image 類中的 open 方法即可載入一個圖像文件。如果載入文件失敗,則會引起一個 IOError ;若無返回錯誤,則 open 函數返回一個 Image 對象。現在,我們可以通過一些對象屬性來檢查文件內容,即:
1 >>> import Image
2 >>> im = Image.open("j.jpg")
3 >>> print im.format, im.size, im.mode
4 JPEG (440, 330) RGB
這里有三個屬性,我們逐一了解。
format : 識別圖像的源格式,如果該文件不是從文件中讀取的,則被置為 None 值。
size : 返回的一個元組,有兩個元素,其值為象素意義上的寬和高。
mode : RGB(true color image),此外還有,L(luminance),CMTK(pre-press image)。
現在,我們可以使用一些在 Image 類中定義的方法來操作已讀取的圖像實例。比如,顯示最新載入的圖像:
1 >>>im.show()
2 >>>
輸出原圖:
3. 函數概貌。
3.1 Reading and Writing Images : open( infilename ) , save( outfilename )
3.2 Cutting and Pasting and Merging Images :
crop() : 從圖像中提取出某個矩形大小的圖像。它接收一個四元素的元組作為參數,各元素為(left, upper, right, lower),坐標系統的原點(0, 0)是左上角。
paste() :
merge() :
1 >>> box = (100, 100, 200, 200)
2 >>> region = im.crop(box)
3 >>> region.show()
4 >>> region = region.transpose(Image.ROTATE_180)
5 >>> region.show()
6 >>> im.paste(region, box)
7 >>> im.show()
其效果圖為:
旋轉一幅圖片:
1 def roll(image, delta):
2 "Roll an image sideways"
3
4 xsize, ysize = image.size
5
6 delta = delta % xsize
7 if delta == 0: return image
8
9 part1 = image.crop((0, 0, delta, ysize))
10 part2 = image.crop((delta, 0, xsize, ysize))
11 image.paste(part2, (0, 0, xsize-delta, ysize))
12 image.paste(part1, (xsize-delta, 0, xsize, ysize))
13
14 return image
3.3 幾何變換。
3.3.1 簡單的幾何變換。
1 >>>out = im.resize((128, 128)) #
2 >>>out = im.rotate(45) #逆時針旋轉 45 度角。
3 >>>out = im.transpose(Image.FLIP_LEFT_RIGHT) #左右對換。
4 >>>out = im.transpose(Image.FLIP_TOP_BOTTOM) #上下對換。
5 >>>out = im.transpose(Image.ROTATE_90) #旋轉 90 度角。
6 >>>out = im.transpose(Image.ROTATE_180) #旋轉 180 度角。
7 >>>out = im.transpose(Image.ROTATE_270) #旋轉 270 度角。
各個調整之后的圖像為:
圖片1:
圖片2:
圖片3:
圖片4:
3.3.2 色彩空間變換。
convert() : 該函數可以用來將圖像轉換為不同色彩模式。
3.3.3 圖像增強。
Filters : 在 ImageFilter 模塊中可以使用 filter 函數來使用模塊中一系列預定義的增強濾鏡。
1 >>> import ImageFilter
2 >>> imfilter = im.filter(ImageFilter.DETAIL)
3 >>> imfilter.show()
3.4 序列圖像。
即我們常見到的動態圖,最常見的后綴為 .gif ,另外還有 FLI / FLC 。PIL 庫對這種動畫格式圖也提供了一些基本的支持。當我們打開這類圖像文件時,PIL 自動載入圖像的第一幀。我們可以使用 seek 和 tell 方法在各幀之間移動。
1 import Image
2 im.seek(1) # skip to the second frame
3
4 try:
5 while 1:
6 im.seek( im.tell() + 1)
7 # do something to im
8 except EOFError:
9 pass
3.5 更多關於圖像文件的讀取。
最基本的方式:im = Image.open("filename")
類文件讀取:fp = open("filename", "rb"); im = Image.open(fp)
字符串數據讀取:import StringIO; im = Image.open(StringIO.StringIO(buffer))
從歸檔文件讀取:import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)
基本的 PIL 目前就練習到這里。其他函數的功能可點擊 這里 進一步閱讀。
擴展閱讀:python如何下載網頁圖片
http://blog.csdn.net/wudishine/article/details/11528791