python圖像處理：pytesseract和PIL

本文轉載自查看原文 2015-08-19 13:41 16904 python/ PIL/ pytesseract/ Python

大概介紹下相關模塊的概念：

Python-tesseract 是光學字符識別Tesseract OCR引擎的Python封裝類。能夠讀取任何常規的圖片文件(JPG, GIF ,PNG , TIFF等)並解碼成可讀的語言。在OCR處理期間不會創建任何臨文件

PIL （Python Imaging Library）是 Python 中最常用的圖像處理庫，目前版本為 1.1.7，我們可以在這里下載學習和查找資料。

Image 類是 PIL 庫中一個非常重要的類，通過這個類來創建實例可以有直接載入圖像文件，讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。

python對圖像的處理比較常見的是用pytesseract識別驗證碼，要安裝pytesseract庫，必須先安裝其依賴的PIL及tesseract-ocr，其中PIL為圖像處理庫，而后面的tesseract-ocr則為google的ocr識別引擎。下載鏈接：http://www.waitalone.cn/python-php-ocr.html 該鏈接文檔描述了如何配置相關環境，以及識別驗證碼的python代碼，總結起來就三步：安裝PIL.exe；安裝tesseract-ocr-setup.exe;安裝pip install pytesseract

1、識別圖片簡單的示例

1 import Image
2 import pytesseract
3 
4 image=Image.open("1.jpg")    #打開驗證碼圖片
5 image.load()        #加載一下圖片，防止報錯，此處可省略
6 image.show() 　　　　#調用show來展示圖片，調試用，可省略

7 vcode=pytesseract.image_to_string(image)    
8 print vcode

我按照該代碼示例實際操作時報了2個錯誤：

1、The _imaging C module is not installed

是因為環境配置的問題，我的系統是win7 64bit，開始的時候只安裝了PIL-1.1.7.win-amd64-py2.7.exe，把PIL-1.1.7.win32-py2.7.exe安裝后，在python命令行輸入：import _imaging，如果不報錯則問題應該就解決了

2、在 win 7 下使用 PIL 中的 Image 模塊的 show() 函數時，報如下錯：

解決方法：將 PIL 安裝目錄下的 ImageShow.py 文件的第 99 行：（我的 python 安裝在 C:\python 2.7， ImageShow.py 文件在：C:\Python27\Lib\site-packages\PIL\ImageShow.py）

return "start /wait %s && del /f %s" % (file, file)

替換為：

return "start /wait %s && PING 127.0.0.1 -n 5 > NUL && del /f %s" % (file, file)

2、實際情況中，電腦本地並沒有驗證碼圖片，都是從網頁中的驗證碼圖片鏈接抓取的，實際示例：

 1 import urllib2
 2 import pytesseract
 3 import Image
 4 import time
 5 
 6 fp=urllib2.urlopen('https://vcs.suning.com/vcs/imageCode.htm?uuid=1e68d06a-1134-410b-9606-f0eb4ae23bbe')　　#示例網址的驗證碼圖片地址
 7 print fp
 8 
 9 name="D:\\curl\\1.jpg"
10 f=open(name,'wb')
11 f.write(fp.read())　　　　　　#讀取驗證碼圖片並保存為1.jpg
12 time.sleep(2)
13 f.close()
14 
15 fl=open(name,'rb')
16 image=Image.open(fl)
17 image.show()
18 #image.load()
19 vcode=pytesseract.image_to_string(image)
20 print vcode
21 fl.close()

以上本親測可行，不過驗證碼識別率不是很高，簡單的圖片識別率還是可以的

附錄：Image模塊用法介紹【轉】

1. 簡介。

圖像處理是一門應用非常廣的技術，而擁有非常豐富第三方擴展庫的 Python 當然不會錯過這一門盛宴。PIL （Python Imaging Library）是 Python 中最常用的圖像處理庫，目前版本為 1.1.7，我們可以在這里下載學習和查找資料。

Image 類是 PIL 庫中一個非常重要的類，通過這個類來創建實例可以有直接載入圖像文件，讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。

2. 使用。

導入 Image 模塊。然后通過 Image 類中的 open 方法即可載入一個圖像文件。如果載入文件失敗，則會引起一個 IOError ；若無返回錯誤，則 open 函數返回一個 Image 對象。現在，我們可以通過一些對象屬性來檢查文件內容，即：

1 >>> import Image
2  >>> im = Image.open("j.jpg")
3  >>> print im.format, im.size, im.mode
4 JPEG (440, 330) RGB

這里有三個屬性，我們逐一了解。

format : 識別圖像的源格式，如果該文件不是從文件中讀取的，則被置為 None 值。

size : 返回的一個元組，有兩個元素，其值為象素意義上的寬和高。

mode : RGB（true color image），此外還有，L（luminance），CMTK（pre-press image）。

現在，我們可以使用一些在 Image 類中定義的方法來操作已讀取的圖像實例。比如，顯示最新載入的圖像：

1 >>>im.show()
2  >>>

輸出原圖：

3. 函數概貌。

3.1 Reading and Writing Images : open( infilename ) , save( outfilename )

3.2 Cutting and Pasting and Merging Images :

crop() : 從圖像中提取出某個矩形大小的圖像。它接收一個四元素的元組作為參數，各元素為（left, upper, right, lower），坐標系統的原點（0, 0）是左上角。

paste() :

merge() :

1 >>> box = (100, 100, 200, 200)
2  >>> region = im.crop(box)
3  >>> region.show()
4  >>> region = region.transpose(Image.ROTATE_180)
5  >>> region.show()
6  >>> im.paste(region, box)
7  >>> im.show()

其效果圖為：

旋轉一幅圖片：

 1 def roll(image, delta):
 2     "Roll an image sideways"
 3 
 4     xsize, ysize = image.size
 5 
 6     delta = delta % xsize
 7     if delta == 0: return image
 8 
 9     part1 = image.crop((0, 0, delta, ysize))
10     part2 = image.crop((delta, 0, xsize, ysize))
11     image.paste(part2, (0, 0, xsize-delta, ysize))
12     image.paste(part1, (xsize-delta, 0, xsize, ysize))
13 
14     return image

3.3 幾何變換。

3.3.1 簡單的幾何變換。

1 >>>out = im.resize((128, 128))                     #
2  >>>out = im.rotate(45)                             #逆時針旋轉 45 度角。
3  >>>out = im.transpose(Image.FLIP_LEFT_RIGHT)       #左右對換。
4  >>>out = im.transpose(Image.FLIP_TOP_BOTTOM)       #上下對換。
5  >>>out = im.transpose(Image.ROTATE_90)             #旋轉 90 度角。
6  >>>out = im.transpose(Image.ROTATE_180)            #旋轉 180 度角。
7 >>>out = im.transpose(Image.ROTATE_270)            #旋轉 270 度角。

各個調整之后的圖像為：

圖片1：

圖片2：

圖片3：

圖片4：

3.3.2 色彩空間變換。

convert() : 該函數可以用來將圖像轉換為不同色彩模式。

3.3.3 圖像增強。

Filters : 在 ImageFilter 模塊中可以使用 filter 函數來使用模塊中一系列預定義的增強濾鏡。

1 >>> import ImageFilter
2 >>> imfilter = im.filter(ImageFilter.DETAIL)
3 >>> imfilter.show()

3.4 序列圖像。

即我們常見到的動態圖，最常見的后綴為 .gif ，另外還有 FLI / FLC 。PIL 庫對這種動畫格式圖也提供了一些基本的支持。當我們打開這類圖像文件時，PIL 自動載入圖像的第一幀。我們可以使用 seek 和 tell 方法在各幀之間移動。

1 import Image
2 im.seek(1)        # skip to the second frame
3 
4 try:
5     while 1:
6         im.seek( im.tell() + 1)
7         # do something to im
8 except EOFError:
9     pass

3.5 更多關於圖像文件的讀取。

最基本的方式：im = Image.open("filename")

類文件讀取：fp = open("filename", "rb"); im = Image.open(fp)

字符串數據讀取：import StringIO; im = Image.open(StringIO.StringIO(buffer))

從歸檔文件讀取：import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)

基本的 PIL 目前就練習到這里。其他函數的功能可點擊這里進一步閱讀。

擴展閱讀：python如何下載網頁圖片

http://blog.csdn.net/wudishine/article/details/11528791

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python PIL 圖像處理 python PIL圖像處理 python PIL圖像處理庫圖像處理基本工具——Python 環境下的 Pillow( PIL ) 在python3下用PIL做圖像處理 Python圖像處理框架PIL各模塊詳細介紹 Python圖像處理 PIL中convert('L')函數原理 python PIL（pillow）圖像處理-圖片上添加文字 Python圖像處理 PIL中convert函數的mode總結 Python圖像處理庫(PIL)--簡介和基本概念