python实战项目，识别图片中的文字，调用百度人工智能 API 实现

前面我们介绍了 python实战项目，人脸识别 ， 菜品识别 等等python人工智能实战项目，今天我们简单说说怎样调用百度的人工智能 API 实现识别图片中的文字。

百度文字识别 API 简介

1. 接口描述

用户向服务请求识别某张图中的所有文字。

2. 请求说明

HTTP 方法：POST
* 请求URL： https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic

URL参数：
- access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”
  Header如下：
- Content-Type application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

3. 返回示例

HTTP/1.1 200 OK
x-bce-request-id: 73c4e74c-3101-4a00-bf44-fe246959c05e
Cache-Control: no-cache
Server: BWS
Date: Tue, 18 Oct 2016 02:21:01 GMT
Content-Type: application/json;charset=UTF-8
{
"log_id": 2471272194, 
"words_result_num": 2,
"words_result": 
    [
        {"words": " TSINGTAO"}, 
        {"words": "青島睥酒"}
    ]
}

python实战项目，识别图片中的文字

同前面几节一样，分两步走：

1. 获取 access_token

相信前面几节已经说得比较清楚了，这里咱们直接上代码，文件名 token.py：

# encoding:utf-8
import urllib, urllib2, sys
import ssl, json

AK = "TwAxxxxxxxxxxxxxxxxxxDZn"
SK = "nEuxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxAdXF"

host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials'\
       '&client_id=%s'\
       '&client_secret=%s' % (AK, SK)

def GetToken():
    request = urllib2.Request(host)
    request.add_header('Content-Type', 'application/json; charset=UTF-8')
    response = urllib2.urlopen(request)
    content = response.read()
    if (content):
        js = json.loads(content)
        return js['access_token']
    return None

AK 和 SK 同样从你的注册页面免费获得，如下图。

创建完成后，可以获得 AK 和 SK：

2. python实战项目，识别图片中的文字

咱们直接上代码，如果不清楚为何这样，可以翻翻前面的博客：

# encoding:utf-8
import base64
import urllib
import urllib2, json
from token import GetToken

'''
文字识别
'''

url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"


def OcrRecg(fileName):
    # 二进制方式打开图片文件
    f = open(fileName, 'rb')
    img = base64.b64encode(f.read())

    params = {"image":img}
    params = urllib.urlencode(params)

    access_token = GetToken()
    request_url = url + "?access_token=" + access_token
    print request_url
    request = urllib2.Request(url=request_url, data=params)
    request.add_header('Content-Type', 'application/x-www-form-urlencoded')
    response = urllib2.urlopen(request)
    content = response.read()
    if content:
        print content

if __name__ == "__main__":
    pic = "pic/1.jpg"   # 这里写咱们要识别的图片名字
    OcrRecg(pic)

写完代码后，建立一个 pic 文件夹，里面放入我们要识别的图片，作为示范，我们放入一直图片，如下图：