python实战项目,识别图片中的文字,调用百度人工智能 API 实现

前面我们介绍了 python实战项目,人脸识别菜品识别 等等python人工智能实战项目,今天我们简单说说怎样调用百度的人工智能 API 实现识别图片中的文字

百度文字识别 API 简介


1. 接口描述

用户向服务请求识别某张图中的所有文字。

2. 请求说明

HTTP 方法:POST
* 请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic

  • URL参数:

    • access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”
      Header如下:

    • Content-Type application/x-www-form-urlencoded

Body中放置请求参数,参数详情如下:

  • 请求参数

3. 返回示例

HTTP/1.1 200 OK
x-bce-request-id: 73c4e74c-3101-4a00-bf44-fe246959c05e
Cache-Control: no-cache
Server: BWS
Date: Tue, 18 Oct 2016 02:21:01 GMT
Content-Type: application/json;charset=UTF-8
{
"log_id": 2471272194, 
"words_result_num": 2,
"words_result": 
    [
        {"words": " TSINGTAO"}, 
        {"words": "青島睥酒"}
    ]
}

python实战项目,识别图片中的文字


同前面几节一样,分两步走:

1. 获取 access_token

相信前面几节已经说得比较清楚了,这里咱们直接上代码,文件名 token.py:

# encoding:utf-8
import urllib, urllib2, sys
import ssl, json

AK = "TwAxxxxxxxxxxxxxxxxxxDZn"
SK = "nEuxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxAdXF"

host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials'\
       '&client_id=%s'\
       '&client_secret=%s' % (AK, SK)

def GetToken():
    request = urllib2.Request(host)
    request.add_header('Content-Type', 'application/json; charset=UTF-8')
    response = urllib2.urlopen(request)
    content = response.read()
    if (content):
        js = json.loads(content)
        return js['access_token']
    return None

AK 和 SK 同样从你的注册页面免费获得,如下图。

创建完成后,可以获得 AK 和 SK:

2. python实战项目,识别图片中的文字

咱们直接上代码,如果不清楚为何这样,可以翻翻前面的博客:

# encoding:utf-8
import base64
import urllib
import urllib2, json
from token import GetToken

'''
文字识别
'''

url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"


def OcrRecg(fileName):
    # 二进制方式打开图片文件
    f = open(fileName, 'rb')
    img = base64.b64encode(f.read())

    params = {"image":img}
    params = urllib.urlencode(params)

    access_token = GetToken()
    request_url = url + "?access_token=" + access_token
    print request_url
    request = urllib2.Request(url=request_url, data=params)
    request.add_header('Content-Type', 'application/x-www-form-urlencoded')
    response = urllib2.urlopen(request)
    content = response.read()
    if content:
        print content

if __name__ == "__main__":
    pic = "pic/1.jpg"   # 这里写咱们要识别的图片名字
    OcrRecg(pic) 

写完代码后,建立一个 pic 文件夹,里面放入我们要识别的图片,作为示范,我们放入一直图片,如下图:

图片名为 1.jpg,运行脚本,得到下图结果:

可以看出,结果还不错,这样,咱们就完成了 python 实战项目,识别图片中的文字。
阅读更多:   Python
暂无评论
  1. […] python实战项目,识别图片中的文字,调用百度人工智能 API 实现 […]

添加新评论

icon_redface.gificon_idea.gificon_cool.gif2016kuk.gificon_mrgreen.gif2016shuai.gif2016tp.gif2016db.gif2016ch.gificon_razz.gif2016zj.gificon_sad.gificon_cry.gif2016zhh.gificon_question.gif2016jk.gif2016bs.gificon_lol.gif2016qiao.gificon_surprised.gif2016fendou.gif2016ll.gif