前面我们介绍了 python实战项目,人脸识别 , 菜品识别 等等python人工智能实战项目,今天我们简单说说怎样调用百度的人工智能 API 实现识别图片中的文字
。
百度文字识别 API 简介
1. 接口描述
用户向服务请求识别某张图中的所有文字。
2. 请求说明
HTTP 方法:POST
* 请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic
- URL参数:
- access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”
Header如下: - Content-Type application/x-www-form-urlencoded
- access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”
Body中放置请求参数,参数详情如下:
- 请求参数
3. 返回示例
HTTP/1.1 200 OK
x-bce-request-id: 73c4e74c-3101-4a00-bf44-fe246959c05e
Cache-Control: no-cache
Server: BWS
Date: Tue, 18 Oct 2016 02:21:01 GMT
Content-Type: application/json;charset=UTF-8
{
"log_id": 2471272194,
"words_result_num": 2,
"words_result":
[
{"words": " TSINGTAO"},
{"words": "青島睥酒"}
]
}
python实战项目,识别图片中的文字
同前面几节一样,分两步走:
1. 获取 access_token
相信前面几节已经说得比较清楚了,这里咱们直接上代码,文件名 token.py:
# encoding:utf-8
import urllib, urllib2, sys
import ssl, json
AK = "TwAxxxxxxxxxxxxxxxxxxDZn"
SK = "nEuxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxAdXF"
host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials'\
'&client_id=%s'\
'&client_secret=%s' % (AK, SK)
def GetToken():
request = urllib2.Request(host)
request.add_header('Content-Type', 'application/json; charset=UTF-8')
response = urllib2.urlopen(request)
content = response.read()
if (content):
js = json.loads(content)
return js['access_token']
return None
AK 和 SK 同样从你的注册页面免费获得,如下图。
创建完成后,可以获得 AK 和 SK:
2. python实战项目,识别图片中的文字
咱们直接上代码,如果不清楚为何这样,可以翻翻前面的博客:
# encoding:utf-8
import base64
import urllib
import urllib2, json
from token import GetToken
'''
文字识别
'''
url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"
def OcrRecg(fileName):
# 二进制方式打开图片文件
f = open(fileName, 'rb')
img = base64.b64encode(f.read())
params = {"image":img}
params = urllib.urlencode(params)
access_token = GetToken()
request_url = url + "?access_token=" + access_token
print request_url
request = urllib2.Request(url=request_url, data=params)
request.add_header('Content-Type', 'application/x-www-form-urlencoded')
response = urllib2.urlopen(request)
content = response.read()
if content:
print content
if __name__ == "__main__":
pic = "pic/1.jpg" # 这里写咱们要识别的图片名字
OcrRecg(pic)
写完代码后,建立一个 pic
文件夹,里面放入我们要识别的图片,作为示范,我们放入一直图片,如下图:
图片名为 1.jpg
,运行脚本,得到下图结果:
[…] python实战项目,识别图片中的文字,调用百度人工智能 API 实现 […]