文字识别接口_图片文字识别OCR_图片转文字

文字识别接口_图片文字识别OCR_图片转文字

文字识别底层托管阿里云Serverless平台,性能稳定。支持多场景下的文字检测识别,支持中、英、葡、法、德、意、西、俄、日、韩、中英混合识别,整体识别准确率高达90%以上。

服务保障
请勿线下交易!90%的欺诈、纠纷、资金盗取均由线下交易导致。

产品能力

[]

产品亮点

文字识别底层托管阿里云Serverless平台,性能稳定。支持多场景下的文字检测识别,支持中、英、葡、法、德、意、西、俄、日、韩、中英混合识别,整体识别准确率高达90%以上

产品说明

接口区别说明

接口名称 上线日期 接口地址 说明
 文字识别V1   2018年10月  http://wenzi.market.alicloudapi.com/do   仅支持图片base64识别
 文字识别V2  2020年3月  http://wenzi.market.alicloudapi.com/v2   增加支持图片远程地址识别
 文字识别V3  2023年6月  http://wenzi.market.alicloudapi.com/v3   增加location和paragraph参数

请求示例

HTTP 方法:POST

请求URL:http://wenzi.market.alicloudapi.com/v3

Header如下:

参数 说明
 Authorization   APPCODE XXX     控制台左侧菜单云市场中的APPCODE值,与前方大写APPCODE中间空一个空格  

请求参数:

参数 必选 类型 可选值 说明
image url/base64 二选一 string - 图像远程链接或base64数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
 
language_type string CHN_ENG
ENG
JAP
KOR
FRE
SPA
POR
GER
ITA
RUS
识别语言类型,默认为CHN_ENG
可选值包括:
- CHN_ENG:中英文混合
- ENG:英文
- JAP:日语
- KOR:韩语
- FRE:法语
- SPA:西班牙语
- POR:葡萄牙语
- GER:德语
- ITA:意大利语
- RUS:俄语
detect_direction string true/false 是否检测图像朝向,默认不检测,即:false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括:
- true:检测朝向;
- false:不检测朝向。
detect_language string true/false 是否检测语言,默认不检测,即:false。当前支持中文、英语、日语、韩语
paragraph string true/false 是否输出段落信息
probability string true/false 是否返回识别结果中每一行的置信度

返回参数

字段 必选 类型 说明
direction int32 图像方向,当 detect_direction=true 时返回该字段。
- - 1:未定义,
- 0:正向,
- 1:逆时针90度,
- 2:逆时针180度,
- 3:逆时针270度
log_id uint64 唯一的log id,用于问题定位
words_result_num uint32 识别结果数,表示words_result的元素个数
words_result array[] 识别结果数组
+ words string 识别结果字符串
+ probability object 识别结果中每一行的置信度值,包含average:行置信度平均值,variance:行置信度方差,min:行置信度最小值,当 probability=true 时返回该字段
paragraphs_result array[] 段落检测结果,当 paragraph=true 时返回该字段
+ words_result_idx array[] 一个段落包含的行序号,当 paragraph=true 时返回该字段
paragraphs_result_num uint32 识别结果数,表示 paragraphs_result的元素个数,当 paragraph=true 时返回该字段
language int32 语种类型,当 detect_language=true 时返回该字段。
- - 1:未定义,
- 0:英文,
- 1:日文,
- 2:韩文,
- 3:中文

错误码

错误码 错误信息 说明
400 Invalid URL URL错误
403 Forbidden 没有购买,或者购买次数用尽,或者URL错误
408 Request Timeout 超时
413 Payload Too Large request body太大
450   后端服务队列满,请求被拒绝,重试即可
460 Invalid Input - failed to parse json 上传的body不符合json格式要求,是非法json
461 Invalid Input - json format error - missing key: image 新格式:输入Json中缺少image键
旧格式:输入Json的inputs值中缺少image键
461 Invalid Input - json format error - image format error 新格式:输入Json中的image值不是字符串
旧格式:输入Json中的image值不是包含DataValue和DataType的Json串
461 Invalid Input - json format error - key inputs missing 旧格式:输入Json中缺少inputs键
461 Invalid Input - json format error - value of inputs must be a array 旧格式:输入Json中的inputs值不是一个array
461 Invalid Input - json format error - image DataValue format error 旧格式:输入Json的image键中的DataValue值不是字符串
461 Invalid Input - json format error - configure format error 旧格式:输入Json中的configure值不是包含DataValue和DataType的Json
461 Invalid Input - json format error - failed to parse config str: xxx 输入的configure不是合法的Json
461 Invalid Input - json format error - json parse runtime exception 输入的Json格式不符合要求
462 Invalid Input - image data error - download image from url error 从URL下载图像失败
462 Invalid Input - image data error - input image empty, please check your image binary data 输入的image是空字符串
462 Invalid Input - image data error - image decode failed, please check your image binary data 输入的image解码失败、base64编码的是不合法的图像格式
462 Invalid Input - image data error - base64decode error, please check your image binary data 输入的image不是合法的base64字符串
462 Invalid Input - image data error - please remove additional header: data:image/jpg:base64, 请删除base64字符串多余的头: data:image/jpg:base64
462 Invalid Input - image data error - base64decode error: incorrect padding in base64 string 输入的image不是合法的base64字符串,base64编码的数据长度需要是4的倍数,如果长度不够,需要再末尾加上=补足。
462 Invalid Input - image data error - base64decode error: base64decode error: incorrect base64 format data 输入的image不是合法的base64字符串,存在非法字符
462 Invalid Input - image data error - open gif image failed GIF图像打开失败
462 Invalid Input - image data error - read gif image failed GIF图像读取失败
462 Invalid Input - image data error - decode gif image failed GIF图像解码失败
462 Invalid Input - image data error - gif data error, no color map got GIF获取颜色映射表错误
462 Invalid Input - image data error - gif image empty GIF图像是为空
463 Invalid Input - wrong category 输入图像不是对应服务的图像,如行驶证服务请求的不是行驶证
464 Invalid Result - algorithm run failed OCR识别失败
464 Invalid Result - algorithm runtime exception OCR识别异常
464 Invalid Result - xxx OCR识别失败
469 Invalid Service - parse result error 内部异常
469 Invalid Service - error code missing 内部异常
502 Bad Gateway 识别程序超时并断开连接
503 Service Unavailable API网关等待超时断开连接
1 Unknown error 未知错误,请再次请求,如果持续出现此类错误,请联系技术支持团队
2 Service temporarily unavailable 服务暂不可用,请再次请求,如果持续出现此类错误,请联系技术支持团队
216100 invalid param 请求中包含非法参数,请检查后重新尝试
216101 not enough param 缺少必须的参数,请检查参数是否有遗漏
216102 service not support 请求了不支持的服务,请检查调用的url
216103 param too long 请求中某些参数过长,请检查后重新尝试
216110 appid not exist appid不存在,请重新核对信息是否为后台应用列表中的appid
216200 empty image 图片为空,请检查后重新尝试
216201 image format error 上传的图片格式错误,现阶段我们支持的图片格式为:PNG、JPG、JPEG、BMP,请进行转码或更换图片
216202 image size error 上传的图片大小错误,现阶段我们支持的图片大小为:base64编码后小于4M,分辨率不高于4096x4096,请重新上传图片
216202 input oversize 上传的包体积过大,现阶段不支持 10M 或以上的数据包
216306 Upload file error 上传文件失败,请检查提交请求接口的请求参数
216308 Pdf_file_num exceeds the number of pdf pages 参数pdf_file_num大于PDF文件实际页数
216401 Create task failed 提交请求失败
216402 Query task failed 获取结果失败
216603 Check pdf page num failed 获取PDF文件页数失败,请检查PDF文件以及base64编码
216604 Insufficient available quota 请求总量超限额,您可以购买或申请更多限额
216630 recognize error 识别错误,请再次请求,请确保图片中包含对应卡证票据
216631 recognize bank card error 识别银行卡错误,出现此问题的原因一般为:您上传的图片非银行卡正面,上传了异形卡的图片、上传的银行卡正面图片不完整或模糊
216633 recognize idcard error 识别身份证错误,出现此问题的原因一般为:您上传了非身份证图片、上传的身份证图片不完整或模糊
216634 detect error 检测错误,请再次请求,如果持续出现此类错误,请在联系技术支持团队
282000 internal error 服务器内部错误,如果您使用的是高精度接口,报这个错误码的原因可能是您上传的图片中文字过多,识别超时导致的,建议您对图片进行切割后再识别,其他情况请再次请求, 如果持续出现此类错误,请联系技术支持团队
282003 missing parameters: {参数名} 请求参数缺失
282005 batch processing error 处理批量任务时发生部分或全部错误,请根据具体错误码排查
282006 batch task limit reached 批量任务处理数量超出限制,请将任务数量减少到10或10以下
282100 image transcode error 图片压缩转码错误
282102 target detect error 未检测到图片中识别目标,请确保图片中包含对应卡证票据,出现此问题的原因一般为:您上传了非卡证图片、图片不完整或模糊
282103 target recognize error 图片目标识别错误,请确保图片中包含对应卡证票据,出现此问题的原因一般为:您上传了非卡证图片、图片不完整或模糊
282110 urls not exit URL参数不存在,请核对URL后再次提交
282111 url format illegal URL格式非法,请检查url格式是否符合相应接口的入参要求
282112 url download timeout url下载超时,请检查url对应的图床/图片无法下载或链路状况不好,或图片大小大于3M,或图片存在防盗链,您可以重新尝试以下,如果多次尝试后仍不行,建议更换图片地址
282113 url response invalid URL返回无效参数
282114 url size error URL长度超过1024字节或为0
282808 request id: xxxxx not exist request id xxxxx 不存在
282809 result type error 返回结果请求错误(不属于excel或json)
282810 image recognize error 图像识别错误,请再次请求,如果持续出现此类错误,请联系技术支持团队

返回示例

{
    "log_id": 2432938548,
    "words_result": [ {
        "words": "陕西省西安市国家民用航天产业基地神舟四路239号2栋5"
    }, {
        "words": "法定代表人张强"
    }, {
        "words": "注册资本壹佰万元人民币"
    }, {
        "words": "成立日期2014年05月30日"
    }, {
        "words": "营业期限长期"
    }, {
        "words": "经营范围软件设计与开发;企业信息化服务;网络工程设计施工;网站设"
    }, {
        "words": "计与开发;计算机软硬件销售;计算机技术开发、技术服务;商"
    }, {
        "words": "标、版权、著作权、专利的代理及转让;广告的设计、制作、代"
    }, {
        "words": "理、发布。(依法须经批准的项目,经相关部门批准后方可开展"
    }, {
        "words": "经营活动)"
    }, {
        "words": "商行"
    }, {
        "words": "登记机关"
    }, {
        "words": "★"
    }, {
        "words": "请于每年1月1日至6月30日报送上一年度年度报告。自公司"
    }, {
        "words": "成立之日以及企业相关信息形成之日起20个工作日内,在企业2018年05月02日"
    }, {
        "words": "信用信息公示系统进行公示"
    }],
    "words_result_num": 27
}

售后支持范围

售后服务范围为产品使用方面的技术支持,售后支持时间范围为合同期范围内
热搜类目 热搜产品 快速入口