- API
- 文档转换GET
- 文档转换POST
GET/v1/convert
无参数
无参数
- 接口文档
- 请求示例
- 成功响应
- 失败响应
- 错误码
- 调用结果
接口信息
https://pdf2doc.ali.duhuitech.com/v1/convert
GET
JSON
接口参数
无参数
字段名称 | 必填 | 字段详情 |
---|---|---|
url string | Y | 要转换的文档URL,需要URLEncoding,必须http(s),ftp开头 实例值: https://xxx/xxx.pdf |
type string | Y | 转换为目标文档扩展名,例如docx 实例值: docx |
ocr int | N | 是否做OCR,默认1会做自动判断是否OCR;0:不做OCR;2:强制OCR(针对有些加密或编码不正确导致的乱码或白页) 实例值: 1 |
language int | N | OCR识别语言选项,默认2简体中文: 1:英语 2:简体中文 3:繁体中文 4:法语 5:德语 6:意大利语 7:俄语 8:日文 9:韩文 10:西班牙语 11:葡萄牙语 12:丹麦语 13:荷兰语 14:芬兰语 15:挪威语 16:瑞典语 实例值: 2 |
excelonesheet int | N | 如果转为Excel文件,默认0:PDF特定页数以内为一个工作表,否则每页一个工作表;1:一个工作表(如果PDF页数太多,有失败可能);2:每页一个工作表 实例值: 0 |
wordnoimage int | N | 如果转为Word文件,默认0:需要图片;1:不需要图片 实例值: 0 |
imagepdfocroption int | N | 根据是否扫描版PDF,做不同的ocr操作,详细见文档 实例值: 0 |
table int | N | 如果ocr取值3(包含)以上,也就是使用图片转文档引擎做转换的情况下,转为Word或PPT是否识别表格。 默认0:否 1: 只识别表格 2: 识别表格和下划线 实例值: 1 |
password string | N | PDF文件的密码,没有密码可以不传或传空 |
pageindexes string | N | 要转换的PDF页数,默认空全部页,例如:1,3,5-7就是1,3,5,6,7共5页 |
outfilename string | N | 生成的文件的文件名,默认随机 |
callbackurl string | N | 回调URL,转换结束后,会回调该URL,需要URL Encoding,详细见文档 回调URL |
无参数
商品介绍
产品亮点
产品说明
公告:
2025.1.1起,取消原API调用域名:
pdf2doc.ali.duhuitech.com
新的域名:
pdf2doc.market.alicloudapi.com
同时原来转换后的文件保留2小时改为1小时
特此公告!
常见问题Q&A:
1. 本产品解决什么问题?
提供API接口把PDF文档转换为word,ppt,excel,txt等格式
2. 能否试用看下转换效果?
可以,API文档如下:
https://netmarket.oss-cn-hangzhou.aliyuncs.com/a47a82237e3e47108e913488115d9999.pdf_to_doc_ali.pdf
文档首页包含试用链接,也可以微信小程序搜索:度慧文档转换
3. 如何收费?是否和文档页数有关?
按次收费,和文档页数无关,比如一个PDF有1页,另一个有1000页,都算1次,性价比拉满
4. 有问题咨询如何联系?
联系我们4009030002 转15343,或搜索公众号:度慧科技
5. 是否可以定制开发一些功能?
可以,我司具备20余年文档相关开发经验,可帮助定制开发各类涉及word,pdf等格式的需求,欢迎致电咨询
另外我们还提供了下列转换API商品:
1. 文档转PDF:如word文档等转为PDF,多张图可以做OCR转为PDF(文字可搜索拷贝)
https://market.aliyun.com/products/57002003/cmapi00044564.html
2. 文档转图片:包括每页一图,长图,动图
https://market.aliyun.com/products/57000002/cmapi00045684.html
3. 文档转HTML:单个HTML文件,电脑手机都可浏览,翻页平滑,缩放自如
https://market.aliyun.com/products/56928005/cmapi00049568.html
4. PDF转文档:如PDF文件转为word文件,扫描类PDF(图片)可以做OCR变为word文件等
https://market.aliyun.com/products/57124001/cmapi00044824.html
5. 图片转文档:对图片做OCR,转为word文件等
https://market.aliyun.com/products/56928005/cmapi00049027.html
极速!500页的图片PDF做OCR转为Word,速度甚至超过本地工具,且不漏页,每页都做OCR转换。
支持两种模式:
1. 扫描的PDF保留图片不做OCR
2. 对扫描的PDF的图片做OCR处理,转为Word或PPT文档后,可直接编辑图片中的文字,OCR支持多语言
支持转换为多种文件格式,具体如下:
微软Office文档:doc, docx, pptx, xlsx
文本文件: rtf, txt
简单使用方式:
先调用任意转换接口进行转换(最快捷的是文档转换GET),调用成功获得token。可以用token轮询“查询query接口”获得结果,也可以设置callbackurl等转换完成主动通知。由于转换需要时间,文件越大页数越多,转换越久,故需要等待转换结束后获得结果,详细见文档说明。
查询转换进度接口:
https://api.duhuitech.com/q?token=xxx
详细信息见使用指南文档。
示例:
原PDF文档显示:
转换为Word文件:
转换为PPT:
根据ocr参数传入的不同,可以开启或关闭OCR处理。对于扫描类型的PDF(每页是图片),如果开启OCR,对于图片会做OCR处理,转为Word或PPT文档后,可直接编辑原图片中的文字。如果不清楚是否是图片PDF,则总是开启OCR即可。如果不需要对图片OCR,则关闭OCR。
支持从OSS内网直接下载文件,节约流量,详细见文档。
更多精彩功能请查阅文档或来电咨询4009030002 转15343
· GET方法文件大小最高1000M,POST方法文件最大8M。
· 转换完成后,请于2小时(**2025.1.1之后变更为1小时)内下载文件,文件不保存,过期自动删除。
产品参数
交付方式 | API |
开票主体 | 上海度慧科技有限公司 |
所属类目 | AI应用与OCR |
上架日期 | 2020-12-23 |
售后支持范围
产品资质
商品价格(此处价格仅供参考,实际价格以选配后的价格为准)
版本名称 | 计费项 | 新购 |
1000次3个月 | 版本基础价格 | 100元 |
1万次6个月 | 版本基础价格 | 300元 |
5万次1年 | 版本基础价格 | 500元 |
500次不限时 | 版本基础价格 | 100元 |
5000次不限时 | 版本基础价格 | 500元 |
2万次不限时 | 版本基础价格 | 1000元 |
30万次不限时 | 版本基础价格 | 2000元 |
100万次不限时 | 版本基础价格 | 3000元 |
包月(1个月内无次数限制) | 版本基础价格 | 20000元 |
包年(1年内无次数限制) | 版本基础价格 | 200000元 |
使用指南
立即下载服务商
上海度慧科技有限公司
- 企业应用
- 数据与API
入住时间:2020-11-27
所在地区:310000 310100
入驻集市:企业软件数据市场
可开发票类型:增值税普通发票
查看工商登记信息
店铺交易情况
商家商品数量:7近180天成交订单量:414近180天退单率:0.48%店铺评分状态
- 评价数量:16条
- 综合总分:5分
- 完成质量:5分
- 工作速度:5分
- 服务态度:5分
综合总分5分的分布
- 0.00%
- 0.00%
- 0.00%
- 0.00%
- 0.00%
用户评论 (6)
转换速度很快,客服的支持也很及时
excel转换出来的效果很不错,基本跟原来pdf表格差不多,赞一个
稳定
还不错,文件转换还行
购买之后,不能及时提供发票:显示只能申请纸质发票没有电子发票;但申请之后一直在开票中;而且页面没有提供服务电话;通过统一的云服务电话4009030002转15343,转接后没有提示音。
很好用的一款转换工具~希望能一直稳定运营