提供高并发高可靠的API,将PDF文档转换为Word/PPT/Excel/TXT等。转换出来的文件尽可能的保持了PDF原有格式,强化了易读性。同时支持扫描类型PDF,对图像进行OCR,还原图像中文字至Word,PPT等,还原的文字可编辑。
感谢广大用户的支持,有任何建议请直接联系我们4009030002 转15343。
试用效果入口:
https://try.dhconvert.com/
微信小程序搜索文档转换
我们提供了下列转换API商品:
1. 文档转PDF:如word文档等转为PDF,多张图可以做OCR转为PDF(文字可搜索拷贝)
https://market.aliyun.com/products/57002003/cmapi00044564.html
2. 文档转图片:包括每页一图,长图,动图
https://market.aliyun.com/products/57000002/cmapi00045684.html
3. 文档转HTML:单个HTML文件,电脑手机都可浏览,翻页平滑,缩放自如
https://market.aliyun.com/products/56928005/cmapi00049568.html
4. PDF转文档:如PDF文件转为word文件,扫描类PDF(图片)可以做OCR变为word文件等
https://market.aliyun.com/products/57124001/cmapi00044824.html
5. 图片转文档:对图片做OCR,转为word文件等
https://market.aliyun.com/products/56928005/cmapi00049027.html
极速!500页的图片PDF做OCR转为Word,不超过5分钟,且不漏页,每页都做OCR转换,速度甚至超过本地工具
支持两种模式: 1. 扫描的PDF保留图片不做OCR 2. 对扫描的PDF的图片做OCR处理,转为Word或PPT文档后,可直接编辑图片中的文字,OCR支持多语言
支持转换为多种文件格式,具体如下:
微软Office文档:doc, docx, pptx, xlsx
文本文件: rtf, txt
简单使用方式:
先调用任意转换接口进行转换(最快捷的是文档转换GET),调用成功获得token。可以用token轮询“查询query接口”获得结果,也可以设置callbackurl等转换完成主动通知。由于转换需要时间,文件越大页数越多,转换越久,故需要等待转换结束后获得结果,详细见文档说明。
查询转换进度接口: https://api.duhuitech.com/q?token=xxx
详细信息见使用指南文档。
示例:
原PDF文档显示:
转换为Word文件:
转换为PPT:
根据ocr参数传入的不同,可以开启或关闭OCR处理。对于扫描类型的PDF(每页是图片),如果开启OCR,对于图片会做OCR处理,转为Word或PPT文档后,可直接编辑原图片中的文字。如果不清楚是否是图片PDF,则总是开启OCR即可。如果不需要对图片OCR,则关闭OCR。
支持从OSS内网直接下载文件,节约流量,详细见文档。
· GET方法文件大小最高1000M,POST方法文件最大8M。
· 转换完成后,请于2小时内下载文件,文件不保存,过期自动删除。