度慧文档转网页HTML

度慧文档转网页HTML

提供高并发高可靠的API,将多种格式文档转为单文件HTML网页,文档显示样式在网页中都保留,网页中文字可选,电脑和手机都可查看。支持多张图片做OCR后转为网页。

服务保障
请勿线下交易!90%的欺诈、纠纷、资金盗取均由线下交易导致。

产品能力

[]

产品亮点

支持格式广泛,源文档显示样式完全保留,生成的HTML可在电脑端和手机端自适应显示,解决了手机上正确显示各种格式文档的痛点,文字可选。支持多张图片做OCR后转为网页,图片完全保留的同时,图片内文字可选。产生的HTML为单一文件,拷贝到哪都能工作。

产品说明

快速使用Q&A:

1. 本产品解决什么问题?
提供API接口把多种格式的文档转换为HTML网页文件

2. 能否试用看下转换效果?
可以,API文档如下:

https://netmarket.oss-cn-hangzhou.aliyuncs.com/5c7841f988c0476d94f0304fc737264f.pdf
文档首页包含试用链接,也可以微信小程序搜索:度慧文档转换

3. 如何收费?是否和文档页数有关?
按次收费,和文档页数无关,比如1页的文档和1000页的文档,都算1次

4. 有问题咨询如何联系?
联系我们4009030002 转15343,或搜索公众号:
度慧科技

5. 是否可以定制开发一些功能?
可以,我司具备20余年文档相关开发经验,可帮助定制开发各类涉及word,pdf等格式的需求,欢迎致电咨询


另外我们还提供了下列转换API商品:

1. 文档转PDF:如word文档等转为PDF,多张图可以做OCR转为PDF(文字可搜索拷贝)

https://market.aliyun.com/products/57002003/cmapi00044564.html

2. 文档转图片:包括每页一图,长图,动图

https://market.aliyun.com/products/57000002/cmapi00045684.html

3. 文档转HTML:单个HTML文件,电脑手机都可浏览,翻页平滑,缩放自如

https://market.aliyun.com/products/56928005/cmapi00049568.html

4. PDF转文档:如PDF文件转为word文件,扫描类PDF(图片)可以做OCR变为word文件等

https://market.aliyun.com/products/57124001/cmapi00044824.html

5. 图片转文档:对图片做OCR,转为word文件等

https://market.aliyun.com/products/56928005/cmapi00049027.html

 

支持多种源文件格式,具体如下(type可传入如下格式):

PDF文档:pdf

微软Office文档:doc, docx, ppt, pptx, xls, xlsx, pot, pps, ppsx, csv

WPS文档:wps, wpt, dps, dpt, et, ett

苹果iWork文档:pages, key, numbers

开放版式文档:ofd

电子刊物:caj

电子书:epub, chm, mobi, azw, azw3, fb2, cbr, cbz, djvu

Markdown格式:md

SVG格式: svg

CAD文档:dwg, dxf, dwt, dws

Sketch文档:sketch

网页文件:html, htm, mht, eml

图片文件:png, jpg, jpeg, gif, tif, tiff, bmp, psd, ai等所有常见图片格式

文本文件:txt, rtf, java, js, c, cpp, jsp, css, xml, properties, log等所有文本格式

网址网页:url(例如:http://www.baidu.com)

 

一图抵千言,实际效果演示:

原word文档(2页,含各种空格换行格式):

 

转为HTML效果(上下浏览模式,手机电脑自适应显示,文字可选):

转换结果是单个HTML文件,方便拷贝,放到哪里都能用。源文档怎么显示,HTML就怎么显示,格式完全保留。

 

支持OCR识别图片内的文字转为网页内可搜索可选择的文字,支持斜的文字摆正,支持去除图片背景只显示文字。

支持单张图或多张图转为网页,支持几乎所有图片格式。

转换速度快,10张分辨率1080p图片做OCR转为HTML平均只要15秒左右。

 

简单使用方式:

先调用转换接口进行转换(最快捷的是文档转换GET),传入的type是源文档的类型,比如要把docx转为htmltype就传docx,调用成功获得token。可以用token轮询“查询query接口”获得结果,也可以设置callbackurl等转换完成主动通知。由于转换需要时间,文件越大页数越多,转换越久,故需要等待转换结束后获得结果,详细见文档说明。

查询转换进度接口:
https://api.duhuitech.com/q?token=xxx

详细信息见使用指南文档。

 

多张图片转换,见:多张图片转换POST

传入的Body为JSON格式,如下:

{ "url": [ "string数组,要转换的图片URL数组" ], "type": "要转换的文档扩展名"}

注意Header中的Content-Type传入application/json

 

再例如要把多张图片OCR,变为文字可选的HTML,并且将斜的文字矫正,将图片背景去除,那么JSON就是:
{ "url": [ "http://xxx/xxx1.png","http://xxx/xxx2.png" ], "ocr": 1, "deskew": 1, "clean": 1 }

 

支持从OSS内网直接下载文件,节约流量,详细见文档

更多精彩功能请查阅文档或来电咨询4009030002 转15343

 

·      GET方法文件大小最高1000M,POST方法文件最大8M。
·      转换完成后,请于2小时内下载转换结果,文件不保存,过期自动删除。
·      Query得到的转换结果下载链接有效期300秒,超过需重新Query。

售后支持范围

售后服务范围为产品使用方面的技术支持,售后支持时间范围为合同期范围内
热搜类目 热搜产品 快速入口