买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】PDF文件转换为分页HTML文件的方法及计算机设备_深圳市世强元件网络有限公司_202110163273.8 

申请/专利权人:深圳市世强元件网络有限公司

申请日:2021-02-05

公开(公告)日:2024-03-19

公开(公告)号:CN112818274B

主分类号:G06F16/957

分类号:G06F16/957;G06F16/958;G06F40/151;G06F40/114

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2021.06.04#实质审查的生效;2021.05.18#公开

摘要:本发明涉及一种PDF文件转换为分页HTML文件的方法及计算机设备。该方法包括:S1、接收PDF文件,将PDF文件转换为单个HTML文件和多个字体文件,每个字体文件包含PDF文件中一类字体;S2、解析HTML文件后分离出CSS文件、JavaScript文件以及多个HTML子文件,PDF文件的每一页对应一个HTML子文件;将多个字体文件合并为单个文字页面文件;S3、存储CSS文件、JavaScript文件、多个HTML子文件和文字页面文件。本发明将PDF文件转换为分页HTML文件后,不需要浏览器安装PDF插件,且每次仅加载一页内容,加载速度快,使用流量少。

主权项:1.一种PDF文件转换为分页HTML文件的方法,其特征在于,包括:S1、接收PDF文件,将所述PDF文件转换为单个HTML文件和多个字体文件,每个所述字体文件包含所述PDF文件中一类字体;S2、解析所述HTML文件后分离出CSS文件、JavaScript文件以及多个HTML子文件,所述PDF文件的每一页对应一个所述HTML子文件;将多个所述字体文件合并为单个文字页面文件,其中,每个所述HTML子文件的命名中包含对应的页码信息;S3、存储所述CSS文件、所述JavaScript文件、多个所述HTML子文件和所述文字页面文件;S4、服务器接收PDF文件访问请求,查找与所述PDF文件访问请求对应的所述CSS文件、所述JavaScript文件、所述文字页面文件和其中一个所述HTML子文件,将查找所得文件下发至浏览器,其中,所述PDF文件访问请求包含页码信息;S5、所述浏览器加载所述CSS文件、所述JavaScript文件、所述文字页面文件和所述HTML子文件,所述HTML子文件显示所述PDF文件的一页内容,其中,在初次加载所述CSS文件和所述JavaScript文件时,建立网页基本参数和环境,后续再显示所述PDF文件的其他页码时,无需再加载所述CSS文件和所述JavaScript文件,且所述服务器无需再将所述CSS文件、所述JavaScript文件和所述文字页面文件下发至所述浏览器;S6、所述服务器接收页面继续访问指令,查找与所述页面继续访问指令对应的所述HTML子文件,并下发至所述浏览器;在所述步骤S6中,在所述查找与所述页面继续访问指令对应的所述HTML子文件之前还包括:判断当前访问用户是否具有继续阅读权限;若是,则查找与所述页面继续访问指令对应的所述HTML子文件;S7、所述浏览器接收并显示所述HTML子文件对应的所述PDF文件的一页内容;所述浏览器在显示页面中的文字时,加载所述文字页面文件中对应页码的内容;所述浏览器在显示页面中的文字时,将所述文字页面文件中的文字格式转换为网页文字格式显示;若所述浏览器在显示页面中的文字时出现乱码,则按照所述文字页面文件中的文字格式重新渲染。

全文数据:

权利要求:

百度查询: 深圳市世强元件网络有限公司 PDF文件转换为分页HTML文件的方法及计算机设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。