买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】电子报版面解析方法、装置、电子设备及存储介质_科技日报社_202311324617.4 

申请/专利权人:科技日报社

申请日:2023-10-13

公开(公告)日:2024-03-29

公开(公告)号:CN117077619B

主分类号:G06F40/106

分类号:G06F40/106;G06F40/151;G06F40/186;G06F40/117

优先权:

专利状态码:有效-授权

法律状态:2024.03.29#授权;2023.12.05#实质审查的生效;2023.11.17#公开

摘要:本申请涉及智能媒体技术领域,提供了一种电子报版面解析方法、装置、电子设备及存储介质。该方法通过将电子报转换为html格式数据,基于获取的电子报的业务规则配置文件确定第一定位参照点,基于第一定位参照点确定各热区的第一计算坐标点,进而确定各版头条,并基于头条的坐标确定第二定位参照点,基于第二定位参照点确定各热区的第二计算坐标点,进而确定电子报的头版底条、二条和竖条,然后在html格式数据中获取对应的热区链接,确定各文章的版面标识,最后将每篇文章的版面标识、文章标识以及正文内容分别保存,得到解析后的电子报,能够实现对电子报的全自动解析,方便快捷,且准确率高。

主权项:1.一种电子报版面解析方法,其特征在于,包括:获取电子报,将所述电子报转换为纯文本html格式数据;获取所述电子报的业务规则配置文件;基于所述电子报的html格式数据中的区域标签确定所述电子报的全部版面热区坐标和热区链接;基于所述业务规则配置文件确定所述电子报各版面的第一定位参照点;基于所述第一定位参照点确定所述电子报中各版面中,各热区的第一计算坐标点;计算各版面中,各热区的第一计算坐标点与对应的第一定位参照点之间的第一距离,确定第一距离最小的热区为该版面的头条;基于所述电子报的头版中各热区的最大横坐标值,确定所述电子报头版的布局类型;基于各版面头条的热区坐标点确定各版面的第二定位参照点;基于所述第二定位参照点确定所述电子报中各版面中,各热区的第二计算坐标点;计算各版面中,各热区的第二计算坐标点与对应的第二定位参照点之间的第二距离,基于所述第二距离和或所述布局类型确定所述电子报的头版底条、二条和竖条;在所述html格式数据中获取所述头条、头版底条、二条和竖条的热区链接,基于所述热区链接确定各热区的文章标识和正文内容,并将所述头条、头版底条、二条或竖条确定为对应文章的版面标识;将每篇文章的版面标识、文章标识以及正文内容分别保存,得到解析后的电子报;其中,所述电子报头版的布局类型包括第一布局类型、第二布局类型和第三布局类型;所述基于所述电子报的头版中各热区的最大横坐标值,确定所述电子报头版的布局类型,包括:响应于所述最大横坐标值大于或者等于三分之二倍所述电子报的最大宽度,且小于或者等于1,确定所述电子报头版的布局类型为第一布局类型;响应于所述最大横坐标值大于或者等于二分之一倍所述电子报的最大宽度,且小于三分之二倍所述电子报的最大宽度,确定所述电子报头版的布局类型为第二布局类型;响应于所述最大横坐标值大于0,且小于二分之一倍所述电子报的最大宽度,确定所述电子报头版的布局类型为第三布局类型;所述基于各版面头条的热区坐标点确定各版面的第二定位参照点,包括:确定所述电子报中,左上坐标点为各版面的原点(0,0);响应于确定所述电子报头版的头版底条,在确定所述布局类型为第一布局类型或者第二布局类型时,确定所述电子报的左下坐标点为所述头版的第二定位参照点,在确定所述布局类型为第三布局类型时,将0为横坐标、纵坐标减少第二常数l得到的坐标点,确定为所述头版的第二定位参照点;响应于确定所述电子报头版的竖条,将电子报最大宽度对应的值作为横坐标、原点减去电子报logo区域高度得到的值作为纵坐标组成的坐标点,确定为所述头版的第二定位参照点;响应于确定所述电子报的二条,将待遍历的热区中的最小横坐标和第一最大纵坐标组成的坐标点确定为对应版面的第二定位参照点;响应于确定所述电子报除头版外其他版面的竖条,将电子报最大宽度对应的值作为横坐标、0为纵坐标组成的坐标点确定为对应版面的第二定位参照点;所述基于所述第一定位参照点确定所述电子报中各版面中,各热区的第一计算坐标点,包括:确定各热区的右上坐标点或者右下坐标点为辅助计算坐标点;将所述辅助计算坐标点的横坐标值减去所述第一定位参照点的横坐标值,纵坐标值减去所述第一定位参照点的纵坐标值,组成的坐标点确定为所述第一计算坐标点;所述基于所述第二定位参照点确定所述电子报中各版面中,各热区的第二计算坐标点,包括:确定各热区的右上坐标点或者右下坐标点为辅助计算坐标点;将所述辅助计算坐标点的横坐标值减去所述第二定位参照点的横坐标值,纵坐标值减去所述第二定位参照点的纵坐标值,组成的坐标点确定为所述第二计算坐标点。

全文数据:

权利要求:

百度查询: 科技日报社 电子报版面解析方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。