买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种OFD版式电子文档隐藏信息提取嵌入方法_北京点聚信息技术有限公司_202410123051.7 

申请/专利权人:北京点聚信息技术有限公司

申请日:2024-01-30

公开(公告)日:2024-04-05

公开(公告)号:CN117648681B

主分类号:G06F21/16

分类号:G06F21/16

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2024.03.22#实质审查的生效;2024.03.05#公开

摘要:本发明涉及文档信息处理技术领域,具体涉及一种OFD版式电子文档隐藏信息提取嵌入方法,该方法包括:获取OFD版式电子文档;结合OCR算法提取隐写载体文本,并获取汉字初始分组;对汉字初始分组汉字与汉字成词的字频特征构建字频共现粘连度;构建汉字笔画对照矩阵;获取各汉字的汉字笔画矩阵以及笔形顺序序列;对汉字初始分组各汉字与其他汉字之间的差异特征进行分析,获取汉字笔法隐写嵌入评价因子;完成各段落的分组;结合各汉字的汉字笔法隐写嵌入评价因子完成隐藏信息的嵌入。本发明旨在解决因汉字分组不均造成的汉字隐写嵌入不均和易被检测的缺陷,从而提高隐藏信息的嵌入质量。

主权项:1.一种OFD版式电子文档隐藏信息提取嵌入方法,其特征在于,该方法包括以下步骤:获取OFD版式电子文档;采用OCR算法提取OFD版式电子文档各句子序列组成隐写载体文本;将隐写载体文本中同一句子的汉字作为汉字初始分组;根据各汉字在文本和段落中的分布获取汉字字频表;对于载体文本中的各汉字初始分组;根据汉字初始分组各汉字在汉字字频表中的字频特征获取汉字初始分组各汉字的字频联合系数;根据汉字初始分组各汉字与其余汉字组成词的概率结合各汉字的字频联合系数获取汉字初始分组中各汉字的字频共现粘连度;根据隐写载体文本中所有汉字的笔画特征构建汉字笔画对照矩阵;根据汉字初始分组各汉字的笔画特征结合汉字笔画对照矩阵获取各汉字的汉字笔画矩阵以及笔形顺序序列;根据汉字初始分组各汉字的汉字笔画矩阵以及字频共现粘连度获取汉字初始分组各汉字的汉字笔画双端区分度;根据汉字初始分组各汉字与其他汉字之间的笔画矩阵、笔形顺序序列的差异特征结合汉字笔画双端区分度获取汉字初始分组各汉字的汉字笔法隐写嵌入评价因子;根据隐写载体文本各段落中汉字的汉字笔法隐写嵌入评价因子分布特征完成各段落的分组;结合各汉字的汉字笔法隐写嵌入评价因子完成隐藏信息的嵌入;所述根据各汉字在文本和段落中的分布获取汉字字频表,具体包括:对于隐写文本中的各汉字;将各汉字在其段落出现的概率作为各汉字的段概率;将各汉字在全文出现的概率作为各汉字的文概率;将所有汉字的段概率和文概率组成的表保存为汉字字频表;所述根据汉字初始分组中各汉字在汉字字频表中的字频特征获取汉字初始分组中各汉字的字频联合系数,具体为:获取各汉字在汉字字频表中的段概率和文概率;预设第一权重调节因子和第二权重调节因子;计算各汉字所述段概率与所述第一权重调节因子的乘积;计算各汉字所述文概率与所述第二权重调节因子相乘的结果;将所述乘积与所述结果的和值作为各汉字的字频联合系数;所述根据汉字初始分组中各汉字与其余汉字组成词的概率结合各汉字的字频联合系数获取汉字初始分组中各汉字的字频共现粘连度,具体为:预设词的长度记为,其中,词的长度为词包含的汉字个数;第k个汉字初始分组第i个汉字的字频共现粘连度的字频共现粘连度,表达式为: 式中,表示第k个汉字初始分组第i个汉字的字频联合系数,、、分别表示第k个汉字初始分组中第i个汉字、第i-1个汉字、第i-n-1个汉字,表示计数函数;所述根据汉字初始分组各汉字与其他汉字之间的笔画矩阵、笔形顺序序列的差异特征结合汉字笔画双端区分度获取汉字初始分组各汉字的汉字笔法隐写嵌入评价因子,具体步骤包括:针对第k个汉字初始分组中第i个汉字;第k个汉字初始分组中第i个汉字的笔法惩罚因子,表达式为: 式中,表示第k个汉字初始分组内汉字的个数,、分别表示在隐写载体文本中第k个汉字初始分组中第j个、第i个汉字的笔形顺序序列,表示DTW距离,、分别表示在隐写载体文本中第k个汉字初始分组中第j个、第i个汉字的笔画矩阵,表示矩阵的L1范数;将所述笔法惩罚因子作为以自然常数为底数的指数函数的指数;计算所述指数函数与所述汉字的汉字笔画双端区分度的乘积;获取所述汉字的笔形顺序序列的长度;计算以2为底数,所述长度与1的和值为真数的对数函数值;将所述乘积与所述对数函数值的比值作为所述汉字的汉字笔法隐写嵌入评价因子。

全文数据:

权利要求:

百度查询: 北京点聚信息技术有限公司 一种OFD版式电子文档隐藏信息提取嵌入方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。