买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于同义词生成及哈希运算的文本水印方法_福建师范大学_202410013402.9 

申请/专利权人:福建师范大学

申请日:2024-01-04

公开(公告)日:2024-03-29

公开(公告)号:CN117786629A

主分类号:G06F21/16

分类号:G06F21/16;G06F40/247;G06F40/284;G06F40/166

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明公开基于同义词生成及哈希运算的文本水印方法,针对每个单句找出关键词。判断关键词相邻位置的单词的词性是否在词性排除列表;如果是,则选择句中与关键词存在最高语法依赖关系的单词作为相关词,生成相关词同义词候选集;否则,以相邻词作为相关词生成同义词候选集;使用随机数生成方法生成数值r作为索引从同义词候选集中选择同义词替换相关词。将关键词和被选中的同义词进行拼接并执行hash运算,再对4求余得到的数值转换成第一二进制编码。找到可疑文本的关键词和相关词,采用相同方法计算第二二进制编码。将第二二进制编码与第一二进制编码进行比对,计算比特错误率;当错误率小于阈值则声明对可疑文本的所有权。本发明便于提取多比特水印信息。

主权项:1.基于同义词生成及哈希运算的文本水印方法,其特征在于:其包括以下步骤:步骤S1:针对文本中的第i个单句Seni找出关键词wsj;wsj表示单句Seni的第j个单词;步骤S2:判断关键词wsj的相邻位置的单词wsj+1的词性是否为词性排除列表中的一员。若不是,则pos=j+1;否则,选择Seni中与关键词wsj存在最强语法依赖关系的关联单词wsx,令pos=x;其中,wsx为最高蕴含得分的关联单词;x为关联单词wsx的位置;步骤S3:针对选中的单词wspos,使用预训练的填充模型来生成水印集的候选得到同义词集合can_w;步骤S4:采用随机数生成方法生成一个小于等于候选集长度v的数值r;从候选集中选择以r为索引的同义词wcr,用于替换选中的相关词wspos,得到含有“水印”的文本T’;步骤S5:针对T’中的各个单句Seni’的关键词wsj及新的相关词wcr进行拼接后执行哈希计算,将得到的哈希值与4进行求余并转换得到第一二进制编码,将第一二进制编码追加在单句Seni’的末尾得到含有“水印”及哈希值的文本T”;步骤S6:获取可疑文本Tsus找出的第i个可疑单句Sensus_i中的关键词及相关词,进行相同的哈希及求余计算,得到对应于Sensus_i的第二二进制编码;步骤S7:将第二二进制编码与第一二进制编码进行比对,计算比特错误率;当比特错误率小于阈值ε时,则声明对该可疑文本的所有权。

全文数据:

权利要求:

百度查询: 福建师范大学 基于同义词生成及哈希运算的文本水印方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。