买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于HTML代码的网页水印的嵌入与提取方法_南通大学_201810067125.4 

申请/专利权人:南通大学

申请日:2018-01-23

公开(公告)日:2020-01-10

公开(公告)号:CN108363910B

主分类号:G06F21/16(20130101)

分类号:G06F21/16(20130101)

优先权:

专利状态码:有效-授权

法律状态:2020.01.10#授权;2018.08.28#实质审查的生效;2018.08.03#公开

摘要:本发明涉及基于HTML代码的网页水印的嵌入方法,包括如下步骤:步骤1)对水印信息进行预处理,将水印字符串转换成一定形式的编码,所述编码由若干码元组成;步骤2)设定若干空样式,每个空样式对应一所述码元,形成一个空样式表;步骤3)将空样式作为一个叠加的样式嵌入到当前网页的HTML代码中已存在的样式之后。有益效果:本方法以空样式的方式将水印嵌入到网页的HTML代码中,不易被察觉和发现,具有很好的隐蔽性。

主权项:1.一种基于HTML代码的网页水印的嵌入方法,其特征在于包括如下步骤:步骤1)对水印信息进行预处理,将水印字符串转换成一定形式的编码,所述编码由若干码元组成;步骤2)设定若干空样式,所述空样式的内容均不进行定义,每个空样式唯一地对应一所述码元,形成一个空样式表;步骤3)将水印字符串编码中每个码元对应的空样式作为一个叠加的样式,按码元排列的先后顺序逐个嵌入到当前网页HTML代码中已存在的各个样式之后。

全文数据:一种基于HTML代码的网页水印的嵌入与提取方法技术领域[0001]本发明涉及互联网安全领域,尤其涉及一种基于HTML代码的网页水印的嵌入与提取方法。背景技术[0002]随着信息技术和互联网的普及发展,网页的非法复制、网页的仿冒现象日益严重,是一个亟待解决的问题。[0003]由于本发明涉及到网页HTML代码中的样式,在阐述本发明的技术方案之前,简要对样式做一说明:网页是一种存储在Web服务器上,通过网络进行传输,被浏览器解析和显示的文档类型,其内容由HTML语言构成。网页的样式是使网页页面显示达到一定效果的辅助代码,它可以改变网页中元素的外观,如按钮的颜色、表格的大小等。网页的样式一般会用层叠样式表CSS进行封装,将一系列样式封装在一起放在CSS文件中。HTML使用样式名调用封装的样式,显示样式所定义的外观。例如样式调用〈divclass=“suspendsusp_nav”content〈div,其中suspend和susp_nav是两个封装好的样式,diV层中的content的显示效果就是这两个样式效果的叠加效果。样式通常由样式名和表示样式内容的定义构成。[0004]网页水印是近年来出现的保护网页的一项技术,它通过某种方式在网页中嵌入版权标识信息或身份认证信息(水印),当发现网页遭到非法复制或仿冒时,可以提取这些信息来证明网页的版权归属,鉴别网页的真伪,确认非法复制和仿冒行为。除此之外,网页水印技术还可用于网页防篡改、在网页中隐藏和传递秘密信息等。[0005]与传统的图像、视频和音频水印技术的研究相比,网页水印技术的研究目前还很少。网页的构造与图像、音频文件不同,常用的图像和音频水印技术不适用于网页水印。另一方面,表示网页的HTML代码结构简单、冗余度少,在网页中嵌入水印难度较大。现有的一些网页水印方法主要是通过改变标签名或属性名的大小写、改变空格的个数、使用不同的代码格式等方法嵌入水印。这些方法存在明显的不足,嵌入的水印信息与HTML代码内容严重脱离,隐蔽性不好,容易受到代码检测和代码过滤的攻击,有的方法水印信息的嵌入点很少,水印信息容量小。发明内容[0006]本发明目的在于克服上述现有技术的不足,提供了一种基于HTML代码的网页水印的嵌入与提取方法,具体由以下技术方案实现:[0007]所述基于HTML代码的网页水印的嵌入方法,包括如下步骤:[0008]步骤1对水印信息进行预处理,将水印字符串转换成一定形式的编码,所述编码由若干码元组成;[0009]步骤2设定若干空样式,所述空样式的内容均不进行定义,每个空样式唯一地对应一所述码元,形成一个空样式表;[0010]步骤3将水印字符串编码中每个码元对应的空样式作为一个叠加的样式,按码元排列的先后顺序逐个嵌入到当前网页HTML代码中已存在的各个样式之后。[0011]所述的基于HTML代码的网页水印的嵌入方法的进一步设计在于,所述步骤1中对水印信息进行预处理采用UNICODE编码,形成十六进制的水印信息码串。[0012]所述的基于HTML代码的网页水印的嵌入方法的进一步设计在于,编码由十六个码兀表不。[0013]所述的基于HTML代码的网页水印的嵌入方法的进一步设计在于,所述空样式的名称与网页现有的样式名不相同。[0014]根据所述的基于HTML代码的网页水印的嵌入方法,提供一种对应的水印提取方法,其特征在于包括如下步骤:[0015]步骤a提取空样式:根据空样式表中的样式名,从网页的HTML代码中依次提取出每个空样式;[0016]步骤b生成水印信息码串:对照空样式表,将提取的每个空样式转换成对应的码元,并将所述码元按对应空样式的提取顺序拼接形成水印信息码串;[0017]步骤c生成原始水印信息:根据编码的形式将水印信息码串转换成对应的水印信息字符串。[0018]本发明的优点如下:[0019]本发明提出的网页水印技术将水印信息以空样式的方式嵌入到网页的HTML代码中,不易被察觉和发现,具有很好的隐蔽性。嵌入的水印具有良好的抗攻击性,包括抗检测性和抗过滤性。由于样式内容的定义通常存放在CCS文件中,水印的攻击者根据HTML代码难以区分出其中的真实样式和空样式,无法检测到空样式的存在。如果试探性地修改样式名,会有很大的风险,若是改动了真实的样式名,会对页面的显示效果产生很大的影响,因此很难用过滤系统去除网页中的空样式。同时,这种方法也有足够的水印信息嵌入空间,因为样式在网页的HTML代码中大量的存在。附图说明[0020]图1为原始网页页面截图。[0021]图2为水印信息预处理示意图。[0022]图3为嵌入水印后的网页页面截图。[0023]图4为水印提取过程示意图。具体实施方式[0024]以下结合附图,对本发明的技术方案进行详细说明。[0025]基于HTML代码的网页水印的嵌入方法,包括如下步骤:基于HTML代码的网页水印的嵌入方法,包括如下步骤:[0026]步骤1对水印信息进行预处理,将水印字符串转换成一定形式的编码,编码由若干码元组成。[0027]步骤1中,为便于嵌入包含中英文在内的水印信息,水印信息预处理采用UNI⑶DE编码,形成十六进制的水印信息码串。如字符串“copyright南通大学”,转换为UNICODE码为:[0028]\u0063\u006f\u0070\u0079\u0072\u0069\u0067\u0068\u0074\u5357\u901a\u5927\u5b66[0029]去除每个字符编码的码头\u,得到处理后的水印信息:[0030]0063006f00700079007200690067006800745357901a59275b66〇[0031]当然本发明也可以ASCII编码方式进行编码,由于该编码方式为本领域技术人员的常规技术手段,故在此不再赘述。[0032]步骤2设定若干空样式,每个空样式与上述构成水印信息字符串的码元一一对应,形成一个空样式与码元的对应表。[0033]步骤2中,空样式定义为:一个样式只有样式名,没有内容定义。例如,样式调用〈diVclass=“susp”content〈div,如果CSS文件中没有样式名为susp的样式定义,HTML代码中也没有定义susp的样式,那么susp为空样式。根据CSS规范,HTML中的元素不会匹配错误的或者不存在的样式名,因此上述调用不会进行任何操作。同时,上述调用不违反HTML的语法规范,对网页的运行不会产生任何影响。本发明利用HTML的这种特性,将水印信息转换为自定义的空样式名嵌入到HTML代码中,实现水印的嵌入与提取。[0034]对应于UNICODE编码方式,本实施例的编码由十六个码元表示,码元分别为数字0〜9和字母a〜f,形成的空样式表如表1所示。[0035]表1[0037]进一步的,空样式的样式名称的命名遵循两个方面的原则。一方面,样式的名字与HTML代码的内容要有一定的联系,具有合理性和真实性,让人觉察不到它是空样式,从而使水印具有良好的隐蔽性。另一方面,空样式的名字不能与现有样式的名字相同,如果命名相同,会导致水印信息提取出错。如本实施例以中国某银行官网信用卡页面为水印嵌入对象,其HTML代码中定义了名为“aright”的样式,故可以设计一个名为“bright”的空样式(S卩表1中码元5对应的样式),这个空样式名与真实的样式名很相似,让人难以分辨。[0038]步骤3将水印字符串编码中每个码元对应的空样式作为一个叠加的样式,按码元排列的先后顺序逐个嵌入到当前网页HTML代码中已存在的各个样式之后。[0039]在HTML代码中,网页上要显示的内容通常包含在一个个的层级元素中。例如样式调用〈divclass=“suspend”content〈div,页面上显示的内容content被包含在这个div层之中。其中的class=“suspend”设置了content的样式即外观。可以单独增加一条这样的语句来嵌入空样式,例如嵌入表1中的第一个空样式“susp_nave”,可在原HTML代码中增加一条语句〈divclass=“susp_nave”content〈div。考虑到该方式一方面会增加div、claSS这些与水印信息无关的字符串,增大了网页文件的大小;另一方面,嵌入的语句比较明显,隐蔽性不够好,容易被察觉出来。因此,本实施例利用HTML的样式可以叠加的特点,将空样式作为一个叠加的样式嵌入到已存在的层级之中,而不添加新的语句。例如,将空样式susp_nave嵌入到原有的语句content〈div,在其中原有的样式suspend后面叠加susp_nave,嵌入之后原代码变为〈divclass=“suspendsusp_nave”content〈div,这种嵌入方式增强了隐蔽性,对原HTML代码影响很小。[0040]结合上述基于HTML代码的网页水印的嵌入方法的描述,本实施例选取中国某银行官网信用卡页面进行实验,原始页面的截图如图1所示。[0041]首先,使用包含中英文在内的字符串“copyright南通大学”作为水印信息,将水印信息转换成十六进制的水印信息码串,如图2所示。[0042]接着,通过对该页面HTML代码的分析,设计出如表1所示的水印信息码元对应的空样式。[0043]最后,将水印信息码串中的每个码元转换为对应的空样式,嵌入到HTML代码中。以嵌入前3个码元006为例,给出嵌入前后的HTML代码,如下所示:[0044]嵌入水印前的HTML代码:[0045]〈divid=〃fadee〃class=〃shade〃〈div[0046][0048]嵌入水印后的HTML代码:[0049][0050][0051][0052]如上述代码所示,这3个码元对应的空样式susp_nave、susp_nave和busine_menu分别嵌在原有的样式shade、sidebar和susp_nav的后面。[0053]嵌入水印后的页面如图3所示,对比图1没有发生任何变化。[0054]根据上述的基于HTML代码的网页水印的嵌入方法,本实施例还提出了对应的水印提取方法,包括如下步骤:[0055]步骤a提取空样式:根据表1所示的空样式表中的空样式名,从上述嵌有空样式的网页的HTML代码中依次提取出每个空样式。[0056]步骤b生成水印信息码串:对照上述空样式表,将提取的每个空样式转换成对应的码元,依次连接起来,形成水印信息码串。[0057]步骤c生成原始水印信息:根据水印信息编码所采用的UNICODE编码形式,将水印信息码串转换成对应的水印信息字符串。[0058]本实施例的水印信息提取过程如图4所示,最终成功提取出网页中隐含的水印信息“copyright南通大学”。[0059]以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

权利要求:1.一种基于HTML代码的网页水印的嵌入方法,其特征在于包括如下步骤:步骤1对水印信息进行预处理,将水印字符串转换成一定形式的编码,所述编码由若干码元组成;步骤2设定若干空样式,所述空样式的内容均不进行定义,每个空样式唯一地对应一所述码元,形成一个空样式表;步骤3将水印字符串编码中每个码元对应的空样式作为一个叠加的样式,按码元排列的先后顺序逐个嵌入到当前网页HTML代码中已存在的各个样式之后。2.根据权利要求1所述的基于HTML代码的网页水印的嵌入方法,其特征在于所述步骤1中对水印信息进行预处理采用UNICODE编码,形成十六进制的水印信息码串。3.根据权利要求2所述的基于HTML代码的网页水印的嵌入方法,其特征在于编码由十六个码元表示。4.根据权利要求1所述的基于HTML代码的网页水印的嵌入方法,其特征在于所述空样式的名称与网页现有的样式名不相同。5.如权利要求1-4任一项所述的基于HTML代码的网页水印的嵌入方法的水印提取方法,其特征在于包括如下步骤:步骤a提取空样式:根据空样式表中的样式名,从网页的HTML代码中依次提取出每个空样式;步骤b生成水印信息码串:对照空样式表,将提取的每个空样式转换成对应的码元,并将所述码元按对应空样式的提取顺序拼接形成水印信息码串;步骤c生成原始水印信息:根据编码的形式将水印信息码串转换成对应的水印信息字符串。

百度查询: 南通大学 一种基于HTML代码的网页水印的嵌入与提取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。