买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】自然语言处理中的文本相似度保密计算方法及设备_内蒙古科技大学_202310060099.3 

申请/专利权人:内蒙古科技大学

申请日:2023-01-17

公开(公告)日:2024-03-26

公开(公告)号:CN116204918B

主分类号:G06F21/62

分类号:G06F21/62;G06F21/60;G06F21/71;G06F21/55

优先权:

专利状态码:有效-授权

法律状态:2024.03.26#授权;2023.06.20#实质审查的生效;2023.06.02#公开

摘要:自然语言处理中的文本相似度保密计算方法及设备,涉及计算机与自然语言处理技术领域。本发明为了解决自然语言处理中文本匹配的相似程度,从而进一步高效的计算两段文本中字符串对应位相同个数的问题。本发明针对待进行相似度保密计算的两个文本,假设Alice和Bob各自有一条长度为l的文本序列,Alice和Bob分别将自己的文本序列进行十进制编码得到序列X和Y;Alice和Bob基于半诚实模型或恶意模型保密地计算序列X和序列Y的相似度HMDX,Y。本发明适用于文本相似度保密计算。

主权项:1.自然语言处理中的文本相似度保密计算方法,其特征在于:针对待进行相似度保密计算的两个文本,在半诚实模型下保密计算文本序列相似度:假设第一参与者和第二参与者各自有一条长度为l的文本序列,为了保密计算两文本的匹配程度,第一参与者和第二参与者分别将自己的文本序列进行十进制编码得到序列X=a1,a2,…,al和Y=b1,b2,…,bl;第一参与者和第二参与者保密地计算序列X和序列Y的相似度,相似度用汉明距离HMDX,Y表示,具体协议如下:输入:第一参与者的序列X=a1,a2,…,al,第二参与者的Y=b1,b2,…,bl;输出:HMDX,Y;准备阶段:利用NTRU加密算法,第一参与者选择多项式fx、gx,然后计算fx的两个模逆fpx、fqx,其中fx和fpx作为私钥;第一参与者计算公钥多项式hx=p·fqx*gxmodq,并将hx发送给第二参与者;其中,p、q为两个大素数,且q>>p,mod表示求余函数;然后进行文本相似度保密计算,具体包括以下步骤:1第一参与者在多项式环RP上随机选择l个多项式raixi=1,2,…,l,利用随机多项式raix和公钥hx逐项加密序列X上的每一个元素ai,得到长度为l的加密向量EX=Ea1,Ea2,…,Eal,加密过程如下:Eai=raix*hx+aimodq,其中i=1,2,…,l,第一参与者将EX发送给第二参与者;2第二参与者收到EX后,执行以下步骤:2.1首先在多项式环RP上随机选择l个多项式rbixi=1,2,…,l,利用随机多项式rbix和第一参与者的公钥hx逐项加密序列Y上的每一个元素的相反数,得到长度为l的加密向量E-Y=E-b1,E-b2,…,E-bl,加密过程如下:E-bi=rbix*hx-bimodq,其中i=1,2,…,l;2.2将两个向量EX和E-Y相加,得到长度为l的加密向量EX+E-Y=Ea1+E-b1,Ea2+E-b2,…,Eal+E-bl;2.3随机选取集合{1,2,…,l}中的随机置乱排序T,对EX+E-Y进行置换得到TEX+E-Y,其中:TEX+E-Y=EaT1+E-bT1,EaT2+E-bT2,…,EaTl+E-bTl,其中,aTi为ai随机置乱后的排序,bTi为bi随机置乱后的排序;然后将TEX+E-Y发送给第一参与者;3第一参与者得到TEX+E-Y后,利用自己的私钥fx,依次解密TEX+E-Y中的每一个元素,得到:TX-Y=aT1-bT1,aT2-bT2,…,aT5l-bT5l,然后将TX-Y中所有为“0”的元素个数即为HMDX,Y,将计算结果HMDX,Y告诉第二参与者。

全文数据:

权利要求:

百度查询: 内蒙古科技大学 自然语言处理中的文本相似度保密计算方法及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。