【发明公布】一种基于自然语言处理的隐私政策摘要方法_天津大学_202011192179.7

导航：龙图腾网> 最新专利技术> 一种基于自然语言处理的隐私政策摘要方法_天津大学_202011192179.7

申请/专利权人：天津大学

申请日：2020-10-30

公开（公告）日：2021-01-08

公开（公告）号：CN112199727A

主分类号：G06F21/62(20130101)

分类号：G06F21/62(20130101);G06N3/04(20060101)

优先权：

专利状态码：有效-授权

法律状态：2022.04.15#授权;2021.01.26#实质审查的生效;2021.01.08#公开

摘要：本发明公开了一种基于自然语言处理的隐私政策摘要方法，步骤1、进行数据收集，包括有标注的、数据量大的文本摘要数据作为源域数据和包括隐私政策摘要数据的目标域数据；步骤2、建立引入Attention层的Seq2seq机制和PointerGenerator机制的训练模型结构；步骤3、进行训练，实现对隐私政策生成简短的摘要。与现有技术相比，本发明1首次实现对隐私政策生成简短的摘要；能够大大提高隐私政策的可读性，增强了用户对数据收集方的隐私数据操作的了解程度，更加清晰地了解数据收集方如何收集使用自己的个人信息；3帮助数据收集方直接生成带有摘要的隐私政策。

主权项：1.一种基于自然语言处理的隐私政策摘要方法，其特征在于，该方法具体包括以下流程：步骤1、进行数据收集，包括有标注的、数据量大的文本摘要数据作为源域数据和包括隐私政策摘要数据的目标域数据；步骤2、建立引入Attention层的Seq2seq机制和PointerGenerator机制的训练模型结构：在Hidden层中，Encoder端使用的是BiLSTM模型，Decoder端使用的是LSTM模型；模型的输入x＝x1，x2，...，xJ，，通过WordEmbedding层将输入向量化，然后进入Hidden层中的Encoder端，得到输出具体公式如下： ct＝ftct-1+itgtht＝ottanhct其中，it表示输入门，决定哪些信息需要更新；ft表示遗忘门，决定哪些数据从细胞单元中抛弃；ot表示输出门，决定当前细胞输出哪些信息，gt是候选状态，是被选地用来更新的内容；权重Wii、Wif、Wio、Wig、Whi、Whf、Who、Whg和向量bii、bif、bio、big、bhi、bhf、bho、bhg是模型参数，表示输入xt的WordEmbedding，ct表示神经元状态；通过以上的公式得到经过Decoder端的隐层状态带有注意力机制的Encoder端-Decoder端，从序列中学习到每一个元素的重要程度，然后按重要程度将元素合并；注意力机制是作为Encoder端和Decoder端之间的接口，向Decoder端提供来自每个Encoder端隐藏状态的信息；Hidden层得到经Encoder端的输出he和经Decoder端的输出hd，作为Attention层的输入，首先计算出的值，表示一个对齐模型，用于衡量Encoder端的位置j的词；计算公式如下：其中，valign和Walign表示权重参数，向量balign是模型参数；计算注意力权重通过注意力权重得到目标单词的Contextvector对Encoder输出的隐层状态hiddenstate的加权平均，公式如下：联合Decoder端的隐层状态计算注意力隐层状态计算词汇分布Pvocab，t：当时间戳t＞1时，Decoder端的隐层状态的计算公式为： PointerGenerator机制通过计算生成概率Pgen，t从而决定是从输入文本中直接复制一个单词或者从词汇分布Pgen，t生成一个单词；Pgen，t的计算公式如下：其中，Ws，z，Ws，h，Ws，E和bs是学习参数，σ是sigmoid激活函数；此时，最终的词汇分布Pgyt和注意力分布Pcyt按照如下公式进行定义：最终的词汇分布的计算公式如下：通过最终的词汇分布确定本模型的输出，输出摘要文本y：y＝y1，y2，...yT步骤3、进行训练，实现对隐私政策生成简短的摘要，包括：对源域数据实现利用步骤2的模型进行初始训练；利用源域数据训练得到的模型参数作为目标域训练的模型参数的初始值，将收集到的目标域数据按照8∶1∶1的比例划分为训练集、测试集、验证集，按照十交叉验证的方式对模型继续训练，对参数进行微调，此时学习率设置为0.2，批处理大小为64。

全文数据：

权利要求：

百度查询：天津大学一种基于自然语言处理的隐私政策摘要方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

下一篇：一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

相关技术

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

一种园林绿化便携铲_马丽丽_202322375183.2

交通工具用座椅倾斜装置_丰田纺织株式会社_202080082271.X

一种抑菌保暖女式羊绒大衣_安庆初颖数字科技有限公司_202322077610.9

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

一种纸箱生产用贴标机_浙江华信科技发展有限公司_202322178698.3

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

隐私相关技术

隐私盖组件和摄像头_浙江大华技术股份有限公司_202322572095.1

隐私盖组件和摄像头_浙江大华技术股份有限公司_202322566179.4

隐私信息保护方法、装置、设备、介质、程序产品以及车辆_北京罗克维尔斯科技有限公司_202211297295.4

用于通信网络中隐私保护路由的设备和方法_华为技术有限公司_202180102127.2

一种智能合约去摇摆位置隐私保护方法_贵州大学_202110543249.7

基于账户区块链的可问责隐私保护智能合约实现方法_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202311522961.4

基于语义和预测的轨迹差分隐私保护方法及系统_福建工程学院_202210190712.9

基于子集的隐私数据验证方法_南京理工大学_202211000771.1

一种基于R-邻域关系与差分隐私的四分树隐私保护方法_国网江苏省电力有限公司营销服务中心_202111006902.2

一种区块链隐私保护方法及装置_航天信息股份有限公司_201911416298.3

政策相关技术

政策兑现方法、装置、设备及存储介质_中国建设银行股份有限公司_202311734978.6

一种基于惠企政策业务的实时推荐方法、装置和存储介质_数字郑州科技有限公司_202311774124.0

一种移动应用中文隐私政策收集个人信息合规性检测方法_湘潭大学_202311842713.8

一种政策的智能匹配和推送系统_海创汇科技创业发展股份有限公司_202311155876.9

一种面向大规模政策文本的实体关系抽取方法和装置_北京市科学技术研究院_202410007888.5

一种基于政策与企业大数据的精准匹配系统_湖南狮桥科技信息有限公司_202311781701.9

一种政策解读方法、装置及存储介质_银保云计算技术有限公司_202311560789.1

一种可依据业务及政策配置规则的临床用药辅助方法及终端_深圳坐标软件集团有限公司_202110017630.X

一种基于知识图谱的电力营销政策文件分析方法_江苏思行达信息技术有限公司_202311688964.5

政策申报规划方法、装置、设备及存储介质_深圳市智慧城市科技发展集团有限公司_202311805088.X

处理相关技术

基板处理设备和基板处理方法_细美事有限公司_202311345152.0

影像处理装置及影像处理方法_纬创资通股份有限公司_202211404107.3

信息处理系统、信息处理方法以及信息处理装置_丰田自动车株式会社_202311325525.8

有机废气处理设备及有机废气处理组件_无锡博洋环境工程有限公司_202322538306.X

数据信号处理方法和数据信号处理装置_铠强科技(平潭)有限公司_202310730790.8

杯、液处理装置以及液处理方法_东京毅力科创株式会社_202311358288.5

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

信息处理装置、信息处理方法以及程序_索尼公司_201880080945.5

医用图像处理装置以及医用图像处理方法_富士胶片医疗健康株式会社_202010503352.4

热处理炉_NGK(苏州)热工技术有限公司_202322575176.7

龙图腾网&IPTOP

【发明公布】一种基于自然语言处理的隐私政策摘要方法_天津大学_202011192179.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务