买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于深度学习技术自动屏蔽扫描文件敏感内容的方法_广东力迅信息技术有限公司_202410085216.6 

申请/专利权人:广东力迅信息技术有限公司

申请日:2024-01-21

公开(公告)日:2024-04-12

公开(公告)号:CN117874822A

主分类号:G06F21/62

分类号:G06F21/62;G06V30/19

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.30#实质审查的生效;2024.04.12#公开

摘要:本发明提供了一种基于深度学习技术自动屏蔽扫描文件敏感内容的方法,涉及文件扫描技术领域,包括:S1、建立敏感词汇数据库和学习模型;S2、扫描模块,通过扫描模块扫描文件;S3、建立分析模块,扫描数据与数据库内容对比;S4、建立文字替换模块,对敏感内容进行替换;S5、整理模块,进行文字数据整合排版,并通过输出模块输出。该种能够通过敏感词汇数据库的建立,在将证件等证明文件转换为扫描件时,直接对敏感内容进行替换屏蔽,保护了个人隐私和商业隐私。

主权项:1.一种基于深度学习技术自动屏蔽扫描文件敏感内容的方法,其特征在于,包括:S1、建立敏感词汇数据库和学习模型;S2、扫描模块,通过扫描模块扫描文件;S3、建立分析模块,扫描数据与数据库内容对比;S4、建立文字替换模块,对敏感内容进行替换;S5、整理模块,进行文字数据整合排版,并通过输出模块输出。其中,S1的具体步骤如下:S11、建立敏感词汇数据库,并将已知的敏感词汇、字句、段落等输入到数据库内;S12、建立屏蔽内容替换数据库,输入敏感词汇替换符号,让符号或字样来替代屏蔽内容;S13、建立次级学习模型,通过扫描相似的敏感内容进行学习,更新敏感词汇数据库。

全文数据:

权利要求:

百度查询: 广东力迅信息技术有限公司 一种基于深度学习技术自动屏蔽扫描文件敏感内容的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。