申请/专利权人:绿市广场有限公司
申请日:2018-11-09
公开(公告)日:2024-03-08
公开(公告)号:CN111316274B
主分类号:G06F21/62
分类号:G06F21/62
优先权:["20171122 US 15/820,790"]
专利状态码:有效-授权
法律状态:2024.03.08#授权;2022.03.18#专利申请权的转移;2020.07.14#实质审查的生效;2020.06.19#公开
摘要:接收与一个或多个数据存储库相关联的第一数据集合。识别向量空间中从第一数据集合的一个子集的表示到另一数据集合的至少第二表示的距离。响应于识别出所述距离,使所述第一数据集合匿名化。匿名化包括将噪声添加到第一数据集合中的至少一些数据。
主权项:1.一种用于数据匿名化的方法,包括:接收与一个或多个数据存储库相关联的第一数据集合;通过至少一个单词嵌入向量模型处理所述第一数据集合的一个或多个字符串,所述处理包括使所述一个或多个字符串的至少一个表示被映射到向量空间中;确定所述至少一个表示在所述向量空间中的最接近的邻居;以及至少基于所述一个或多个字符串通过所述至少一个单词嵌入向量模型的处理来匿名化所述第一数据集合,所述匿名化包括抑制第一属性的一个或多个值并且不抑制第二属性的一个或多个特定值,所述匿名化包括利用所述最接近的邻居作为表示所述一个或多个字符串的值。
全文数据:
权利要求:
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。