买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】文件比对系统_本田技研工业株式会社_202010939312.4 

申请/专利权人:本田技研工业株式会社

申请日:2020-09-09

公开(公告)日:2024-04-30

公开(公告)号:CN112527952B

主分类号:G06F16/33

分类号:G06F16/33;G06F40/194;G06F40/284

优先权:["20190918 JP 2019-169708"]

专利状态码:有效-授权

法律状态:2024.04.30#授权;2021.04.06#实质审查的生效;2021.03.19#公开

摘要:本发明提供一种文件比对系统,在对成为对象的文件进行比对时,可容易地推算所述文件的类似率。从被检验文件Dt及参照文件Dr各自中,提取指定种类的单词例如名词的序列集合来分别作为序列化被检验文件nt及序列化参照文件nr。将序列化被检验文件nt及序列化参照文件nr的共同单词集合C所含的单词作为命题而定义为真True,将除此以外的单词作为命题而定义为假False。进而,在作为命题而定义为假的单词中,包含所述单词的第一指定长度的单词序列中,作为命题而定义为真的单词的比率为第一指定值以上的情况下,将所述单词再定义为通配符#,且作为命题而再定义为真。

主权项:1.一种文件比对系统,其特征在于,包括:序列化文件提取元件,从被检验文件Dt及参照文件Dr各自中,提取指定种类的单词的序列集合来分别作为序列化被检验文件nt及序列化参照文件nr;第一命题定义元件,将由所述序列化文件提取元件所提取的所述序列化被检验文件nt及所述序列化参照文件nr的共同单词集合所含的单词作为命题而定义为真,将除此以外的单词作为命题而定义为假,并且,在包含作为命题而定义为假的单词的第一指定长度的单词序列中,作为命题而定义为真的单词的比率为第一指定值以上的情况下,将所述第一指定长度的单词序列中作为命题而定义为假的单词再定义为通配符,且作为命题而再定义为真;比较用单词序列提取元件,从所述序列化被检验文件nt及所述序列化参照文件nr各自中,分别提取比较用被检验单词序列nt*及比较用参照单词序列nr*,所述比较用被检验单词序列nt*及比较用参照单词序列nr*包含由所述第一命题定义元件作为命题而定义为真的单词的序列集合;以及类似率推算元件,将由所述比较用单词序列提取元件所提取的比较用被检验单词序列nt*及比较用参照单词序列nr*进行比对,在视为被定义为所述通配符的单词与所有单词一致时的单词序列的连续一致部位的长度为基准值以上的情况下,基于所述连续一致部位所含的单词数及各单词的字符数中的至少一者,来推算所述被检验文件Dt及所述参照文件Dr的类似率。

全文数据:

权利要求:

百度查询: 本田技研工业株式会社 文件比对系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。