【发明授权】一种档案智能分类与检索方法_山东汇商脉网络科技有限公司_202311204538.X

导航：龙图腾网> 最新专利技术> 一种档案智能分类与检索方法_山东汇商脉网络科技有限公司_202311204538.X

申请/专利权人：山东汇商脉网络科技有限公司

申请日：2023-09-19

公开（公告）日：2024-03-22

公开（公告）号：CN117216217B

主分类号：G06F16/332

分类号：G06F16/332;G06F16/33;G06F16/35;G06F40/216;G06F40/289

优先权：

专利状态码：有效-授权

法律状态：2024.03.22#授权;2023.12.29#实质审查的生效;2023.12.12#公开

摘要：本发明涉及分类检索的技术领域，公开了一种档案智能分类与检索方法，所述方法包括：将电子档案构建为词图模型，并根据词图模型计算电子档案中每个候选词的TFIDF特征和候选词位置特征；计算电子档案中候选词间的概率转移矩阵；对概率转移矩阵进行迭代计算得到候选词的初始得分；基于提取的K核子图计算得到电子合同中候选词的层级特征和平均信息熵特征；在候选词初始得分的基础上，融合层级特征及平均信息熵特征确定电子档案关键词；根据电子档案关键词进行档案分类并支持基于关键词的档案快速检索。本发明基于候选词的位置重要性、词频重要性、与其他候选词的关联程度以及信息量确定电子档案中关键词，实现电子档案分类以及检索处理。

主权项：1.一种档案智能分类与检索方法，其特征在于，所述方法包括：S1：将电子档案构建为词图模型，并根据词图模型计算电子档案中每个候选词的TFIDF特征和候选词位置特征；S2：根据计算得到的电子档案TFIDF特征和候选词位置特征计算电子档案中候选词间的概率转移矩阵；S3：对概率转移矩阵进行迭代计算，得到候选词的初始得分；S4：从所构建的词图模型中提取得到K核子图；S5：基于提取的K核子图计算得到电子合同中候选词的层级特征和平均信息熵特征；S6：在候选词初始得分的基础上，融合层级特征及平均信息熵特征确定电子档案关键词；S7：根据电子档案关键词进行档案分类并支持基于关键词的档案快速检索；所述S1步骤中将电子档案构建为词图模型，包括：将电子档案构建为词图模型，其中第i份电子档案的词图模型构建流程为：S11：对电子档案进行分句分词处理，其中分句分词处理结果为：其中：表示电子档案中第j个句子的分词处理结果，表示电子档案的句子总数；表示分词处理结果中的第个词语，表示分词处理结果中的词语总数；S12：从电子档案的分句分词处理结果中提取名词作为电子档案的候选词，则电子档案的去重后候选词集合为：其中：表示电子档案中的第个候选词，表示电子档案的候选词总数；S13：将候选词作为词图模型的节点，并计算不同节点之间的位置距离，若两个节点之间的位置距离小于预设的窗口阈值，则两个节点之间存在边，否则不存在边，其中候选词与之间的位置距离为：其中：表示以自然常数为底的指数函数；表示候选词与之间的位置距离，，且；表示电子档案分句分词处理结果中候选词与之间的词语数目；表示候选词在电子档案分句分词处理结果中的出现句数，，即候选词在第个句子出现；表示候选词在电子档案分句分词处理结果中的出现句数，；S14：将节点以及节点之间的边信息构成词图模型，则电子档案所构成的词图模型为：其中：表示电子档案所构成的词图模型，包括个候选词节点信息，以及候选词节点之间的边信息；，表示不同候选词在词图模型之间的边信息；若小于预设的窗口阈值，，表示候选词与在词图模型中存在边，否则表示候选词与在词图模型中不存在边；所述S1步骤中根据词图模型计算电子档案中每个候选词的TFIDF特征和候选词位置特征，包括：根据所构建的词图模型计算得到电子档案中每个候选词的TFIDF特征和候选词位置特征，其中电子档案中第个候选词的TFIDF特征和候选词位置特征计算公式为：其中：表示候选词在电子档案分句分词处理结果中出现的次数；表示电子档案分句分词处理结果中的词语总数；n表示电子档案总份数；表示存在候选词语的电子档案份数；表示候选词的TFIDF特征；表示候选词的候选词位置特征。

全文数据：

权利要求：

百度查询：山东汇商脉网络科技有限公司一种档案智能分类与检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

下一篇：一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

相关技术

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种防卡管测斜仪探头_中国建筑西南勘察设计研究院有限公司_202420526288.5

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种机柜_珠海冠宇动力电源有限公司_202322495779.6

一种万寿菊用大型烘干机_丘北立达尔生物科技有限公司_202322498434.6

一种园林绿化便携铲_马丽丽_202322375183.2

档案相关技术

一种地质资料纸电共同保管档案盒_河北省自然资源档案馆_202322724300.1

一种远端自动编制电子档案文件信息保密的方法和系统_四川建设网有限责任公司_202410171491.X

一种便于使用的分类档案管理柜_山西水利职业技术学院_202321858991.8

档案分类方法及平台_河北省中医院_202410117785.4

一种档案架_王鑫浩_202322602588.5

一种财务档案管理用档案柜_山东省食品药品检验研究院_202322677284.5

一种拼接式建筑档案管理用档案柜_天津锦源档案管理技术服务有限公司_202322344481.5

一种档案装订装置_铁岭市城市发展服务中心_202311837139.7

人车全息档案研判搜索系统_中国电子科技集团公司电子科学研究院_201810981863.X

一种管理档案架_张天红_202320840794.7

分类相关技术

图像分类方法、图像分类模型的训练方法及装置_腾讯科技(深圳)有限公司_202210102561.7

账户分类模型训练方法及装置和账户分类方法及装置_百度在线网络技术(北京)有限公司_201910324589.3

一种分类筛沙机_孙锋_202322157347.4

一种基于细胞骨架图像定量分析的细胞图像分类方法及其分类器_上海大学_202111001522.X

一种能够快速分类的码垛装置_济南昊中智能科技有限公司_202322772854.9

文档分类方法、装置及电子设备_北京百度网讯科技有限公司_202110737169.5

广告分类评估方法、装置及存储介质_蓝色火焰科技成都有限公司_202410161898.4

包括自动特征检测和分类的检查工具_米沃奇电动工具公司_202280047516.4

一种石灰岩矿物质加工用矿石分类装置_淳安县元洋实业有限公司_202322168294.6

一种便于使用的分类档案管理柜_山西水利职业技术学院_202321858991.8

方法相关技术

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

通信方法及装置_华为技术有限公司_202010617172.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

信息处理方法_丰田自动车株式会社_202311358127.6

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

冰箱及其控制方法_LG电子株式会社_202080061858.2

冰箱及其控制方法_重庆海尔制冷电器有限公司_202211295888.7

龙图腾网&IPTOP

【发明授权】一种档案智能分类与检索方法_山东汇商脉网络科技有限公司_202311204538.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务