【发明授权】基于自然语言处理的知识库自动构建方法_卓世未来(天津)科技有限公司_202410072571.X

导航：龙图腾网> 最新专利技术> 基于自然语言处理的知识库自动构建方法_卓世未来(天津)科技有限公司_202410072571.X

申请/专利权人：卓世未来(天津)科技有限公司

申请日：2024-01-18

公开（公告）日：2024-04-09

公开（公告）号：CN117592562B

主分类号：G06N5/022

分类号：G06N5/022;G06F40/242;G06F40/289;G06F40/30;G06N3/0442;G06F18/22;G06F18/23;G06F18/241

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2024.03.12#实质审查的生效;2024.02.23#公开

摘要：本发明涉及数据处理技术领域，提出了基于自然语言处理的知识库自动构建方法，包括：获取工艺知识分类数据集；根据工艺知识分类数据集中每个元素的语义特征构建语义突出对比系数；根据语义突出对比系数获取语义突出对比序列；根据工艺知识分类数据集中每个元素及其对应的语义突出对比序列计算语义突出近邻系数；根据语义突出近邻系数获取语义近邻分析样本集合；根据语义近邻分析样本集合获取共享近邻样本集合；根据共享近邻样本集合获取语义近邻相似距离；基于语义近邻相似距离采用层次聚类算法获取工艺知识分类数据集的聚类结果，根据所述聚类结果构建工艺知识库。本发明通过语义近邻相似距离对数据进行聚类分析，提高构建工艺知识库的精度。

主权项：1.基于自然语言处理的知识库自动构建方法，其特征在于，该方法包括以下步骤：获取工艺知识数据集；根据工艺知识数据集获取工艺知识分类数据集；根据工艺知识分类数据集的每个元素中不同分词之间的语义特征关系计算所述每个元素中每个分词的语义突出对比系数；根据工艺知识分类数据的每个元素中分词的语义突出对比系数获取所述每个元素的语义突出对比序列；根据工艺知识分类数据集的每个元素及其对应的语义突出对比序列获取所述每个元素的语义突出近邻系数；根据工艺知识分类数据集的每个元素的语义突出近邻系数获取所述每个元素的语义近邻分析样本集合；根据工艺知识分类数据集的每个元素的语义近邻分析样本集合获取工艺知识分类数据集的不同元素之间的共享近邻样本集；根据工艺知识分类数据集的不同元素之间的共享近邻样本集获取所述不同元素之间的语义近邻相似距离；基于语义近邻相似距离采用层次聚类算法获取工艺知识分类数据集的聚类结果；根据工艺知识分类数据集的聚类结果构建工艺知识库；所述根据工艺知识分类数据集的每个元素中不同分词之间的语义特征关系计算所述每个元素中每个分词的语义突出对比系数的方法为：式中，表示第个分词的语义突出对比系数；和分别表示第个和第个分词的向量表示，表示和之间的余弦相似度；表示的转置；表示第个分词所在元素中分词的数量；表示调节参数；所述根据工艺知识分类数据集的每个元素及其对应的语义突出对比序列获取所述每个元素的语义突出近邻系数的方法为：式中，表示工艺知识分类数据集中第个元素的语义突出近邻系数；和分别表示工艺知识分类数据集中第个和第个元素对应的语义向量，表示与之间的余弦相似度；和分别表示工艺知识分类数据集中第个和第个元素对应的语义突出对比序列，表示和之间的DTW距离；表示工艺知识分类数据集中元素的数量；所述根据工艺知识分类数据集的不同元素之间的共享近邻样本集获取所述不同元素之间的语义近邻相似距离的方法为：式中，表示工艺知识分类数据集中第个元素和第个元素之间的语义近邻相似距离；和分别表示工艺知识分类数据集中第个元素和第个元素的语义近邻分析样本集合，表示和之间的杰卡德系数；和分别表示工艺知识分类数据集中第个元素和第个元素对应的语义突出近邻系数；表示工艺知识分类数据集中第个元素和第个元素对应的共享近邻样本集合中第个样本对应的语义突出近邻系数；表示工艺知识分类数据集中第个元素和第个元素对应的共享近邻样本集合中样本的数量；表示调节参数。

全文数据：

权利要求：

百度查询：卓世未来(天津)科技有限公司基于自然语言处理的知识库自动构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

下一篇：一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

相关技术

一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种高效散热电源_广州市力为电子有限公司_202322175013.X

知识库相关技术

一种企业知识产权维度评审系统_北京中知智慧科技有限公司_202310832158.4

知识点标记生成系统及其方法_智园香港有限公司_201910646422.9

用于自动折盒的纸库机构_上海熙劢包装科技有限公司_202322400670.X

数据库应用界面自动构建方法_慧新全智工业互联科技(青岛)有限公司_202410022812.X

数据库同步方法、装置、设备及存储介质_成都完美天智游科技有限公司_202011186500.0

基于增量克隆的数据库升级_西门子工业软件有限公司_202080103248.4

融合试题数据和解答数据的多知识点标注方法和系统_华中师范大学_202011282980.0

一种用于知识图谱嵌入模型的负采样方法_电子科技大学_202211455237.X

一种基于知识增强神经网络模型的讽刺检测方法及系统_广东外语外贸大学_202311374400.4

知识点的处理方法、视频处理方法、装置及电子设备_腾讯科技(深圳)有限公司_202111629123.8

自动相关技术

自动脱模注塑装置_唐山铮诚塑业有限公司_202321922113.8

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

自动并线机_无锡星陵威科技有限公司_201810119180.3

自动清洁涂装机_佛山星铭达自动化设备有限公司_202322558790.2

自动上下料车_加西亚电子电器股份有限公司_202010419915.1

全自动多功能烫画机_缙云县盛达缝制设备有限公司_202322206454.1

鸡舍自动投喂粮仓_华南师范大学_202322702234.8

线材自动封装装置_鸿硕精密电工(湖北)有限公司_202322324101.1

料盒自动化输送装置及料盒自动化输送系统_广汽乘用车(杭州)有限公司_202322231946.6

一种自动上土设备_安徽宏敏农业科技有限公司_202322751841.3

处理相关技术

基板处理设备和基板处理方法_细美事有限公司_202311345152.0

影像处理装置及影像处理方法_纬创资通股份有限公司_202211404107.3

信息处理系统、信息处理方法以及信息处理装置_丰田自动车株式会社_202311325525.8

数据信号处理方法和数据信号处理装置_铠强科技(平潭)有限公司_202310730790.8

杯、液处理装置以及液处理方法_东京毅力科创株式会社_202311358288.5

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

信息处理装置、信息处理方法以及程序_索尼公司_201880080945.5

有机废气处理设备及有机废气处理组件_无锡博洋环境工程有限公司_202322538306.X

医用图像处理装置以及医用图像处理方法_富士胶片医疗健康株式会社_202010503352.4

热处理炉_NGK(苏州)热工技术有限公司_202322575176.7

龙图腾网&IPTOP

【发明授权】基于自然语言处理的知识库自动构建方法_卓世未来(天津)科技有限公司_202410072571.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务