【发明公布】用于大语言模型的数据知识提取方法_卓世智星(成都)科技有限公司_202410186621.7

导航：龙图腾网> 最新专利技术> 用于大语言模型的数据知识提取方法_卓世智星(成都)科技有限公司_202410186621.7

申请/专利权人：卓世智星(成都)科技有限公司

申请日：2024-02-20

公开（公告）日：2024-03-22

公开（公告）号：CN117743838A

主分类号：G06F18/2135

分类号：G06F18/2135;G06F18/22;G06F40/216;G06F40/284;G06F18/10;G06N5/022

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明涉及自然语言数据处理技术领域，具体涉及用于大语言模型的数据知识提取方法，该方法首先基于自然语言处理方法根据英文文本数据进行分析得到分词高维向量；根据噪声数据与整体数据之间的相似度较低的特征，通过分析分词高维向量之间的相似度整体偏离情况，将噪声高维向量筛除，得到参考高维向量；根据参考高维向量对应的数值分布复杂性以及参考高维向量之间的关联性，筛选出主成分分析向量和最优k值；使得结合最优k值后根据主成分分析高维向量通过PCA降维方法进行数据降维的效果更好，也即根据降维后的摘要信息向量对英文文本数据知识提取的效果更好。

主权项：1.用于大语言模型的数据知识提取方法，其特征在于，所述方法包括：对用于知识提取的英文文本数据通过分词方法以及词向量生成方法处理后，通过关键词提取方法得到至少两个分词高维向量；根据每个分词高维向量与其余分词高维向量之间的相似度整体偏离情况，得到每个分词高维向量的噪声存在概率；根据所述噪声存在概率在所有分词高维向量中筛除噪声高维向量，得到至少两个参考高维向量；根据每个参考高维向量对应数值序列的数值分布复杂性，以及每个参考高维向量与其余参考高维向量之间的关联性，得到每个参考高维向量的分析重要性；根据所述分析重要性筛选出主成分分析高维向量；根据所述主成分分析高维向量结合主成分分析方法进行数据降维，得到降维后的摘要信息向量；根据所述摘要信息向量进行英文文本数据知识提取。

全文数据：

权利要求：

百度查询：卓世智星(成都)科技有限公司用于大语言模型的数据知识提取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

下一篇：一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

相关技术

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种园林绿化便携铲_马丽丽_202322375183.2

一种网格化终端旋转装置_北京国旺盛源智能终端科技有限公司_202322619930.2

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

龙图腾网&IPTOP

【发明公布】用于大语言模型的数据知识提取方法_卓世智星(成都)科技有限公司_202410186621.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务