广东省特种设备检测研究院佛山检测院李松获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东省特种设备检测研究院佛山检测院申请的专利电梯故障描述文本分类方法、系统和计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118035457B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410436851.4,技术领域涉及:G06F16/35;该发明授权电梯故障描述文本分类方法、系统和计算机可读存储介质是由李松;傅东;杨旭彬;杨勇;杨欢;曾倩欣设计研发完成,并于2024-04-12向国家知识产权局提交的专利申请。
本电梯故障描述文本分类方法、系统和计算机可读存储介质在说明书摘要公布了:本发明涉及电梯技术领域,尤其涉及一种电梯故障描述文本分类方法、系统和计算机可读存储介质。该方法包括以下步骤:获得文本训练集;文本训练集输入fastText词嵌入模型,以所得的词嵌入矩阵对XGBoost模型训练;以文本训练集对fastText模型训练;待分类的电梯故障描述文本输入至fastText词嵌入模型,所得词嵌入矩阵输入目标XGBoost模型;待分类的电梯故障描述文本输入目标fastText模型;根据两个分类结果获得最终分类结果。通过扩充和预处理后的文本训练集,采用深度学习方法,训练双重分类模型,能够高效、准确地实现批量的电梯故障描述文本的自动化分类,提高电梯故障信息管理的准确性和效率性。
本发明授权电梯故障描述文本分类方法、系统和计算机可读存储介质在权利要求书中公布了:1.一种电梯故障描述文本分类方法,其特征在于,包括以下步骤:S1:获取电梯故障描述文本的原始文本集,并对原始文本集做扩充和预处理,得到文本训练集;S2:将文本训练集输入fastText词嵌入模型进行编码处理,得到所述文本训练集的若干个词嵌入矩阵,将所述词嵌入矩阵输入至XGBoost模型中进行训练,获得目标XGBoost模型;S3:将所述文本训练集输入至fastText模型中进行训练,获得目标fastText模型;S4:将待分类的电梯故障描述文本输入至所述fastText词嵌入模型中进行编码处理,获得所述待分类的电梯故障描述文本的词嵌入矩阵,将所述待分类的电梯故障描述文本的词嵌入矩阵输入至所述目标XGBoost模型,获得第一分类结果;S5:将待分类的电梯故障描述文本输入至所述目标fastText模型,获得第二分类结果;S6:根据所述第一分类结果以及第二分类结果,获得所述待分类的电梯故障描述文本的最终分类结果;所述S1包括以下子步骤:S11:获取电梯故障描述文本的原始文本集,以原始文本集训练MOSS模型,得到微调的MOSS模型和电梯故障描述文本;根据电梯基础知识、电梯整体及部件知识将原始文本集中的电梯故障描述文本整理成为问答形式,一种回答应当有三种或以上的提问描述方式,输入MOSS模型后能产生大量样本数据;S12:根据原始文本集中的分类得到需要扩充的稀少类别,将稀少类别输入微调后的MOSS模型中,得到补充文本,以补充文本对电梯故障描述文本进行扩充;S13:扩充的电梯故障描述文本包括若干类别的文本序列,文本序列包含若干单词,对每个类别的文本序列进行预处理,获得电梯故障描述词汇列表,若干类别的电梯故障描述词汇列表即为文本训练集;所述S2包括以下步骤:S21:将文本训练集划分出测试集,采用skipgram算法,以测试集中的电梯故障描述词汇列表对fastText词嵌入模型进行训练,使用的损失函数为: ;式中,L为损失值,T为文本序列的单词数目,t为文本序列的单词索引,c为预设的滑动窗口大小,j为所述滑动窗口的单词索引,为似然函数,为文本序列中的第t+j个单词,为文本序列中的第t个单词;S22:将文本训练集输入训练后的fastText词嵌入模型进行编码处理,得到所述文本训练集的若干个词嵌入矩阵;S23:采用随机有放回的方法,从所述词嵌入矩阵中抽取若干个单词,根据若干个所述单词以及预设的预测算法,获得若干个所述单词的分类预测值,其中,所述分类预测值包括若干个类别的分类预测概率分布值,所述XGBoost模型包括若干个决策树;所述预测算法为: ;式中,i为单词的索引,为第i个单词的分类预测值,K为决策树的总数,k为决策树的索引,表示第k个决策树,表示第i个单词,表示第i个单词通过第k个决策树预测的结果;S24:根据若干个所述单词的分类预测值、分类真实概率分布值以及预设的梯度下降算法,对所述XGBoost模型进行训练,获得目标XGBoost模型,其中,所述梯度下降算法为: , ,式中,为损失值,模型参数,n为单词的总数,为对数似然损失函数,为第i个单词的分类真实值,为正则化函数,为第i个单词的分类预测概率分布值;所述S6中,所述第一分类结果以及第二分类结果均包括若干个类别的分类预测概率分布值;根据所述第一分类结果以及第二分类结果,获得所述待分类的电梯故障描述文本的最终分类结果,包括以下步骤:S61:所述第一分类结果以及第二分类结果中,将同一个类别的分类预测概率分布值进行累加,获得若干个类别的分类预测概率分布累加值;S62:将若干个类别的分类预测概率分布累加值进行对比,将最大的分类预测概率分布累加值对应的类别,作为所述待分类的电梯故障描述文本的最终分类结果;所述S13中,对每个类别的文本序列进行的预处理,包括分词处理以及停用词过滤;所述S2还包括S25:采用RandomizedSearchCV方法,对训练后的XGBoost模型的参数进行优化,将优化后的模型作为所述目标XGBoost模型;将所述文本训练集输入至fastText模型中进行训练,获得目标fastText模型,包括以下步骤:S31:采用监督学习模式,将所述文本训练集输入fastText模型中进行训练;S32:采用RandomizedSearchCV方法,对训练后的fastText模型的参数进行优化,将优化后的模型作为所述目标fastText模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东省特种设备检测研究院佛山检测院,其通讯地址为:528000 广东省佛山市禅城区影荫二街2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。