买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】分类规则获取方法及装置_海信视像科技股份有限公司_202010537532.4 

申请/专利权人:海信视像科技股份有限公司

申请日:2020-06-12

公开(公告)日:2022-11-29

公开(公告)号:CN111783995B

主分类号:G06N20/00

分类号:G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2022.11.29#授权;2020.11.03#实质审查的生效;2020.10.16#公开

摘要:本申请提供的分类规则获取方法及装置,能够将经过SWEM模型分类后的数据作为样本数据,并且分别确定所有类别中的第一衡量指数和第二衡量指数最小的目标类别;第一衡量指数最小,说明该目标类别中的数据可分性差,第二衡量指数最小,说明该第二衡量指数对应的两个目标类别之间的可分性差。进而需要确定出这两个目标类别内重合的目标样本数据,并对目标样本数据的类别进行修改,以使其与其他类别明显区分,形成包含预设分类规则在内的新的分类规则。本申请的技术方案能够根据衡量指数确定需要修改类别的目标样本数据,形成更加具体和准确的分类规则,可应用于多版本迭代的数据集,适用范围比较广。

主权项:1.一种分类规则获取方法,其特征在于,包括:利用SWEM模型将样本数据集表示成不同类别的样本数据,所述SWEM模型具有预设分类规则;所述样本数据集为文本数据集,所述样本数据为文本数据;将所述不同类别的样本数据进行验证,在所有类别中确定第一衡量指数最小的第一目标类别,以及与所述第一目标类别之间具有最小第二衡量指数的第二目标类别,所述第一衡量指数用于衡量类别中样本数据的可分性,所述第二衡量指数用于衡量类别之间样本数据的可分性;计算第一目标类别中样本数据和第二目标类别中样本数据的相似度,根据相似度确定所述第一目标类别与所述第二目标类别中相互重合的目标样本数据;根据所述第一目标类别与所述第二目标类别中相互重合的目标样本数据确定验证结果;如果目标样本数据重合度大于设定阈值,则确定所述验证结果不理想;结合所述预设分类规则,修改所述目标样本数据所归属的类别,得到包含预设分类规则在内的优化后的分类规则;根据优化后的分类规则设置SWEM模型的模型参数;所述SWEM模型根据优化后的分类规则对数据集进行分类;其中,利用SWEM模型将样本数据集表示成不同类别的样本数据的步骤包括:将样本数据集划分成若干个短文本;对所述短文本进行分词处理,得到若干个词;将每个词表示成词向量;将所述样本数据集以词向量的形式输入到所述SWEM模型中,获得不同类别的样本数据,所述样本数据为SWEM模型输出的稠密向量。

全文数据:

权利要求:

百度查询: 海信视像科技股份有限公司 分类规则获取方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。