买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于去重样本的社交网络和LSTM模型准确率计算方法_西安理工大学_202210180890.3 

申请/专利权人:西安理工大学

申请日:2022-02-25

公开(公告)日:2024-04-09

公开(公告)号:CN114510649B

主分类号:G06F16/9536

分类号:G06F16/9536;G06F18/241;G06N3/04;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2022.06.03#实质审查的生效;2022.05.17#公开

摘要:本发明公开的基于去重样本的社交网络和LSTM模型准确率计算方法,包括以下步骤:步骤1、集合构建,将原始序列数据集按照给定的类别构建的集合称为原始结果集合;步骤2、LSTM验证,先使用LSTM模型对数据进行分类,然后过滤分类正确的结果;将分类结果中帖子类型为主贴的保持不变,帖子类型为评论的在原始序列数据集中进行搜索,搜索当前评论对应的主贴;步骤3、回溯,拿到所有主贴后按照原始序列数据集构建社交网络;步骤4、衔接,将步骤1中构建的原始结果集合和步骤2LSTM和步骤3社交网络融合产生的结果集合进行融合和衔接。

主权项:1.基于去重样本的社交网络和LSTM模型准确率计算方法,其特征在于,包括以下步骤:步骤1、集合构建,将原始序列数据集按照给定的类别构建好集合,该集合称为原始结果集合;步骤2、LSTM验证,先使用LSTM模型对数据进行分类,然后过滤分类正确的结果;将分类结果中帖子类型为主贴的保持不变,帖子类型为评论的在原始序列数据集中进行搜索,搜索当前评论对应的主贴;步骤2的具体实施方式为:首先使用LSTM分类器对帖子进行二分类,将分类结果按照类别形成结果集合,并记作γ和θ,其中γ代表LSTM分类后类别显示为C1类的结果,θ代表LSTM分类后类别显示为C2类的结果;然后将分类错误的数据暂时搁置,分类正确的数据进行以下操作:判断当前帖子是主贴还是评论,如果查询到帖子是主贴,将直接进入下一环节即构建社交网络,如果查询结果是评论,将进入图中Search环节与AllpostsBase比对去查询其真正对应的主贴;待查到当前评论对应的主贴以后再进入下一环节即构建社交网络;步骤3、回溯,拿到所有主贴后按照原始序列数据集构建社交网络;步骤3的具体实施方式为:当前已经拿到的都是LSTM分类后分类正确的主贴以及分类正确的评论对应的主贴,拿到所有的主贴以后,将针对每一个主贴返回到AllpostsBase中去搜索,这个过程叫做大搜索,也即图中Trace表示;它们都返回到AllpostsBase中按照原始序列信息查询结点之间存在的依赖关系,然后形成社交网络结果集;将构建好的所有网络结点拿出来然后分别形成不同类别对应的集合即C1nodeset和C2nodeset,将C1nodeset和C2nodeset分别记为a和b做如下操作:α=a∩pα=a∩c11β=b∩qβ=b∩c22α和β为C1和C2类别对应的社交网络最终的结果集合;公式12中的p和q分别指C1SampleSet及C2SampleSet;步骤4、衔接,将步骤1中构建的原始结果集合和步骤2LSTM和步骤3社交网络融合产生的结果集合进行融合和衔接;步骤4的具体实施方式为:建立LSTM和社交网络模型的衔接,具体为:构建社交网络的结果集合α和β与LSTM结果集合γ和θ,然后进行如下操作:s1=α∪γ3s2=β∪θ4其中s1和s2对应LSTM和社交网络融合模型所计算出的C1类别和C2类别对应的集合;然后再进行如下5,6操作:L1=s1∩p5L2=s2∩q6其中L1和L2分别代表两种类别分别被判断对的帖子,p和q分别指C1SampleSet及C2SampleSet;最后,使用公式7计算得出最终的准确率:

全文数据:

权利要求:

百度查询: 西安理工大学 基于去重样本的社交网络和LSTM模型准确率计算方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。