买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种适用于同类电力设备台账数据相同字段的查错方法_南方电网调峰调频发电有限公司_202010457987.5 

申请/专利权人:南方电网调峰调频发电有限公司

申请日:2020-05-26

公开(公告)日:2024-03-15

公开(公告)号:CN111898961B

主分类号:G06Q10/10

分类号:G06Q10/10;G06Q50/06;G06F16/21

优先权:

专利状态码:有效-授权

法律状态:2024.03.15#授权;2020.11.24#实质审查的生效;2020.11.06#公开

摘要:本发明提供一种适用于同类电力设备台账数据相同字段的查错方法,为同类台账数据相同字段提供有效快速查错方法,获知潜在互为备品的信息和台账数据质量情况。具体步骤如下:首先从获取相同功能位置类型或同品类等同类台账数据集合V1;接着对同类数据集合V1的相同字段的数值取唯一值,获得数据集T1;然后以数据集合T1的数据元为匹配词,依次在数据集合T1进行匹配,并获得匹配度的打分矩阵Z;然后从打分矩阵中获取分数在阈值区间的元素的位置,即获得存在数据质量的台账数据。最后对潜在互为备品或存在数据质量的台账数据进行检查性维护。解决了电力设备台账数据字段众多,同类设备相同字段纠错复杂困难的难题。

主权项:1.一种适用于同类电力设备台账数据相同字段的查错方法,其特征在于,包括以下步骤:1.1从台账数据中获取同类台账数据集合V;1.2从同类台账数据集合V中获取相同字段的唯一值,获得数据集T,所述字段与步骤1.1同类台账数据中的字段不相同,具体由以下步骤获得:4.1设i=1;4.2从同类台账数据集合V中获取同类台账数据集合V中的台账数据Pi,并对台账数据Pi的设备型号字段内的数据取唯一值,获得数据集合Xi,Xi=[xi1,xi2,……xim],m为集合Xi内元素的个数,i代表从同类台账数据集合V中获取的第i个同类台账数据;4.3设k=1,k代表第i’类功能位置类型的台账数据表示的设备集合中的第k类设备型号;4.4遍历台账数据Pi,找到台账数据Pi中设备型号字段与xik相同的台账数据后,将台账数据ID存至Ti’k,Ti’k代表第i’类功能位置类型的台账数据表示的设备集合中第k类设备型号的设备集合;4.5k的值加1后,若k≤m,返回到第4.4步,若km,则第i个同类台账数据Ti=[Ti1,Ti2,……Tim],m为数据集合Xi内元素的个数;4.6i的值加1后,若i≤h,返回到第4.2步,若ih,则数据集T=[T1,T2,……Th]T,h为数据集T内元素的行数;1.3依次以数据集T的数据为匹配词,在数据集T进行匹配,根据匹配程度打分,并形成打分矩阵Z;所述依次以数据集T的数据为匹配词,在数据集T进行匹配,根据匹配程度打分,并形成打分矩阵Z,具体由以下步骤获得:5.1设i’=1,i’为第i’类功能位置类型的台账数据表示的设备集合;5.2从数据集T中获取台账数据集合Ti’;5.3设u=1,u为第i个同类数据的第u个检索词;5.4从台账数据集合Ti’中获取检索词,即tmp_pipei=Ti’u,Ti’u表示第i’个同类数据的u个检索词,用tmp_pipei在台账数据集合Ti’中匹配,获得e-1个匹配程度的分值,存到Zi’u中,e为集合Ti’内元素的个数;5.5u的值加1后,若u≤e,返回到第5.4步,若ue,则第i个同类台账数据集合Ti的打分矩阵Zi=[Zi1,Zi2,……Zie];5.6i’的值加1后,若i’≤h,返回到第5.2步,若ih,则数据集T的打分矩阵Z=[Z1,Z2,……Zh]T,h为集合T内元素的行数;1.4从打分矩阵中获取每一行分数在阈值区间δ的元素的位置,获得新台账数据集合Q,新台账数据集合Q即为潜在互为备品或存在数据质量的台账数据;所述从打分矩阵中获取每一行分数在阈值区间δ的元素的位置,获得新台账数据集合Q,具体由以下步骤获得:6.1设i’=1,i’为第i’类功能位置类型的台账数据表示的设备集合;6.2从打分矩阵Z中获取分值集合Zi’;6.3设u'=1,u'代表第i’类功能位置类型的设备集合中的第u个检索词获得的相似度;6.4从分值集合Zi’=[Zi’1,Zi’2,……Zi’w]中获取Zi’u'中落在阈值区间δ的分值,并把分值的下标存到tmp_weizhi中,w为集合Zi内元素的个数;6.5u'的值加1后,若u'≤w,返回到第6.4步,若u'w,则对tmp_weizhi取唯一值,获得数组k’,第i个同类台账数据的台账数据集合Qi=k’;6.6i’的值加1后,若i’≤p,返回到第6.2步,若i’p,则新台账数据集合Q=[Q1,Q2,……Qp]T,p为分值集合Zi’的行数;1.5对潜在互为备品或存在数据质量的台账数据进行检查性维护。

全文数据:

权利要求:

百度查询: 南方电网调峰调频发电有限公司 一种适用于同类电力设备台账数据相同字段的查错方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。