申请/专利权人:国网上海市电力公司;华东电力试验研究院有限公司;上海久湛信息科技有限公司
申请日:2023-12-04
公开(公告)日:2024-03-05
公开(公告)号:CN117648447A
主分类号:G06F16/36
分类号:G06F16/36;G06N5/022;G06F16/35;G06F16/33;G06F18/2415;G06F40/289;G06N7/01;G06N3/0442;G06N3/045
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.03.22#实质审查的生效;2024.03.05#公开
摘要:本发明涉及一种电网调控预案知识图谱构建方法及系统,属于大数据分析技术领域。其中,该方法包括:获取电网调控预案原始文本集,使用隐马尔科夫链和二元统计模型中,得到分词结果。构建词‑文本序列集矩阵并进行奇异值分解得到奇异向量矩阵,利用奇异向量矩阵对分词结果进行同义词标记和去重。对去重分词结果进行分布式处理和权重计算得到文本向量,将文本向量输入BiLSTM模型,得到文本向量的权重矩阵,将权重矩阵与预设的分类标准进行比较,得到文本向量的分类结果。将分类结果和去重分词结果存储于Neo4j数据库中并图形化处理得到知识图谱。通过隐马尔科夫链对文本进行自动分词和标注,BiLSTM模型和TF‑IDF方法对文本进行自动分类,提高了文本抽取的效率。
主权项:1.一种电网调控预案知识图谱构建方法,其特征在于,步骤如下:S1获取电网调控预案原始文本集,对所述电网调控预案原始文本集进行文本质量检验和文本格式清洗后得到电网调控预案文本序列;S2对所述电网调控预案文本序列集使用隐马尔科夫链进行随机词位分词,得到分词结果;S3构建词-文本序列集矩阵,提取所述词-文本序列集矩阵中的奇异向量,根据所述奇异向量对所述分词结果进行同义词去重得到去重分词结果;S4对所述去重分词结果进行向量转化得到文本向量,将所述文本向量输入BiLSTM模型得到权重矩阵,根据所述权重矩阵得到分类结果;S5将所述分类结果和所述文本向量对应的去重分词结果存储于Neo4j数据库中,对所述Neo4j数据库图形化处理得到电网调控预案知识图谱。
全文数据:
权利要求:
百度查询: 国网上海市电力公司;华东电力试验研究院有限公司;上海久湛信息科技有限公司 一种电网调控预案知识图谱构建方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。