买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于图卷积网络的金融新闻文本情感倾向分析方法_华南理工大学_202110135244.0 

申请/专利权人:华南理工大学

申请日:2021-02-01

公开(公告)日:2022-09-20

公开(公告)号:CN112948541B

主分类号:G06F16/33

分类号:G06F16/33;G06F40/289;G06F40/30;G06K9/62;G06N3/04

优先权:

专利状态码:有效-授权

法律状态:2022.09.20#授权;2021.07.02#实质审查的生效;2021.06.11#公开

摘要:本发明公开了一种基于图卷积网络的金融新闻文本情感倾向分析方法,步骤如下:确定数据源获取金融文本数据;对金融文本数据进行预处理,得到清洁文本列表;对清洁文本列表进行采样得到样本列表;对样本列表进行人工标注;使用清洁文本列表建立异质图;对异质图进行特征提取得到特征矩阵、标签矩阵和邻接矩阵;以特征矩阵为输入,标签矩阵为监督信息,邻接矩阵为图卷积操作的支持矩阵,建立四层图卷积网络;通过迭代训练得到样本列表的分类准确率和清洁文本列表的分类结果。本方法在异质图中引入无标注数据,并可以在没有先验词嵌入知识的情况下进行学习,摆脱web环境下情感词典难以构建、维护的困境和对有标签数据比例和词嵌入效果的强依赖。

主权项:1.一种基于图卷积网络的金融新闻文本情感倾向分析方法,其特征在于,所述的金融新闻文本情感倾向分析方法包括以下步骤:S1、确定金融文本数据的来源,选择开源接口或设计网络爬虫来获取稳定的金融文本数据;S2、文本预处理,对获取的金融文本数据进行去杂项、分词的预处理,得到清洁文本列表;S3、对清洁文本列表进行采样得到样本列表,并对样本列表进行人工标注,得到标注数据;S4、使用清洁文本列表建立文本和词组的异质图,异质图以词组和文本作为结点,结点的连边包括以下两种情况:词组-词组连边、词组-文本连边,其中,所述的词组-词组连边根据词组的共现信息建立,所述的词组-文本连边是根据词组频率和词组的文本频率建立;S5、对异质图进行预处理,分别得到:特征矩阵、邻接矩阵、标签矩阵、归一化邻接矩阵;S6、使用特征矩阵作为输入,标签矩阵作为监督信息以及使用归一化邻接矩阵作为图卷积操作的支持矩阵,建立一个四层的图卷积网络;S7、对图卷积网络进行迭代训练,得到在真实训练集上和验证集上的准确率以及最终的分类结果。

全文数据:

权利要求:

百度查询: 华南理工大学 基于图卷积网络的金融新闻文本情感倾向分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。