买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种面向用户行为分析的大众口碑情感分析方法_江苏海洋大学;江苏省海洋资源开发研究院(连云港)_202010191851.4 

申请/专利权人:江苏海洋大学;江苏省海洋资源开发研究院(连云港)

申请日:2020-03-18

公开(公告)日:2023-05-09

公开(公告)号:CN111400496B

主分类号:G06F16/35

分类号:G06F16/35;G06F16/951;G06F40/242;G06F40/279;G06F40/205;G06F40/126;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2023.05.09#授权;2020.08.04#实质审查的生效;2020.07.10#公开

摘要:本发明公开了一种面向用户行为分析的大众口碑情感分析方法,本发明包括数据的收集模块、特征提取模块、机器学习模块、元分类器模块以及情感词典模块,数据的收集模块与特征提取模块单向连接,特征提取模块与机器学习模块单向连接,机器学习模块与元分类器模块单向连接,元分类器模块与情感词典模块单向连接,本发明通过结合机器学习和情感词库,使得采用情感词典对比的方法与机器学习的方法相互结合,以弥补彼此的缺点和不足,从而从用户的行为对其情感进行分类,判断用户所表达的情感是积极的还是消极的,构造的元分类器,将不同分类器的预测合并成最终的分类结果,大大提高情感分类的准确性和情感分类的效率。

主权项:1.一种面向用户行为分析的大众口碑情感分析方法,包括数据的收集模块、特征提取模块、机器学习模块、元分类器模块以及情感词典模块,其特征在于,所述数据的收集模块与特征提取模块单向连接,所述特征提取模块与机器学习模块单向连接,所述机器学习模块与元分类器模块单向连接,所述元分类器模块与情感词典模块单向连接,所述数据的收集模块包括数据收集以及预处理,所述机器学习模块包括学习模块以及分类模块,所述学习模块采用半监督学习,所述元分类器模块包括利益风险分类器、信任不信任服务分类器、信任不信任约会者分类器以及正面社会影响负面社会影响分类器四个基分类器;所述数据收集在于采用爬虫软件获取评论数据,并使用深度收集策略来收集网站数据;所述预处理通过删除重复、停用字、特殊字符以及对分词、否定的识别操作将汉语句子分隔成词语序列;所述特征提取模块即为将非结构化数据进行分类,将其转化为结构化数据和适度的非结构化文本数据,并生成用于机器学习模型的特征集;所述半监督学习为机器通过对少量有标注文本和大量无标注文本的情感识别来学习构建分类模型;所述分类模块通过学习的结果对特征提取模块传递来的数据进行情感分类,并将分类结果传输至元分类器模块中所述元分类器模块中每个基分类器都以四类特征中的一种为基础,并使用逻辑回归模型进行组合;所述情感词典模块是机器学习和情感词典相结合,情感词典是包含众多情感词语的词汇库,每个情感词语表示其对应特征情感的程度,机器学习利用情感词典进行分类,同时情感词典通过机器分类得到进一步完善,并进一步对机器学习的分类结果进行修正;所述一种面向用户行为分析的大众口碑情感分析方法为:1从ODS中获取数据;2通过特征提取将获取的非结构化文本数据转换为结构化数据;3然后分别从八个特征方面对个体的情感进行分类,分为利益风险分类器、信任不信任服务分类器、信任不信任约会者分类器、正面社会影响负面社会影响分类器;4将四个分类器的输出作为元分类器的输入特征;5建立的情感词典修正这四个分类器的错误预测结果;6将正确的结果导出。

全文数据:

权利要求:

百度查询: 江苏海洋大学;江苏省海洋资源开发研究院(连云港) 一种面向用户行为分析的大众口碑情感分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。