【发明公布】一种面向热点话题的基于自监督表示学习的观点挖掘方法_南京邮电大学_202410226614.5

导航：龙图腾网> 最新专利技术> 一种面向热点话题的基于自监督表示学习的观点挖掘方法_南京邮电大学_202410226614.5

申请/专利权人：南京邮电大学

申请日：2024-02-29

公开（公告）日：2024-04-02

公开（公告）号：CN117808104A

主分类号：G06N5/04

分类号：G06N5/04;G06N3/0455;G06N3/084;G06N3/0895;G06F40/30

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.19#实质审查的生效;2024.04.02#公开

摘要：本发明属于自然语言处理技术领域，公开了一种面向热点话题的基于自监督表示学习的观点挖掘方法，包括：获取文本语料库并进行数据预处理；语料中的文本用词袋模型进行表示；对文档的词袋表示进行数据增强得到成对的相似文档向量表示；将成对的相似文档向量表示输入编码器网络得到输出，作为输入文档的观点分布的向量表示；从狄利克雷分布中采样获得观点分布的先验；最小化编码器网络输出的不变性、方差、协方差正则化损失和狄利克雷先验分布对齐的先验损失，以此进行模型的训练。本发明利用自监督学习的优势，得到了文档的观点表示，获得了高质量的观点，挖掘出了多样的观点表示。

主权项：1.一种面向热点话题的基于自监督表示学习的观点挖掘方法，其特征在于：所述观点挖掘方法包括以下步骤：步骤1、对获取到的社交媒体评论文本进行数据预处理，根据词袋模型得到文档采用TF-IDF表示法的词袋模型表示；步骤2、将步骤1中得到的词袋模型表示进行数据增强，以获得成对的相似文档向量表示；步骤3、将步骤2获得的增强后的成对的相似文档向量表示作为编码器网络的输入，得到编码器网络的输出，该输出表示为输入文档的观点分布的向量表示；步骤4、通过最小化编码器网络输出的不变性、方差、协方差正则化损失和狄利克雷先验分布对齐的先验损失，约束模型的参数变化，不断迭代至损失函数收敛，以确保模型的稳定性和观点挖掘的准确性。

全文数据：

权利要求：

百度查询：南京邮电大学一种面向热点话题的基于自监督表示学习的观点挖掘方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

下一篇：一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

相关技术

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

一种砂浆稠度仪_宜昌市科信水电工程质量检测有限公司_202322336666.1

一种园林绿化便携铲_马丽丽_202322375183.2

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

管带纠偏装置_武汉巨沣工程技术有限公司_202322765867.3

一种户外交流高压封闭式隔离开关_瑞芯科技(河北雄安)有限公司_202322554260.0

一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

一种不锈钢带输送机构_佛山市南海区东励森金属制品有限公司_202322463638.6

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

龙图腾网&IPTOP

【发明公布】一种面向热点话题的基于自监督表示学习的观点挖掘方法_南京邮电大学_202410226614.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务