【发明公布】基于大语言模型的事件聚类系统与方法_沪渝人工智能研究院_202311757697.2

导航：龙图腾网> 最新专利技术> 基于大语言模型的事件聚类系统与方法_沪渝人工智能研究院_202311757697.2

申请/专利权人：沪渝人工智能研究院

申请日：2023-12-19

公开（公告）日：2024-03-22

公开（公告）号：CN117743574A

主分类号：G06F16/35

分类号：G06F16/35;G06F18/214;G06F18/23;G06F18/2431

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本申请属于计算机科学和人工智能领域，具体涉及一种基于大语言模型的事件聚类系统与方法，所述方法包括获取新闻文本数据并预处理；将预处理后的新闻文本数据输入到训练后的大语言模型中，输出所述新闻文本数据对应的事件三要素推理结果；将发生事件输入到分类模型，输出分类类别；将发生事件输入到嵌入模型，输出嵌入向量；若同一分类类别下，不同新闻文本数据的发生时间和发生地点相同，则聚类为同一发生事件，若发生时间和发生地点不同，则计算不同新闻文本数据对应的嵌入向量的相似度，根据相似度判断是否聚类为同一发生事件。本发明通过大语言模型来输出新闻文本数据的事件三要素推理结果，提高了事件聚类的准确性，大大减少人工干预成本。

主权项：1.一种基于大语言模型的事件聚类方法，其特征在于，所述方法包括：获取来自于不同新闻平台的一个或者多个新闻文本数据，并对所述新闻文本数据进行预处理；将预处理后的新闻文本数据输入到训练后的大语言模型中，输出所述新闻文本数据对应的事件三要素推理结果，包括发生时间、发生地点和发生事件；将所述新闻文本数据对应的发生事件输入到分类模型，输出所述新闻文本数据对应的分类类别；将所述新闻文本数据对应的发生事件输入到嵌入模型，输出所述新闻文本数据对应的嵌入向量；根据所述新闻文本数据的分类类别、发生时间和发生地点进行检索，若同一分类类别下，不同新闻文本数据的发生时间和发生地点相同，则聚类为同一发生事件，若发生时间和发生地点不同，则计算不同新闻文本数据对应的嵌入向量的相似度，根据相似度判断是否聚类为同一发生事件。

全文数据：

权利要求：

百度查询：沪渝人工智能研究院基于大语言模型的事件聚类系统与方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

下一篇：一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

相关技术

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

一种人参肽粉研磨设备_上海中盈经济发展(集团)有限公司_202322368406.2

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

龙图腾网&IPTOP

【发明公布】基于大语言模型的事件聚类系统与方法_沪渝人工智能研究院_202311757697.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务