申请/专利权人:浙江省公众信息产业有限公司
申请日:2023-11-10
公开(公告)日:2024-02-02
公开(公告)号:CN117493447A
主分类号:G06F16/26
分类号:G06F16/26;G06F16/332;G06F16/33;G06F16/35
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.02.23#实质审查的生效;2024.02.02#公开
摘要:本发明公开了一种基于大语言模型的级联共性问题挖掘方法,涉及人工智能和自然语言处理技术领域。包括以下步骤:S1,使用小语言嵌入模型对文本问题进行特征向量表达,保留子问题数量最高的前第二数量的粗粒度共性问题;S2,使用大语言嵌入模型对所述原始文本问题进行特征向量表达,保留子问题数量最高的前第四数量的细粒度共性问题;S3,使用大语言通用模型进行总结归纳,获得第五数量的共性问题;S4,使用大语言通用模型进行命名实体识别,并对所述共性问题进行重要程度排序。本发明能以更高的精度和更快的速度挖掘和发现文本中的共性问题,还能有效利用大语言模型的深度学习特性,以减少对大量计算资源的依赖。
主权项:1.一种基于大语言模型的级联共性问题挖掘方法,其特征在于,包括以下步骤:S1,使用小语言嵌入模型对文本问题进行特征向量表达,并通过聚类算法抽取所有的文本问题的第一数量的粗粒度共性问题;保留子问题数量最高的前第二数量的粗粒度共性问题;S2,获取所述前第二数量的粗粒度共性问题对应的原始文本问题,并使用大语言嵌入模型对所述原始文本问题进行特征向量表达,通过聚类算法抽取所述原始文本问题的第三数量的细粒度共性问题;保留子问题数量最高的前第四数量的细粒度共性问题;S3,针对所述前第四数量的细粒度共性问题,使用大语言通用模型进行总结归纳,获得第五数量的共性问题;S4,对得到的第五数量的共性问题,使用大语言通用模型进行命名实体识别,并对所述共性问题进行重要程度排序。
全文数据:
权利要求:
百度查询: 浙江省公众信息产业有限公司 一种基于大语言模型的级联共性问题挖掘方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。