【发明公布】一种基于扩散模型的多粒度可控共情对话生成方法_中国科学院信息工程研究所_202410024770.3

申请/专利权人：中国科学院信息工程研究所

申请日：2024-01-08

公开（公告）日：2024-04-19

公开（公告）号：CN117909468A

主分类号：G06F16/332

分类号：G06F16/332;G06F16/33;G06F16/35;G06F40/35;G06N20/00

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.07#实质审查的生效;2024.04.19#公开

摘要：本发明提出一种基于扩散模型的多粒度可控共情对话生成方法，属于文本生成领域。本发明首先通过提取标准回复的话语级别、句子级别和词语级别的控制因素，然后设计掩码矩阵进行细粒度控制，训练扩散模型；最后在共情对话生成阶段，从训练集中进行语义相似性和情绪一致性的匹配检索，将检索到的回复作为原型回复并提取控制因素，然后连同对话上下文输入到训练好的扩散模型中，获得最终的共情对话生成文本。本发明能够实现精细控制，生成的回复可以受到情绪不同程度影响，生成更加自然和适应上下文的共情回复，提高回复的多样性和复杂性。

主权项：1.一种基于扩散模型的多粒度可控共情对话生成方法，其特征在于，包括以下步骤：1从训练集的对话标准回复中提取话语级别、句子级别和词语级别的控制因素，并将这些控制因素连接成一个控制序列；2通过掩码矩阵为控制因素和回复原型词语之间的对应关系建模，并将该掩码矩阵集成到扩散模型中；3将对话输入文本、控制序列和标准回复输入到扩散模型中进行训练，训练过程包括正向过程和反向过程；在正向过程中，控制对话输入文本和控制序列保持不变，增加回复的噪声，生成包含噪声的对话样本；在反向过程中，将该包含噪声的对话样本进行反向扩散，生成符合目标分布的对话样本，得到训练好的扩散模型；4在共情对话生成阶段，根据对话的输入文本，对训练集中的对话上下文根据语义相似性和情绪一致性进行上下文匹配检索，将训练集中匹配程度最高的回复作为原型回复；从该原型回复中提取话语级别、句子级别和词语级别的控制因素，并将这些控制因素连接成一个控制序列；将该控制序列连同上述对话的输入文本一同输入到训练好的扩散模型中，最终生成共情对话生成文本。

全文数据：

权利要求：

百度查询：中国科学院信息工程研究所一种基于扩散模型的多粒度可控共情对话生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种数控龙门铣床_河北大恒重型机械有限公司_202410333473.7

下一篇：一种中心静脉压手动测量装置_中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)_202410152192.1

相关技术

一种数控龙门铣床_河北大恒重型机械有限公司_202410333473.7

一种中心静脉压手动测量装置_中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)_202410152192.1

一种燃料电池用喷雾汽化加湿装置、系统与控制方法_武汉理工大学_202311803784.7

数据标注方法、电子设备和计算机可读存储介质_浙江大华技术股份有限公司_202311671122.9

一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

一体集成微同轴气密封装结构及其制造方法_中国电子科技集团公司第十三研究所_202410148673.5

一种全自动铜铝焊接装置_怀化亚信科技股份有限公司_202410351666.5

用于超声速进发直连风洞试验的发动机台架及设计方法_中国空气动力研究与发展中心高速空气动力研究所_202410420425.1

一种基于氟硼荧的离子型多孔有机聚合物及其制备方法和光催化应用_常州大学_202311787384.1

无机人造石脱模剂及其制备方法和无机人造石的制备方法_深圳市润丰新材料科技有限公司_202410151462.7

一种热升华水性油墨及其制备方法_广东睿智环保科技股份有限公司_202410410854.0

基于渐进学习的无对比剂CT血管造影重构方法及系统_中国人民解放军总医院第一医学中心_202410128554.3

龙图腾网&IPTOP

【发明公布】一种基于扩散模型的多粒度可控共情对话生成方法_中国科学院信息工程研究所_202410024770.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务