申请/专利权人:宁波有一信息科技有限公司
申请日:2023-05-11
公开(公告)日:2023-10-03
公开(公告)号:CN116842147A
主分类号:G06F16/332
分类号:G06F16/332;G06F16/33;G06F16/338;G06F16/34;G06N3/0442;G06N3/08
优先权:
专利状态码:在审-公开
法律状态:2023.10.03#公开
摘要:本发明公开了一种基于多轮对话数据的第一人称情景故事自动生成方法,通过语音和文字识别用户心里活动和知识推理,最终带入到情景故事中,输出第一人称的用户故事。通过改变传统深度学习神经网络对词向量建模的方式,有效的将原始文本中的隐含的知识进行充分的挖掘,从而对知识嵌入进行建模。本发明能够准确的识别用户多轮对话中蕴含的心里活动和潜在情景知识,基于此自动生成第一人称用户故事,帮助客服更好的理解客户,为个性化智能客服对话提供基础分析依据。
主权项:1.一种通过深度神经网络来实现情景故事自动生成的方法,其特征在于:该方法包括以下具体步骤:a、第一个环节是实现客户咨询意图的抽取。第一步是获取大量带有客户意图标签的对话数据。第二步中,我们采用了基于深度学习的神经网络分类器,利用最小化softmax函数计算单词出现概率的交叉熵损失函数来预测中心词。第三步,是采用了一个双层长短期记忆(LSTM)人工神经网络完成对客户咨询意图的概率判定。b、第二个环节是实现客户画像的预测。第一步:构建三元组数据(RDF数据):针对已知标签数据,将用户ID、标签键和标签值组合成资源描述框架(RDF)三元组数据。第二步:构建知识图谱(图数据库):将所有用户的三元组数据整合到一个知识图谱中。第三步:使用GraphSAGE图嵌入技术将图中的节点和边映射到低维向量空间,从而在向量空间中挖掘节点间的潜在关系。c、第三个环节是实现客户情绪变化的追踪。第一步:对原始数据预处理与编码。第二步:设计一种设计由多个Encoder和Decoder堆叠而成的结构。第三步:使用层归一化通过对神经网络中每一层的激活输出进行归一化操作。d、第四个环节是融合各类向量并计算平均值,输入到GPT模型进行微调,以实现用户故事生成。具体来说,首先对提取的词嵌入向量、主题向量和情感向量进行加权平均,以生成一个统一的表示。接着,将这个融合向量输入到经过预训练的GPT模型中,对模型进行微调,以适应新的任务需求。
全文数据:
权利要求:
百度查询: 宁波有一信息科技有限公司 基于多轮对话数据的第一人称情景故事自动生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。