买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于AI个性化故事系统和互动故事视频生成方法_华数传媒网络有限公司_202311636841.7 

申请/专利权人:华数传媒网络有限公司

申请日:2023-11-30

公开(公告)日:2024-03-29

公开(公告)号:CN117786136A

主分类号:G06F16/48

分类号:G06F16/48;G06F16/438;G06N5/04;G06T13/40

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明提供的一种基于AI个性化故事系统和互动故事视频生成方法,其通过AI技术对故事的角色、故事内容和互动环节进行个性化设计,使得生成的数字人视频更贴合实际生活;本发明中通过获取用户上传的自定义图片、视频或音频,生成家庭成员的数字分身,通过家庭成员来讲故事,增加了数字人与用户之间亲切感;通过输入提示词,获取对应的故事文本、问答文本或插图,分析故事情感生成数字人音频语调、表情,驱动数字人生成数字人动作,结合故事音频和插图生成对应的数字人视频,使故事能够通过家庭成员讲故事,提高用户的体验感;互动过程中,本发明通过采集用户表情和问题,在故事库问答中查找或通过LLM推算出对应的问题答案并快速反馈给用户。

主权项:1.一种基于AI个性化故事系统,其特征在于,包括:构建数字人模块,获取用户上传的自定义图片、视频和音频,上传的图片和视频通过数字建模生成数字人,对自定义音频进行克隆生成数字人对应的个性化音频;故事生成模块,接收导入故事文本、问答文本和插图,存储于故事库中;根据输入的提示词,通过大语言模型、StableDiffusion生成故事文本、问答和故事插图,保存于故事库中;视频生成模块,选择数字人和故事,通过接收的故事文本、对应的音频和插图,对故事的情感、情绪信息进行识别,驱动选择的数字人生成数字人动作;对数字人动作、音频和插图进行渲染,生成数字人视频;互动模块,通过采集装置获取用户表情和语音,采用AI识别用户情绪和问题;查询故事问答库,判断故事问答库中是否具有用户对应的答案,若有,则将答案生成数字人动作,与选择的数字人结合生成对应的数字人视频;若不存在,则将识别的语音转换为文本,采用大语言模型进行推理生成答案,将答案生成数字人动作,结合选定数字人生成数字人视频。

全文数据:

权利要求:

百度查询: 华数传媒网络有限公司 一种基于AI个性化故事系统和互动故事视频生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。