申请/专利权人:网易有道信息技术(杭州)有限公司
申请日:2023-06-16
公开(公告)日:2023-09-12
公开(公告)号:CN116737643A
主分类号:G06F15/02
分类号:G06F15/02;G06F3/0483;G06F3/0488;G06V30/42;G06V30/413;G06F3/16
优先权:
专利状态码:在审-实质审查的生效
法律状态:2023.09.29#实质审查的生效;2023.09.12#公开
摘要:本发明的实施方式提供了一种用于图画书的电子化方法、装置、电子设备及存储介质。该方法包括:获取图画书的书页图像和音频;识别书页图像中的文本区块和图画区块;判断文本区块中的文本是否为对话文本;若文本为对话文本,将文本区块和图画区块中的气泡框区块关联至对话音频节点,以在音频播放至对话音频节点时,显示文本区块和气泡框区块;以及若文本为旁白文本,将文本区块和图画区块中的背景图区块关联至旁白音频节点,以在音频播放至旁白音频节点时,显示文本区块和背景图区块。通过本发明的方法能够快速地确定阅读顺序,或定位到音频播报的文本位置,从而显著地降低了读者的阅读体验,提高了读者的阅读体验。
主权项:1.一种用于图画书的电子化方法,其特征在于,包括:获取图画书的书页图像和音频;识别所述书页图像中的文本区块和图画区块;判断所述文本区块中的文本是否为对话文本;若所述文本为对话文本,将所述文本区块和所述图画区块中的气泡框区块关联至对话音频节点,以在所述音频播放至所述对话音频节点时,显示所述文本区块和所述气泡框区块;以及若所述文本为旁白文本,将所述文本区块和所述图画区块中的背景图区块关联至旁白音频节点,以在所述音频播放至所述旁白音频节点时,显示所述文本区块和所述背景图区块。
全文数据:
权利要求:
百度查询: 网易有道信息技术(杭州)有限公司 用于图画书的电子化方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。