申请/专利权人:海信电子科技(武汉)有限公司
申请日:2023-08-24
公开(公告)日:2024-04-02
公开(公告)号:CN117807974A
主分类号:G06F40/186
分类号:G06F40/186;G06F40/289;G06F16/35
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.19#实质审查的生效;2024.04.02#公开
摘要:本申请提供一种终端设备及语句模板的生成方法,所述终端设备可以汇总语料数据;对预处理语料执行分词得到语料分词;对语料分词添加分类标签,以及按照语料分词的顺序对分类标签执行排列组合,以生成标签模板;对标签模板执行聚类,并选取聚类后的公共标签,以及以公共标签为起点,合并标签模板,以生成合并模板;再筛选出合并模板中的高频标签模板,以将高频标签模板作为目标语句模板。所述终端设备可以从大量语料数据中提取出目标语句模板,通过合并标签模板减少计算量解决生成语句模板的过程中语句模板的计算效率低的问题,同时可以删除低频标签,以减少干扰数据的影响,解决准确率低的问题。
主权项:1.一种终端设备,其特征在于,包括:显示器,被配置为显示用户界面;控制器,被配置为:汇总语料数据;对所述语料数据执行分词,得到语料分词;对所述语料分词添加分类标签,以及按照所述语料分词的顺序对所述分类标签执行排列组合,以生成标签模板;对所述标签模板执行聚类,并选取聚类后的公共标签,以及,以所述公共标签为起点,合并所述标签模板,以生成合并模板;筛选出所述合并模板中的高频标签模板,以将所述高频标签模板作为目标语句模板,所述高频标签模板为所述合并模板中标签频率高于第一预设频率的模板。
全文数据:
权利要求:
百度查询: 海信电子科技(武汉)有限公司 一种终端设备及语句模板的生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。