买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种文本分类方法及系统、意图分类系统和机器人_北京江融信科技有限公司_202110028487.4 

申请/专利权人:北京江融信科技有限公司

申请日:2021-01-11

公开(公告)日:2021-04-13

公开(公告)号:CN112347262B

主分类号:G06F16/35(20190101)

分类号:G06F16/35(20190101);G06F16/332(20190101);G06F40/35(20200101)

优先权:

专利状态码:有效-授权

法律状态:2021.04.13#授权;2021.03.02#实质审查的生效;2021.02.09#公开

摘要:本发明公开了一种文本分类方法及系统、意图分类系统和机器人,包括构建词汇表,依次对词汇表中的所有词汇进行编码;基于编码建立词汇和图像像素点的映射关系,词汇与图像像素点一一对应;构建训练样本和测试样本,基于词汇和图像像素点的映射关系将训练样本和测试样本中出现的词汇映射到图像的像素点上,并将出现词汇对应的像素点设置为第一颜色,其他像素点设置为第二颜色,形成训练样本图像和测试样本图像;第一颜色和第二颜色不相同;基于训练样本图像训练神经网络形成文本分类模型;将待分类文本映射为图像,并将其输入文本分类模型中进行文本分类;该方法把文本映射到一个图像上,用简单的神经网络或卷积神经网络进行文本分类,准确率高。

主权项:1.一种文本分类方法,其特征在于,包括以下步骤:S100:基于待分类的文本材料构建词汇表,并依次对词汇表中的所有词汇进行编码;S200:基于所述编码建立词汇和图像像素点的映射关系,其中所述词汇与图像像素点一一对应,一个词汇编码固定对应一个像素点;S300:构建训练样本和测试样本,基于所述词汇和图像像素点的映射关系将所述训练样本和测试样本中出现的词汇映射到图像的像素点上,并将出现词汇对应的像素点设置为第一颜色,其他像素点设置为第二颜色,形成训练样本图像和测试样本图像;所述第一颜色和第二颜色不相同;S400:基于所述训练样本图像训练神经网络形成文本分类模型;S500:基于所述词汇和图像像素点的映射关系将待分类文本映射为图像,并将该图像输入所述文本分类模型中进行文本分类。

全文数据:

权利要求:

百度查询: 北京江融信科技有限公司 一种文本分类方法及系统、意图分类系统和机器人

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。