【发明授权】一种基于英语口语文本的语义分析方法_山东同其万疆科技创新有限公司;临沂科技职业学院_202311625052.3

申请/专利权人：山东同其万疆科技创新有限公司;临沂科技职业学院

申请日：2023-11-30

公开（公告）日：2024-03-01

公开（公告）号：CN117332788B

主分类号：G06F40/30

分类号：G06F40/30;G06F40/284;G06F18/213;G06F18/24;G06F40/126;G06N3/0442;G06N3/0499;G06F18/25;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.03.01#授权;2024.01.19#实质审查的生效;2024.01.02#公开

摘要：本发明公开了一种基于英语口语文本的语义分析方法，属于语义分析技术领域，本发明中先将英语口语文本进行分词处理，由于各个词在计算机中由编码构成，因此，得到词编码集合，并提取出标点文本编码，该标点文本编码用于表征该英语口语文本中采用的标点符号。本发明中先将词编码集合输入词特征提取模型，得到词特征，然后进行分类处理，分出每个词编码的类型，找到主、谓和宾，根据主、谓和宾对词编码集合进行再次划分，得到主、谓和宾各自的词编码子集，从而再根据主、谓和宾各自的词编码子集，以及标点文本编码，去进行语义分析，提高对英语口语文本的语义分析的精度。

主权项：1.一种基于英语口语文本的语义分析方法，其特征在于，包括以下步骤：S1、将英语口语文本进行分词处理，构成词编码集合，并提取标点文本编码；S2、将词编码集合输入词特征提取模型，得到词特征；S3、采用全连接层对词特征进行分类，得到每个词编码的类型，其中，词编码的类型包括：主语、谓语和宾语；S4、根据每个词编码的类型，对词编码集合中词编码进行划分，得到词编码子集；S5、采用语义分析模型处理各词编码子集和标点文本编码，得到语义分析结果；所述S5中语义分析模型包括：主语特征提取单元、谓语特征提取单元、宾语特征提取单元、Concat层、标点增强单元和BP神经网络；所述主语特征提取单元的输入端用于输入主语词编码子集；所述谓语特征提取单元的输入端用于输入谓语词编码子集；所述宾语特征提取单元的输入端用于输入宾语词编码子集；所述Concat层的输入端分别与主语特征提取单元的输出端、谓语特征提取单元的输出端和宾语特征提取单元的输出端连接，其输出端与标点增强单元的输入端连接；所述BP神经网络的输入端与标点增强单元的输出端连接，其输出端作为语义分析模型的输出端；所述标点增强单元用于根据标点文本编码，对Concat层的输出特征值进行增强；所述标点增强单元的表达式为：，其中，g为标点增强单元的输出，sigmoid为激活函数，pi为标点文本编码中第i个编码值，ωp,i为pi的权重，bp,i为pi的偏置，H为Concat层的一个输出特征值，L为标点文本编码中编码值的数量，i为编码值的编号；所述主语特征提取单元、谓语特征提取单元和宾语特征提取单元均包括：第二卷积层、第一残差块、第二残差块和自增强层；所述第二卷积层的输入端作为主语特征提取单元、谓语特征提取单元或宾语特征提取单元的输入端，其输出端与第一残差块的输入端连接；所述第二残差块的输入端与第一残差块的输出端连接，其输出端与自增强层的输入端连接；所述自增强层的输出端作为主语特征提取单元、谓语特征提取单元或宾语特征提取单元的输出端；所述自增强层的表达式为：，其中，Zk为自增强层输出的第k个特征值，rk为第二残差块输出的第k个特征值，K为第二残差块输出的特征值的数量，k为特征值的编号，exp为以自然常数为底的指数函数。

全文数据：

权利要求：

百度查询：山东同其万疆科技创新有限公司;临沂科技职业学院一种基于英语口语文本的语义分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

下一篇：一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

相关技术

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种砂浆稠度仪_宜昌市科信水电工程质量检测有限公司_202322336666.1

口语相关技术

一种显示设备及多窗口语音播报方法_海信视像科技股份有限公司_202110481495.4

一种交互式英语口语评测方法及系统_贵州贝德汇数据科技有限公司_202311761555.3

自然语言中口语化时间词语转换方法、装置、设备及介质_海信集团控股股份有限公司_202311637791.4

一种零资源口语评测方法及系统_新疆大学_202311712573.2

一种基于ChatGPT的口语训练方法、装置、电子设备及介质_青岛培诺教育科技股份有限公司_202410057758.2

一种口语练习装置_石亚丽_202322159299.2

一种口语训练辅助器_昌吉学院_202321226256.5

一种口语智能测试笔_志功教育科技(山东)有限公司_202320360448.9

口语评测方法、装置、设备及存储介质_科大讯飞股份有限公司_202311642830.X

一种日语口语交流装置_山东青年政治学院_202322422778.9

文本相关技术

基于深度学习的评论文本方面级情感分类方法及系统_上海哈蜂信息科技有限公司_202010776165.3

一种基于深度学习的文本生成图像学习方法_大连理工大学_202111183091.3

一种文本行图片的解码方法、装置和设备_北京有竹居网络技术有限公司_202110558943.6

基于宏微观特征的中文文本笔迹鉴别方法、装置及存储介质_大连海事大学_202011643169.0

文本意图识别方法、装置、设备和存储介质_平安科技(深圳)有限公司_202010033742.X

文本细粒度情感分类方法、系统、装置及存储介质_华南理工大学_202010560649.4

一种基于文本的实体识别方法及相关装置_广东工业大学_202010844442.X

一种相似文本内容的识别方法、装置及存储介质_广州腾讯科技有限公司_201810595368.5

文本检测方法、装置、计算机设备和存储介质_腾讯科技(深圳)有限公司_202011020108.9

基于注意力机制的幽默文本分类方法、装置、设备、介质_中国平安人寿保险股份有限公司_202111433978.3

分析相关技术

流体分析设备_SCR工程有限公司_202080071069.7

分析及利用景观_科磊股份有限公司_202011580664.1

泌尿事件检测、跟踪和分析_克里特克技术有限责任公司_201980050525.7

液体试剂供应装置及分析装置_东亚DKK株式会社_202010736498.3

设备故障温度分析诊断方法_中冶北方(大连)工程技术有限公司_202110942204.7

一种纺织皮革材料检测分析处理装置_连州市宏图新材料有限公司_202322082016.9

一种地质勘察水质分析装置_福建省水文地质工程地质勘察研究院_202322377850.0

基于用户画像分析的广告自动优化投放系统_深圳市瀚力科技有限公司_202310656929.9

故障根因分析方法、装置、设备和存储介质_中国工商银行股份有限公司_202210637698.2

用于分析乳房托环境的系统和方法_通用电气精准医疗有限责任公司_202311258611.1

龙图腾网&IPTOP

【发明授权】一种基于英语口语文本的语义分析方法_山东同其万疆科技创新有限公司;临沂科技职业学院_202311625052.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务