Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 提供一种识别语音声调的方法、装置、介质,方法包括:检测待识别语音的韵母的持续时间段位置;根据待识别语音的韵母的持续时间段位置来检测待识别语音的声调核部分;根据待识别语音的声调核部分来识别待识别语音的声调类别。如此,根据本公开的至少一个实施例...
  • 本申请涉及一种歌曲识别方法、计算机设备和存储介质。所述方法包括:将待识别歌曲输入至训练完成的音频分离模型中,得到待识别歌曲对应的人声音频和伴奏音频;训练完成的音频分离模型通过人声样本、伴奏样本和混合音乐样本训练得到;混合音乐样本中包含有人声...
  • 本发明涉及图像分析检测技术领域,具体为一种基于图像处理的玻璃瓶标签缺陷检测方法及系统,采用固定角度光源和近红外照射获取高分辨率图像,通过梯度增强滤波进行抑制噪声处理,检测标签边缘,识别标签区域边界,得到标签区域图像。本发明,高分辨率图像获取...
  • 本发明涉及体育视频分析技术领域,尤其涉及一种基于排球轨迹的击球行为类型识别方法,包括:S10、基于运动员的击球视频,检测击球视频中的一个或多个候选球体,从所述候选球体中筛选得到目标球体;S20、获取目标球体在击球视频中的多个轨迹片段并进行融...
  • 本发明公开了一种基于无人机的选矿车间巡检方法,涉及选矿车间巡检技术领域,具体包括以下步骤:当无人机采集的图像会受到斜光照射影响时,识别出图像中具有阴影干扰特征的区域,并将其均匀划分为若干个子区域;从无人机采集的图像中提取各个子区域的图像扰动...
  • 本发明公开了基于图像增强的头颈部放疗患者张口困难程度评估系统,包括图像采集模块、张口图像增强模块、张口图像分割模块和张口困难程度评估模块。本发明属于图像处理领域,具体是指基于图像增强的头颈部放疗患者张口困难程度评估系统,本方案采用基于敏感性...
  • 本申请提供了一种方形动力电池外壳视觉缺陷快速检测方法及系统,涉及图像处理技术领域,包括:获得高分辨率多视角图像序列,输出标准化图像数据,进行前视觉划痕检测,输出划痕缺陷位置及特征,输出包含置信度得分的缺陷候选区域,识别出气泡类缺陷,汇总缺陷...
  • 本发明提出了一种基于遥感影像进行植被覆盖异常分析的技术方法,主要包括以下步骤:首先对多时相SAR影像进行配准与预处理,并在相邻时相之间进行自适应阈值相干性检测,快速识别可疑的砍伐或严重稀疏区域;然后仅针对这些可疑区域进行双通道极化InSAR...
  • 本发明涉及爆破块度识别设备技术领域,尤其涉及基于机器视觉的爆破块度识别装置及评价方法;本申请包括有识别装置主体、数据分析计算模块、图像采集模块、红外矫正器和安装支架;本发明相较于传统爆破块度识别评价方法,通常依赖于简单的图像处理技术和特征提...
  • 本申请提供一种面向AI GC大模型应用的古典音乐可视化内容生成方法,包括:通过时频分析从古典音乐音频中获取节奏、旋律与和声的时域与频域特征,采用短时傅里叶变换生成包含频率分布与时间变化的特征矩阵,得到音乐特征序列;通过预训练的情感分析模型,...
  • 本发明公开了一种基于深度学习的网约车语音助手系统的方法和装置,具体涉及人工智能技术领域,从线上数据库随机选取网约车订单数据,包括用户语音指令的录音和对应的文本转换,并对收集到的语音指令数据进行特征工程处理,生成训练集、测试集和验证集,加载训...
  • 本发明涉及数据处理与管理技术领域,具体公开了一种天然气数据管理方法及系统。所述方法包括:采集SCADA系统、传感器设备及历史数据库中的原始数据,进行数据清洗与语义标注,生成结构化语义数据集;提取关键特征并构建本体网络与实体关系图谱;基于多任...
  • 本发明属于图像质量评价技术领域,具体涉及一种领域泛化的图像质量评价方法、程序、设备及存储介质。本发明通过共享特征提取器学习了多个数据集的图像质量特征并通过质量敏感的三元组损失构建了质量敏感的特征空间,独特的多回归器结构有效保留了各领域特有的...
  • 本发明涉及一种基于双流网络的ISAR图像质量评级方法,包括:获取待评估ISAR图像;将所述待评估ISAR图像输入训练好的ISAR图像质量评级网络中,以提取全局特征信息和局部特征信息,结合所述全局特征信息和所述局部特征信息,得到对应的图像评级...
  • 本发明实施例公开了目标检测模型的训练及目标检测方法、装置、设备及介质,目标检测模型的训练方法包括:基于回归头部网络,对训练图像的候选特征框的位置进行校准,确定目标特征框;基于图像优化网络,根据目标特征框中特征的位置坐标及位置坐标的关联坐标,...
  • 本申请涉及一种采用人工智能的语音数据提取方法及系统,涉及语音智能提取技术领域,包括:监测采集视频通信产生的视频和音频数据,获得对应数据序列;对音频序列进行语速和音量识别,获取特征参数并分别配置口型和音频权重,得到第一、第二组权重;对视频序列...
  • 本发明涉及一种基于多尺度上下文信息与注意力机制的肠壁血管分割方法,构建融合多尺度上下文信息与注意力机制的神经网络,包括特征编码器,特征编码器的多级输出分别通过结合通道注意力模块的跳跃连接、结合改进的轴向注意力模块的多尺度上下文融合模块,得到...
  • 本申请涉及智能语言发音训练领域,具体提供了基于语音识别反馈的粤语发音训练系统,其通过对用户发音进行音素级别的深度分析,系统能够精确对齐用户发音片段与标准音素序列,并创新性地计算发音偏差系数。此系数并非基于粗略声学相似度,而是通过捕获和细粒度...
  • 本发明公开了一种电动屏幕语音识别控制系统及方法,属于语音识别分析技术领域。本发明通过屏幕内置的音频采集设备采集音频数据,并通过对环境声源进行空间定位,采集的数据进行统筹规划处理形成关联图谱;根据关联图谱中对采集的音频数据进行降噪处理,对处理...
  • 本申请公开语音语义解析方法、设备及存储介质,该方法包括:确定对应逐帧输入语音的实时语音识别结果;将实时语音识别结果和上下文信息输入至语义完整性判别模型,以判断实时语音识别结果是否构成完整语义单元;在检测到实时语音识别结果构成完整语义单元的情...
技术分类