买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】用于数据中台的数据智能清洗方法_卓世智星(成都)科技有限公司_202410160028.5 

申请/专利权人:卓世智星(成都)科技有限公司

申请日:2024-02-05

公开(公告)日:2024-04-26

公开(公告)号:CN117711419B

主分类号:G10L21/0232

分类号:G10L21/0232

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2024.04.02#实质审查的生效;2024.03.15#公开

摘要:本发明涉及数据处理技术领域,具体涉及用于数据中台的数据智能清洗方法,包括:采集语音信号数据;将原始语音数据分成多个数据区间;将任意一个数据区间记为参考数据区间,根据数据区间中数据的变化与对应时间段内的原始语音数据的变化,获得参考数据区间的纯噪声程度;通过比较预设阈值与参考数据区间的纯噪声程度的数值大小获得噪声数据区间和非噪声数据区间;根据噪声数据区间之间的相似性与非噪声数据区间之间的差异性获得每个噪声数据区间的权重;根据每个噪声数据区间的权重对始语音信号数据进行去噪。本发明通过分析语音信号在不同数据区间上的变化,自适应噪声数据区间与非噪声数据区间的权重,使得对语音信号的去噪更彻底。

主权项:1.用于数据中台的数据智能清洗方法,其特征在于,该方法包括以下步骤:采集语音信号数据,记为原始语音数据;将原始语音数据分成多个短时帧,将任意一个短时帧记为参考短时帧;获取参考短时帧的第一极值序列,根据第一极值序列的数据间隔构建直角坐标系;根据直角坐标系中的数据点的分布获得多个数据区间;将任意一个数据区间记为参考数据区间,根据参考数据区间中数据的变化与对应时间段内的原始语音数据的变化,获得参考数据区间的纯噪声程度;通过比较预设阈值与参考数据区间的纯噪声程度的数值大小获得噪声数据区间和非噪声数据区间;根据噪声数据区间之间的相似性,以及噪声数据区间与非噪声数据区间之间的差异性,获得每个噪声数据区间的最终权重;根据每个噪声数据区间的最终权重对原始语音数据进行去噪;所述根据参考数据区间中数据的变化与对应时间段内的原始语音数据的变化,获得参考数据区间的纯噪声程度,包括的具体步骤如下:获取原始语音数据的拟合曲线在时间区间内的定积分、参考数据区间的拟合曲线在时间区间内的定积分以及拟合曲线在时间区间内的数据点的方差;根据原始语音数据的拟合曲线在时间区间内的定积分、参考数据区间的拟合曲线在时间区间内的定积分以及拟合曲线在时间区间内的数据点的方差获得参考数据区间的纯噪声程度;所述根据原始语音数据的拟合曲线在时间区间内的定积分、参考数据区间的拟合曲线在时间区间内的定积分以及拟合曲线在时间区间内的数据点的方差获得参考数据区间的纯噪声程度,包括的具体步骤如下: 式中,表示参考数据区间的纯噪声程度,表示参考数据区间对应的时间区间,表示时间区间的下限,表示时间区间的上限;表示原始语音信号数据的拟合曲线,表示参考数据区间的拟合曲线,表示拟合曲线在时间区间内的数据点的方差,表示线性归一化函数;表示在时间区间中,对原始语音信号数据的拟合曲线求定积分;表示在拟合曲线在时间区间内的定积分;所述根据噪声数据区间之间的相似性,以及噪声数据区间与非噪声数据区间之间的差异性,获得每个噪声数据区间的最终权重,包括的具体步骤如下:获取不同噪声数据区间的纯噪声程度的差值、不同噪声数据区间的相似性、以及噪声数据区间与非噪声数据区间纯噪声程度的差值,根据不同噪声数据区间的纯噪声程度的差值、不同噪声数据区间的相似性、以及噪声数据区间与非噪声数据区间纯噪声程度的差值,获得每个噪声数据区间的最终权重;所述根据不同噪声数据区间的纯噪声程度的差值、不同噪声数据区间的相似性、以及噪声数据区间与非噪声数据区间纯噪声程度的差值,获得每个噪声数据区间的最终权重,包括的具体步骤如下: 式中,表示第个噪声数据区间的权重,表示第个噪声数据区间的纯噪声程度,表示第个噪声数据区间的纯噪声程度,表示第个噪声数据区间与第个噪声数据区间的相似性,表示第个非噪声数据区间的纯噪声程度,表示噪声数据区间的数量,表示非噪声区间的数量,表示以自然常数为底的指数函数;根据所有噪声数据区间的权重对每个数据区间的权重进行归一化,获得每个数据区间的最终权重;所述根据所有噪声数据区间的权重对每个数据区间的权重进行归一化,获得每个数据区间的最终权重,包括的具体步骤如下: 式中,表示第个噪声数据区间的最终权重,表示第个噪声数据区间的权重,表示噪声数据区间的数量。

全文数据:

权利要求:

百度查询: 卓世智星(成都)科技有限公司 用于数据中台的数据智能清洗方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。