买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种用于网约车的违规载客的检测方法及系统_广州宸祺出行科技有限公司_202110605611.9 

申请/专利权人:广州宸祺出行科技有限公司

申请日:2021-05-31

公开(公告)日:2024-02-02

公开(公告)号:CN113283515B

主分类号:G06F18/241

分类号:G06F18/241;G06F18/213;G06F18/25;G06V20/59;G06V20/40;G06Q50/47;G10L15/02;G10L15/08

优先权:

专利状态码:有效-授权

法律状态:2024.02.02#授权;2021.09.07#实质审查的生效;2021.08.20#公开

摘要:本发明涉及打车出行技术领域,具体涉及一种用于网约车的违规载客的检测方法及系统。包括:获取车内的录制信息,分别获得视频数据和音频数据;读取视频数据,提取出视频数据的多个视频特征;对多个视频特征进行合并处理,获得全局视频特征向量;读取音频数据,提取出音频数据的多个音频特征;对多个音频特征进行合并处理,获得全局音频特征向量;对全局视频特征向量和全局音频特征向量进行多模态融合,获得融合特征;对融合特征进行分类处理,获得检测模型;实时获取车内录制信息,利用检测模型进行违规识别。该检测方法及系统具有准确率高和抗干扰能力强的优点,解决了现有检测技术存有的准确率低和抗干扰能力差的问题,满足了网约车检测需要。

主权项:1.一种用于网约车的违规载客的检测方法,其特征在于,该方法包括:获取车内的录制信息,分别获得视频数据和音频数据;读取视频数据,提取出视频数据的多个视频特征;对多个视频特征进行合并处理,获得全局视频特征向量,具体为:读取多个视频特征,通过聚合算法对多个视频特征进行训练处理,将视频特征转化为多个视频镜头特征,然后对多个视频镜头特征进行加权求和,获得全局视频特征向量;所述的聚合算法包括卷积神经网络算法;读取音频数据,提取出音频数据的多个音频特征;对多个音频特征进行合并处理,获得全局音频特征向量,具体为:读取多个音频特征,通过聚合算法对多个音频特征进行训练处理,将音频特征转化为多个音频镜头特征,然后对多个音频镜头特征进行加权求和,获得全局音频特征向量;所述的聚合算法包括卷积神经网络算法;对全局视频特征向量和全局音频特征向量进行多模态融合,获得融合特征,具体为:读取全局视频特征向量和全局音频特征向量,利用融合算法分别对全局视频特征向量和全局音频特征向量进行加权处理,然后采用特征拼接的方式生成融合特征;所述的融合算法为跨模态注意力模型算法;对融合特征进行分类处理,获得检测模型,具体为:将融合特征输入到多层感知机,多层感知机对融合特征进行多次迭代的计算训练,进而对融合特征进行分类并生成标签,形成融合特征所对应的检测模型;实时获取车内的录制信息,利用检测模型进行违规识别。

全文数据:

权利要求:

百度查询: 广州宸祺出行科技有限公司 一种用于网约车的违规载客的检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。