买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质_国家计算机网络与信息安全管理中心;南京中新赛克科技有限责任公司_202110868718.2 

申请/专利权人:国家计算机网络与信息安全管理中心;南京中新赛克科技有限责任公司

申请日:2021-07-30

公开(公告)日:2024-04-09

公开(公告)号:CN113780338B

主分类号:G06F18/2411

分类号:G06F18/2411;G06Q10/0639;G06N20/10

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2021.12.28#实质审查的生效;2021.12.10#公开

摘要:本发明公开了一种基于支持向量机的大数据分析中置信度评价方法及系统,应用于互联网骚扰电话的分析领域,对骚扰电话进行评价;本方法基于支持向量机实现了自动分类的置信度评价,提出了海量数据分析领域中分类评价的解决方案,从而高效、直观对骚扰电话的分类。本方法提供对分析样本进行高效、准确的分类置信度评价。

主权项:1.一种基于支持向量机的大数据分析中置信度评价方法,其特征在于,包括以下步骤:步骤1,整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于设定通话时长阈值的比例、被叫号码总共小于设定接通阈值次数接通占比、被叫号码地理位置离散度、区号号码,通过上述数据集特征确定特征向量;步骤2,通过特征向量提取原始数据集,分为训练向量集和预测向量集;步骤3,训练向量集应用拉格朗日函数,求解对偶问题;步骤4:通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;步骤5:确定最优分类超平面w*.xi+b*=0;步骤6:预测向量函数其中计算超平面w*,b*关于样本点xi,yi的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;步骤7:针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:且γmax大于0;此时为向量点xi在超平面正侧距离分类边界的几何间隔;γmax为超平面正侧距离分类边界的的最大几何间隔;步骤8:针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:且γmin小于0;此时是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的最小几何间隔;步骤9:针对输出置信度pi大于设定值的预测数据,标记为骚扰数据,置信度pi小于设定值的预测数据标记为正常数据。

全文数据:

权利要求:

百度查询: 国家计算机网络与信息安全管理中心;南京中新赛克科技有限责任公司 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。