买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种面向以太坊平台的庞氏骗局检测方法_北京工商大学_202110365475.0 

申请/专利权人:北京工商大学

申请日:2021-04-06

公开(公告)日:2024-02-02

公开(公告)号:CN112967063B

主分类号:G06Q20/40

分类号:G06Q20/40;G06F18/243;G06N20/10;G06F18/2411

优先权:

专利状态码:有效-授权

法律状态:2024.02.02#授权;2021.07.02#实质审查的生效;2021.06.15#公开

摘要:本发明公开了一种面向以太坊平台的庞氏骗局检测方法,通过提取高质量鉴别特征,并结合多种分类器训练,最终提高检测方法的正确率。在etherscan.io采集并清洗数据后,根据以下步骤检测:1提取交易特征:分别从投资和返利的角度提取合约账户交易;2提取代码特征:使用一种新的文本特征提取方法,根据操作码在合约及合约集中的频率,计算操作码的重要性指数;3组合以上特征,输入stacking集成学习训练,以第一层的输出作为第二层的输入,并采取不同于传统结合方式结合各基分类器,以达到一个最优的检测结果。本发明在特征提取阶段提取了高质量的特征,并在模型训练阶段采用基分类器结合的方式有效降低了误判概率,因此提升了检测模型的分类性能。

主权项:1.一种面向以太坊平台的庞氏骗局检测方法,其特征包括:步骤S1:根据公开的带有标签的合约账户地址,从etherscan.io平台爬取相关信息,包括智能合约与相应的交易历史,得到粗糙的合约数据;步骤S2:使用python编译器中的Pandas包和Numpy包对初始的数据进行清洗处理,将数据变成可操作的格式;步骤S3:根据交易对象及其交易信息,提取合约账户与同一对象的交易往来数据,即主要针对合约账户与参与者账户之间的交易次数、交易金额等,得到基于交易数据的最能体现庞氏骗局的特征;步骤S4:根据各操作码对庞氏骗局的重要性,使用一种新的文本特征提取方式,提取以操作码在合约及合约集中出现的频率构建操作码重要性作为代码特征;步骤S5:将得到的数据特征输入到stacking机器学习中进行训练,最后根据各个基础分类器的分类效果赋予不同权重,采取不同于传统结合方式结合所有基分类器,以求达到一个最优的检测结果;所述步骤S4:根据各操作码对庞氏骗局的重要性,使用一种新的文本特征提取方式,提取以操作码在合约及合约集中出现的频率构建操作码重要性作为代码特征,包括:步骤S41:使用pyevmasm工具将EVM字节码进行反汇编成操作码,并通过Python程序实现操作码注释、空格去除等预处理操作,最终将筛选和预处理后的操作码数据作为研究使用的数据集合;步骤S42:本文将对操作码数量进行归一化处理,以得到庞氏骗局中各操作码的频率: 其中,TFk为归一化处理后的频率,nm为特定操作码在某一个庞氏骗局中出现的次数,N为特定操作码在所有智能合约中出现的次数;步骤S43:通过统计“m”在合约数据集合中出现的频率来度量该操作码对于合约代码特征的重要程度,即对该操作码的IF值进行计算: 其中,S表示智能合约数据集合中所有操作码的总数;Dm表示智能合约数据集合中操作码“m”的数量;步骤S44:对庞氏骗局重要性高的操作码通常其TF相对较高而IF值相对较低,结合步骤S42与S43的公式,计算得出操作码“m”对庞氏骗局的重要性ITF值:ITFm=TFm*IFm。

全文数据:

权利要求:

百度查询: 北京工商大学 一种面向以太坊平台的庞氏骗局检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。