申请/专利权人:江苏大学
申请日:2021-05-27
公开(公告)日:2021-09-21
公开(公告)号:CN113420198A
主分类号:G06F16/951(20190101)
分类号:G06F16/951(20190101);G06F16/955(20190101);G06F16/958(20190101);G06F40/211(20200101);G06F40/284(20200101);G06K9/62(20060101);G06Q50/18(20120101)
优先权:
专利状态码:在审-实质审查的生效
法律状态:2021.10.12#实质审查的生效;2021.09.21#公开
摘要:本发明公开了一种针对网络商品的专利侵权线索网络爬虫方法,包括:构建专利侵权线索模板,根据高风险侵权产品、用户投诉的相关信息或相关专家经验自动挑选关键字、图片、技术特征,将这些关键字、图片放入待抓取队列;从待抓取队列中取出待抓取关键字、图片,放入搜索引擎中,并将搜索到对应的URL网页下载下来,存储进已下载URL网页库中;此外,将这些网页放进已抓取队列;分析已抓取队列中的URL网页,分析已抓取URL网页中包含的其他URL网页,并且将这些URL放入待抓取URL队列,从而进入第二次抓取,以此循环下去;分析最终抓取URL中的下载数据,获得相关产品的信息,最后推送到页面上。本发明可有效提高网络专利侵权假冒线索分析判断的精准度。
主权项:1.一种针对网络商品的专利侵权线索网络爬虫方法,其特征在于,包括以下步骤:步骤1,构建专利侵权线索模板:从涉案专利的名称、摘要、权利要求书、说明书及其附图中提取关键字、图片、技术特征,将这些关键字、图片、技术特征放入待抓取队列;步骤2,根据高风险侵权产品、高风险侵权企业生产的产品、用户投诉的相关信息或相关专家经验自动挑选关键字、图片、技术特征,将这些关键字、图片、技术特征放入待抓取队列;从待抓取队列中取出待抓取关键字、图片、技术特征,放入搜索引擎中,并将搜索到对应的URL网页下载下来,存储进已下载URL网页库中;此外,将这些网页放进已抓取队列;步骤3,分析已抓取队列中的URL网页,分析已抓取URL网页中包含的其他URL网页,并且将这些URL放入待抓取URL队列,从而进入第二次抓取,以此循环下去;步骤4,分析最终抓取URL中的下载数据,获得相关产品的标题、价格、产品介绍、规格参数、评价、所涉及到的专利、产品功能、产品配件、技术方案信息,最后推送到页面上。
全文数据:
权利要求:
百度查询: 江苏大学 一种针对网络商品的专利侵权线索网络爬虫方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。