恭喜东莞市铁石文档科技有限公司;广州商学院郭航获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜东莞市铁石文档科技有限公司;广州商学院申请的专利一种跨境电商场景下的多模态翻译方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119415787B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510033414.2,技术领域涉及:G06F16/955;该发明授权一种跨境电商场景下的多模态翻译方法是由郭航;王宗智;江柳;武金龙;王轻纱;陈春娣设计研发完成,并于2025-01-09向国家知识产权局提交的专利申请。
本一种跨境电商场景下的多模态翻译方法在说明书摘要公布了:本申请提供一种跨境电商场景下的多模态翻译方法,包括:获取电商平台页面内容,从页面内容中识别出商品链接、分类链接和活动链接,并提取链接的绝对路径、相对路径和动态参数信息;针对识别出的链接,采用自然语言处理技术分析链接上下文,判断链接指向的目标页面类型是商品详情页、商品列表页还是活动专题页;根据判断的目标页面类型,从预先建立的多语言页面映射表中获取链接在目标语言版本中的对应页面地址,生成链接映射关系数据;针对生成的链接映射关系数据,制定不同类型链接的处理规则,采用处理规则对链接进行批量自动转换,得到目标语言版本链接。
本发明授权一种跨境电商场景下的多模态翻译方法在权利要求书中公布了:1.一种跨境电商场景下的多模态翻译方法,其特征在于,所述方法包括:获取电商平台页面内容,从页面内容中识别出商品链接、分类链接和活动链接,并提取链接的绝对路径、相对路径和动态参数信息;针对识别出的链接,采用自然语言处理技术分析链接上下文,判断链接指向的目标页面类型是商品详情页、商品列表页还是活动专题页;根据判断的目标页面类型,从预先建立的多语言页面映射表中获取链接在目标语言版本中的对应页面地址,生成链接映射关系数据;还包括,获取待处理的链接的URL地址,采用正则表达式匹配的方式,判断链接的目标页面类型;针对判断出的目标页面类型,获取预先建立的多语言页面映射表,映射表中记录了不同语言版本中对应页面的URL地址;从多语言页面映射表中,获取与目标页面类型和目标语言版本相匹配的对应页面URL地址;若在多语言页面映射表中查找到对应页面URL地址,则将链接的URL地址和获取到的对应页面URL地址进行关联,生成链接映射关系数据;否则,记录未匹配的链接URL地址,用于后续手动处理;采用jieba分词工具对链接的锚文本进行分词,基于TF-IDF算法计算每个词的重要性得分,选取得分最高的若干个词作为关键词;将提取出的关键词作为链接映射关系数据的属性字段,与URL地址一起存储;根据链接的URL地址和锚文本的相似度,采用K-means聚类算法对链接映射关系数据进行分组;计算URL地址之间的编辑距离和锚文本关键词之间的jaccard相似度,将相似度高的数据划分到同一个聚类中,得到不同主题的链接映射关系数据集合;将生成的链接映射关系数据存储到预先建立的MySQL关系型数据库中,数据库表结构包括链接URL、目标页面类型、目标语言版本、对应页面URL和锚文本关键词字段;应用程序通过查询数据库,实现多语言网页的链接跳转;同时,利用存储的多语言链接映射关系,对网页内容进行机器翻译,生成不同语言版本的网页;针对生成的链接映射关系数据,制定不同类型链接的处理规则,采用处理规则对链接进行批量自动转换,得到目标语言版本链接;所述处理规则包括链接的结构转换规则和链接对应页面内容的翻译规则;对得到的目标语言版本链接进行有效性监测,若检测到失效链接,则分析用户行为日志和商品信息更新记录,将失效链接映射到最新的有效链接;采用自动化测试工具模拟用户点击行为,对映射后的链接进行访问测试,检查是否正确跳转到目标页面,并根据页面内容相似度判断是否为正确的目标语言版本页面。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东莞市铁石文档科技有限公司;广州商学院,其通讯地址为:523000 广东省东莞市常平镇常平金塘路5号1栋101室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。