申请/专利权人:珠海金智维信息科技有限公司
申请日:2023-12-08
公开(公告)日:2024-04-12
公开(公告)号:CN117873585A
主分类号:G06F9/445
分类号:G06F9/445;G06V20/60;G06V10/22;G06V10/25;G06V10/44;G06V10/82;G06F40/30;G06N3/0455;G06N3/084
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.30#实质审查的生效;2024.04.12#公开
摘要:本发明提出了一种基于CLIP和LLM的RPA操作流生成方法及装置,该方法包括:通过CLIP微调数据集对预训练的CLIP模型进行训练;通过第一LLM微调数据集和第二LLM微调数据集对预训练的LLM模型进行训练;通过LLM模型对目标任务描述进行处理得到目标CLIP指令;根据目标CLIP指令中的数据获取目标页面,对目标页面进行图片获取得到目标图片;通过CLIP模型对目标图片进行预测得到目标图片中各个元素的目标位置信息;通过LLM模型对目标任务描述和目标位置信息进行处理得到目标RPA指令;将目标RPA指令输入到预设的RPA平台,使得RPA平台生成RPA操作流。从而快速生成RPA操作流。
主权项:1.一种基于CLIP和LLM的RPA操作流生成方法,其特征在于,包括:获取CLIP微调数据集,通过所述CLIP微调数据集对预设的CLIP模型进行训练,预设的所述CLIP模型为预训练后的CLIP模型;获取第一LLM微调数据集和第二LLM微调数据集,通过所述第一LLM微调数据集和所述第二LLM微调数据集对预设的LLM模型进行训练,预设的所述LLM模型为预训练后的LLM模型;获取用户输入的目标任务描述,通过所述LLM模型对所述目标任务描述进行处理,得到目标CLIP指令;根据所述目标CLIP指令中的数据获取目标页面,并对所述目标页面进行图片获取,得到目标图片;将所述目标图片发送到CLIP模型,通过所述CLIP模型对所述目标图片进行预测,得到所述目标图片中各个元素的目标位置信息;通过所述LLM模型对所述目标任务描述和所述目标位置信息进行处理,得到目标RPA指令;将所述目标RPA指令输入到预设的RPA平台,使得所述RPA平台响应于所述目标RPA指令,生成RPA操作流。
全文数据:
权利要求:
百度查询: 珠海金智维信息科技有限公司 基于CLIP和LLM的RPA操作流生成方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。