申请/专利权人:北京字跳网络技术有限公司
申请日:2022-09-19
公开(公告)日:2024-04-02
公开(公告)号:CN117807427A
主分类号:G06F18/214
分类号:G06F18/214;G06F18/20;G06F18/24;G06F40/205
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.19#实质审查的生效;2024.04.02#公开
摘要:本申请提供了一种用于字符文本信息分析的目标分析模型的获取方法和装置,方法包括:获取初始训练样本集;根据源数据集,生成至少一个预设属性分布表达式;根据至少一个预设属性分布表达式对第一目标数据集进行处理,得到带有伪标识的扩充样本数据后的第二目标数据集;根据源数据集和第二目标数据集得到至少一个预设属性对应的数据量信息;根据数据量信息以及源数据集,调整初始分析模型的初始模型参数,得到目标分析模型。通过本申请,解决相关技术中存在得到的字符文本分析模型待花费的开发成本较高,输出的分析结果不够准确的问题。
主权项:1.一种用于字符文本信息分析的目标分析模型的获取方法,其特征在于,所述方法包括:获取初始训练样本集,其中,所述初始训练样本集为训练初始分析模型的样本数据,所述初始训练样本集包括带有用于表示预设属性类别的标识的源数据集和不带所述标识的第一目标数据集;根据所述源数据集,生成至少一个预设属性分布表达式;根据至少一个所述预设属性分布表达式对所述第一目标数据集进行处理,得到带有伪标识的扩充样本数据后的第二目标数据集;根据所述源数据集和所述第二目标数据集得到所述至少一个预设属性对应的数据量信息;根据所述数据量信息以及所述源数据集,调整所述初始分析模型的初始模型参数,得到目标分析模型,其中,所述目标分析模型用于对字符文本信息中包含的所述预设属性进行分析。
全文数据:
权利要求:
百度查询: 北京字跳网络技术有限公司 用于字符文本信息分析的目标分析模型的获取方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。