申请/专利权人:谷歌有限责任公司
申请日:2021-09-03
公开(公告)日:2024-04-05
公开(公告)号:CN117836779A
主分类号:G06N3/084
分类号:G06N3/084;G06F40/30;G06N3/04
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.23#实质审查的生效;2024.04.05#公开
摘要:方法、系统和装置,包括在计算机存储介质上编码的计算机程序,用于改进嵌入空间中的词汇表的项的表示以用于机器学习模型。生成嵌入矩阵,其中,嵌入矩阵中的每一行是元素的向量并且对应于词汇表的项。向嵌入矩阵中的每个向量分配分数,该分数指示其对应的向量在机器学习模型中被使用的概率。通过对向量的真子集进行采样并基于向量的相应分数更新向量的真子集中的每个相应向量的元素来迭代地更新分数。然后基于机器学习模型的损失函数来更新每个向量的分数。然后基于更新的向量的分数来重构嵌入矩阵。
主权项:1.一种计算机实现的方法,包括:生成用于机器学习模型的嵌入矩阵,所述嵌入矩阵定义多个行,其中,所述嵌入矩阵中的每一行是元素的向量并且对应于词汇表的项;向嵌入矩阵中的每个向量分配分数,每个分数是其对应的向量在机器学习模型中被使用的概率;更新嵌入矩阵中的向量,其中,所述更新包括迭代地处理嵌入矩阵的向量,并且对于每次迭代:从嵌入矩阵的向量中采样用于迭代的向量的真子集;基于向量的真子集的相应分数来更新向量的真子集中的每个相应向量的元素;基于机器学习模型的损失函数来更新向量的真子集中的每个向量的分数;以及基于嵌入矩阵中的向量的更新的分数来重构嵌入矩阵;其中,对于多次迭代,选择向量的不同真子集。
全文数据:
权利要求:
百度查询: 谷歌有限责任公司 使用多模型随机稀疏诱导正则化学习词元重要性
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。