申请/专利权人:冲电气工业株式会社
申请日:2006-09-15
公开(公告)日:2009-07-15
公开(公告)号:CN100514324C
主分类号:G06F17/27(2006.01)I
分类号:G06F17/27(2006.01)I;G06F17/28(2006.01)I;G06F17/30(2006.01)I
优先权:["2005.9.21 JP 2005-274483"]
专利状态码:有效-授权
法律状态:2009.07.15#授权;2007.07.18#实质审查的生效;2007.03.28#公开
摘要:对于包含已知词以及未知词的任何一个的句子可以实施词素分析,实现适当的最优解搜索或词素辞典的有效的创建。本发明的词素分析装置,包括:词缀复原部件,基于既定的词缀复原规则来变换输入句中单词的词缀;词素分析候补生成部件,对由词缀复原部件复原了词缀的单词串,进行词素分割以及该词素的词类赋予,并生成一个或者多个词素分析候补;生成概率计算部件,就已生成的各词素分析候补,基于词缀复原前的单词被变换成复原后的单词的概率和从词缀复原后的单词串而生成词素串以及词类串的概率之积,来求解各词素分析候补的生成概率;以及解搜索部件,从由生成概率计算部件计算了生成概率的各词素分析候补之中、将正确度最高的候补作为解来进行搜索。
主权项:1.一种词素分析装置,其特征在于,包括:词缀复原部件,基于既定的词缀复原规则来变换输入句中单词的词缀;词素分析候补生成部件,对由词缀复原部件复原了词缀的单词串,进行词素分割以及该词素的词类赋予,并生成一个或者多个词素分析候补;生成概率计算部件,就已生成的上述各词素分析候补,基于词缀复原前的单词被变换成复原后的单词的概率和从词缀复原后的单词串而生成词素串以及词类串的概率之积,来求解上述各词素分析候补的生成概率;以及解搜索部件,从由上述生成概率计算部件计算了生成概率的上述各词素分析候补之中、将正确度最高的候补即生成概率最高的候补作为解来进行搜索。
全文数据:
权利要求:
百度查询: 冲电气工业株式会社 词素分析装置以及词素分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。