买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】新同声近位汉字码输入法_王治阳_202310081787.8 

申请/专利权人:王治阳

申请日:2023-01-08

公开(公告)日:2023-11-24

公开(公告)号:CN117111752A

主分类号:G06F3/023

分类号:G06F3/023

优先权:["20220222 CN 202210189185.X","20220722 CN 202210919982.9","20221016 CN 202211315290.X","20221116 CN 202211661234.1"]

专利状态码:在审-公开

法律状态:2023.11.24#公开

摘要:一种计算机汉字编码输入方法即新同声近位汉字码输入法,它由音码和形部编码两部分组成,主要编码原理是同音同偏旁部首的合体字除偏旁部首外的部分的第一笔为同类基本笔画的情况出乎意外的少,并按同声近位法排列拼音首字母相同的多笔画部件,采用双层扫描技术取形部编码第二码,只需选用21个左右的多笔画部件和五种基本笔画就能做到既简单又快速地输入汉字和词组。

主权项:1.一种计算机汉字编码键盘输入法即新同声近位汉字码输入法,将汉字的各种笔画按国家语委的规定归类为横、竖、撇、点、折五种基本笔画后,其特征是:1、编码由两部分组成,一部分是音码,即拼音,或称拼音码,另一部分是辅助码,辅助码分为形部编码和简辅助码,汉字码的两部分可前可后,一经选定,不能改变,一般音码在先;2、音码可采用全拼或双拼或简拼或不完整拼音,也可采用中国台湾注音和音素字母;各字母标点符号数字键与拼音韵母和音素字母韵母的一种映射关系: 各字母标点符号数字键与拼音韵母和音素字母韵母的另一种映射关系: 3、形部编码的第一种取码规则是:独体字,按书写顺序取前二个基本部件的相应代码编码,或者按书写顺序取第一个和最末一个基本部件的相应代码编码,当只有一个基本部件时,就只取这个基本部件的相应代码编码,当然也可规定独体字按书写顺序取该汉字的第一个和最末个基本部件的相应代码编码;合体字,按整体结构一分为二,按书写顺序包含该汉字第一个笔画的部分为首部,后写部分为剩部,按书写顺序分别取首部的第一个基本部件和剩部的第一个基本部件的相应代码编码;形部编码的第二种取码规则是:左右结构的汉字,分别取左边部分、右边部分的书写顺序的第一个部件的相应代码编码;非左右结构的汉字,按书写顺序取该汉字的第一个和最末一个基本部件的相应代码编码,只有一个基本部件就只取这个基本部件的相应代码编码或者接连二次取这个基本部件的代码编码;或者规定:非左右结构的汉字,按书写顺序取取该汉字的第一个基本部件和该汉字的右下角包围结构时取被包围内的右下角的一个基本部件编码;形部编码取码的第三种规则:形部编码的第一码是:先不管三七二十一,按书写顺序取该汉字的第一个基本部件的代码编码;形部编码的第二码,则从该汉字的第一个基本部件的右侧开始,左到右边扫描或者说看一下,如果能用一条竖线在不割断该汉字的笔画的情况下,能将该汉字一分为二的,则该汉字为左右结构,竖线右边的部分为该汉字的右边部分,再按书写顺序取该汉字右边部分的第一个基本部件的代码编码,如果不能用一条竖线在不割断笔画的情况下将该汉字一分为二,就从左到右扫描该汉字的下半层或者说下半部分,顺势找到这个汉字的按书写顺序的最末一个基本部件的代码编码或者取该汉字右下角所在基本部件的相应代码进行编码;左右结构的汉字往往具有明显的间隙,很容易分清楚,所以不用竖线去分割也是可以,第二码只要从该汉字的第一个基本部件的右侧开始,从左到右扫描,找到整个汉字的左右部分间隙,间隙的右边的部分就是该汉字的右边部分,再按书写顺序取该汉字的右边部分的第一个基本部件的代码编码,如果该汉字左右没有间隙,就从左到右扫描或者说看一下该汉字的下半层或者说下半部分或者说下层部分,顺势找到这个汉字的按书写顺序的最末一个基本部件的代码编码;简单地说,形部编码的第一码是:按书写顺序取该汉字的第一个基本部件的代码编码;形部编码的第二码取码时先从左到右扫描一下该汉字,如果该汉字为左右结构的,能找得到右边部分的,按书写顺序取该汉字的右边部分的第一个基本部件的代码编码;如果找不到右边部分的,就从左到右扫描一下该汉字的下半层,顺势找到该汉字的按书写顺序的最末一个基本部件的代码编码;3形部编码取码规则时,优选五种基本笔画和21个多笔画部件参与编码,选用多笔画部件时主要考虑3755个常用汉字中这些多笔画部件的组字频率和重码率,多笔画部件按拼音首字母或声母编码,遇到几个多笔画部件的拼音首字母相同时按同声近位法排列,并进行精确定位计算排列,方法是有些部首组字能力很强,使用频率高,但在各个26个字母所在的声母或韵母的音节中分布并不均匀,在某些声母和韵母所在的拼音音节中,这些部首所在的汉字的数量却很少,如果将这些部首用某个特定的字母编码,则能有效地避免字词重码;在同音近位法排列的基础上,特意将惯常出现在汉字的形部编码第一码,而很少出现在形部编码第二码的部首用元音字母E、I、A、O、U编码,按避免重码能力大小,氵、艹、口、木、扌、亻、土、钅分别用一个字母编码,部首辶、忄、纟、日、火、讠、足、石、王、疒也分别用别的一个字母编码;横、竖、撇、点、折五种基本笔画以及王、土、钅、口、忄、宀、女、木等多笔画部件都按拼音首字母编码,其余的多笔画部件则按同声近位法排列编码;4以字词分别统计的北京语言大学词频总汇为例,经测算发现,日、人亻、土、讠、月、氵、扌、火、金、艹、虫、木等多笔画部件参与编码的汉字,若按笔画编码,则发生重码的汉字的频数和,及与它发生重码的别的汉字的频数和都很高,所以要入选,而宀穴部按宀编码、辶、竹、火、石、山如果按笔画编码,则发生重码的汉字的频数和分别是888、767、191、177、128、59,而与它发生重码的汉字的频数和分别是1209、1916、523、563、363、229;这样宀穴部按宀编码、辶频数和较高,建议入选,竹、火次之,也建议入选,而部首山较低,不大建议入选,至于石,则要根据足的情况来判断,足按第一笔“竖”编码,本身的重码的频数约为236干,把与含“足”的汉字重码的汉字算进去的话,频数为316千,而足若按“口”编码,则“足”参与形部编码的汉字的统计进去的话,频数和为502千,总的来看还是部首足的频数和较高,建议选部件“足”,而石落选,当然考虑到足部的汉字重码时频数差距悬殊,比如“路”和“噜”和“卢”的频数频率就差得很大,因此也可以选部件石,而不选部件足;当然也可石和足同时选,只是这样一个键上就有两个部首了,不在一个字母对应一个部首了,不方便显示在手机屏上;5在同音近位法排列的基础上,特意将惯常出现在汉字的形部编码第一码,而很少出现在形部编码第二码的部首用元音字母E、I、A、O、U编码,按避免重码能力大小,氵、艹、口、木、扌、亻、土、钅分别用一个字母编码,部首辶、忄、纟、日、火、讠、足、石、王、疒也分别用别的一个字母编码;横、竖、撇、点、折五种基本笔画以及王、土、钅、口、忄、宀、女、木等多笔画部件都按拼音首字母编码,其余的多笔画部件则按同声近位法排列编码;6其中亻和日、讠和月、横和火、虫和艹、折和辶和足、竖和氵和扌和石和纟的拼音首字母相同,分别为r、y、h、c、z、s;亻和日、讠和月,横和火、虫和艹均为两个部首的拼音首字母相同,为便于记忆,就按左右相邻位置一起排在键盘上,以便于记忆;7艹和虫的拼音首字母都是c,按同声近位法,只能排在c、v两个相邻的键上,由于v是韵母,罕见,所以只要考虑它们在拼音首字母c中在汉字字首时出现的汉字的个数即可,虫出现了3个,频数和比较低,艹出现了11个,频数和高得多,由于v作为韵母,所以为了避免字词重码,所以建议用频数和比较低的多笔画部件,在常用汉字中,出现在形部编码第二码的汉字的组字个数和频数和计算,也是虫较低,艹则要高得多;因此,虫用v编码,艹用c编码,可以简记为草虫;艹的拼音为cao,虫的拼音为chong,按音序排列也应该是艹用c编码,虫用v编码;8笔画横和部首“火”的拼音首字母为H,由于J已经排列部首钅,因此“火”只能用H键左边相邻的G编码;9日和亻的拼音首字母的r,按同声近位方法排列只能排在e和r这两个左右相邻的键上;从避免字词重码的角度看,要统计韵母为ue、ie的汉字中,基本部件日和亻的个数和频数和,由于基本部件“日”出现的汉字个数和亻出现的汉字个数都只有较少,频数和也很低很接近,所以需要考虑基本部件亻和日在形部编码第二码中的组字频率,由于E是韵母,要求频率和或者说频数和较低;经统计,基本部件“日”出现的汉字个数是218个,频数和较高,而亻含人出现的汉字只有5个,频数和较低;从常用汉字中出现在形部编码第二码的汉字的个数、频数和考虑,也是多笔画部件“日”较高,而多笔画部件“亻含人”较低,所以只能将形部编码第二码中频数和较低的基本部件亻用E编码,而形部编码第二码中频数和较高的基本部件“日”用拼音首字母r编码;而亻的拼音为REN,韵母首字母恰好是E,记忆方便;10竖、纟、扌、氵的拼音首字母都是s,基本笔画竖非常常见,竖当然用s键编码,I键、O键、A键可以视为与S键相邻;纟、扌、氵可排列到I、O、A键上;为此本人用运筹学进行了定量计算;在拼音首字母为a的汉字中,含部件氵的汉字为1个,频数为5920个,含部件扌的汉字为2个,频数和为64779个,所以氵用a编码较好,而拼音首字母为o的汉字中,含氵的汉字为1个,含有扌的汉字则没有,所以扌用o编码比较合适;而拼音首字母i、o、a开头的汉字中,都没有纟,而o、a都已经分别用扌、氵编码,综合考虑,纟就用剩下的i编码;从韵母i、o、a的频率看,i最高,a次之,o最低,而从部首的使用频率看,纟最低,氵次之,扌最高,从编码字词重码的角度看,频率高的韵母适合搭配使用频率低的多笔画部件或者说部首,频率低的韵母适合搭配使用频率高的多笔画部件或者说部首,因此纟用i编码合适,扌用o编码合适,氵恰好用a编码合适;而纟、扌、氵恰好分别用韵母首字母i、o、a编码,容易记忆;11纟的拼音为si,为两个字母,扌的拼音为shou,为四个字母,氵的拼音为shui,所以可以从键盘的上排从左到右,再到键盘的中排,分别按拼音字母的个数,拼音字母个数相同的时候按音序排列;将纟、扌、氵分别排在i、o、a键上,分别用相应的字母编码;12月和讠的拼音首字母都是y,按同声近位方法排列只能排在y和u两个相邻的键上;从避免字词重码的角度看,需要考虑基本部件“月”和讠出现在韵母为iu或者ou的汉字的频率或者说频数和;基本部件“月”出现在字首的汉字的个数为2个,而讠出现在字首的汉字为8个;这些汉字的频数和使用频率之和也是月部的汉字比较低,所以基本部件月用u编码,讠用y编码比较合适;这时输入形部编码几乎不会发生重码;又比较声母为y的汉字中,字首为“月”和讠的汉字的个数,字首为“月”的汉字为10个,字首为讠的汉字个数为15个,频数和即使用频率之和也是讠部较高,所以基本部件讠用y编码,基本部件“月”用u编码,而u恰好是“月”的韵母首字母,非常容易记忆;另外从音序角度看,讠的拼音为yan,月的拼音为yue,按音序从左到右排列的话,也应该是基本部件讠用y编码,基本部件“月”用u编码;13折、辶和足和竹的拼音首字母都是z,笔画折很常见,当然用z表示;按同声近位法,辶和足和竹只能排在剩下的l、Q、F键上,其中l、z分别位于键盘第二排的最右边和第三排的最左边,可以认为是近位的,而键盘下排z之右边的字母都已经排列了部首,因此按同声近位规则,键盘上排的Q键和F键也勉强算近位的;由于汉语中声母L的频率要比声母F和Q常见得多,因此先排拼音首字母L;辶只能出现在汉字的字尾,频数和为0;拼音首字母为L时,足在字首的汉字有7个,频数和为109352个,竹在字首的汉字有12个,频数和达到16734个;可见足和竹都不大适合用L编码;从避免字词重码的角度,辶用L编码,就能使得字词重码为0;这是很巧妙的排列;字首为足、拼音首字母为F的汉字有3个,频数和为293;字首为竹、拼音首字母为F的汉字也有3个,频数和为16022个;字首为足,拼音首字母为Q的汉字有5个,频数和为7626个;字首为竹,拼音首字母为Q的汉字有5个,频数和为9664个;从个数看,足和竹都在拼音首字母为F和Q键上都较少且接近,从频数和看,在拼音首字母为Q和F的汉字中,都是竹部首较多,所以足和竹,可以在F和Q中各自任挑一个,从击键方便的角度看,竹用F编码,足用Q编码比较合适;当然,竹用Q编码,足用F编码也行;从记忆角度看,拼音首字母都是z,只能改按笔画排列,足的首笔是竖,竹的首笔是撇,辶的首笔是点,按次序排列是竖、撇、点,在键盘上从左到右的次序是Q、F、L,所以就将足、竹、辶分别按其首笔画竖、撇、点依次从左到右Q、F、L键上,分别用Q、F、L编码;从形似的角度看,足的首尾形似Q,竹的左半部分或者右半部分形似F,辶也形似L,容易记忆;当然还可以从字母个数和音序的角度排序,足的拼音为zu,只有二个字母组成,所以排在键盘最左边的q上,而竹的拼音为zhu,辶的拼音为辶,都是三个字母,按音序将竹、辶分别从左到右排列在f、l键上,分别用相应的字母编码;21个基本部件、五种基本笔画与字母键的一种影射关系设定为: 25个多笔画部件、五种基本笔画与字母、标点符号的另一种影射关系设定或者设定为: 21个多笔画部件、五种基本笔画与字母、标点符号的影射关系设定为: 21个多笔画部件、五种基本笔画与字母、标点符号的另一种影射关系设定为: 21个多笔画部件、五种基本笔画与字母、标点符号的另一种影射关系设定为: 21个多笔画部件、五种基本笔画与字母、标点符号的影射关系设定为: 21个多笔画部件、五种基本笔画与字母、标点符号的一种影射关系设定为: 25个多笔画部件、五种基本笔画与字母、标点符号的一种影射关系设定为: 简辅助码的第一种输入规则是横、竖、撇、点、折五种基本笔画分别用拼音首字母H、S、P、D、Z作代码,输入某个汉字的第一个基本笔画的代码后,左右扫描该汉字,若该汉字为左右结构,则按书写顺序取该汉字右边部分的第一个基本笔画的代码编码;若无右边部分,则按书写顺序取该汉字的最末一个基本笔画的代码编码;这时可以通过人工智能和搜索引擎技术,让最有可能需要输入的汉字出现在候选字的第一位;简辅助码的第二种输入规则是:对于不认识的汉字,只要根据附图中形部编码键盘排列图的映射关系,规定只要按书写顺序一次输入该汉字的基本笔画和多笔画部件的代码,再根据提示行选择即可输入该汉字;基本免去同音词选择的方法是只要在某个同音词的编码后,输入该同音词的第一个字及第二个字的辅助码的第一码,其中一个同音字可以只按拼音。

全文数据:

权利要求:

百度查询: 王治阳 新同声近位汉字码输入法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。