买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于数据存储格式的数据查找定位方法_唐山高新技术产业园区兴荣科技有限公司_201810500445.4 

申请/专利权人:唐山高新技术产业园区兴荣科技有限公司

申请日:2018-05-23

公开(公告)日:2021-07-23

公开(公告)号:CN108763413B

主分类号:G06F16/835(20190101)

分类号:G06F16/835(20190101)

优先权:

专利状态码:有效-授权

法律状态:2021.07.23#授权;2018.11.30#实质审查的生效;2018.11.06#公开

摘要:本发明提供一种基于数据存储格式的数据查找定位方法,所述数据存储格式包括操作函数库、控制台指令集、树结构描述区和数据表区;树结构描述区位于数据表区之前,树结构描述区和数据表区都是由众多数据点构成的,树结构描述区的第一数据点表述文件夹级别,第二数据点表述文件夹名称;数据表区是将数据点以表形式存储构成的;数据点包括跳跃帮助区和有效数据区,有效数据区是由英语、汉语、二进制字符或其结合表示;跳跃帮助区是对有效数据区的宽度描述,对数据进行定位时是通过根据读取的跳跃帮助区的值跳转相应宽度的字节数提取相应数据,本发明利于计算机直接定位读取和解析,避免搜索式读取,降低难度、提高速度。

主权项:1.一种基于数据存储格式的数据查找定位方法,其特征在于:所述数据存储格式包括操作函数库、控制台指令集、树结构描述区和数据表区;所述树结构描述区位于数据表区之前,树结构描述区的结构为:开始符号第一数据点第二数据点;开始符号是树结构描述区描述文件夹开始的标记符号,为ansigbk编码的双反斜杠\\;第一数据点表述文件夹级别;第二数据点表述文件夹名称;数据表区位于树结构描述区第二数据点后面,数据表区是将数据点以表形式存储构成的,数据表区的第一个数据点表述该文件夹下数据点的列数;数据点包括跳跃帮助区和有效数据区,有效数据区是由英语、汉语、二进制字符或其结合表示;跳跃帮助区是对紧随其后的有效数据区内的数据的宽度的描述,跳跃帮助区是以十进制整数字符串表示,字符串编码遵守GBK编码规则,常规字符串由00-99表示;超长字符串用[[****]]表示,其中****是任意两位以上的十进制数;对文件夹进行定位时,该文件夹的开始点跨越\\,再跨越第一数据点、跨越第二数据点,第二数据点后就是数据表开始;若该文件夹有下级文件夹,数据表的结束位置是下级文件夹开始符号位置前一存储字节的位置;若该文件夹无下级文件夹,数据表的结束是该文件夹后面的同级文件夹的开始符号前一存储字节的位置;若该文件夹无下级文件夹,同时其后面无同级文件夹,同时其后面无上级文件夹,数据表的结束是该文件最后一个存储有字符的字节;查询数据表的过程是遍历数据表每一行,数据行第一数据点与被搜索数据相同,则判断搜索结束,把该行全部数据提取出来。

全文数据:数据存储格式及其数据查找定位方法技术领域[0001]本发明属于数据存储技术,具体涉及一种数据存储格式及数据查找定位方法。背景技术[0002]数据存储格式系统互联网工业控制系统重要组成,现有的主流标识语言为xtnl语言,现有编码语言代码量大,使得程序运行时搜索速度慢,消耗cpu计算和硬盘存储和网络资源多。随着人们对自动化控制的要求逐渐提高,代码量必会更大,编程难以维护,对于性能较低单片机很难负载如此多的信息,对于生产是极大障碍,现有的XML代码搜索速度慢。[0003]由于html和xml的程序代码量大使得程序难以维护,对单片机的硬件配制高,但是更换高配置的设备资金投入非常大,现有的主流编程语言对于原有设备追求高效的、多功能的控制造成极大障碍。在现有较低配置的设备上几乎不可能实现实时性要求,xml算法复杂、涉及写入转义替代问题和读取转义恢复等各类数字设备驱动程序的应用。自定通讯层协议、互通有障碍、驱动程序设备端电脑端无规范、单片机访问PC设备困难重重。发明内容[0004]本发明旨在解决上述问题,提供一种新的数据存储格,文件代码量少,利于文件读取,利于单片机直接定位读取、解析得到各个数据点,避免搜索式读取。[0005]本发明解决所述问题,采用的技术方案是:一种数据存储格式,包括操作函数库,控制台指令集,还包括树结构描述区和数据表区;所述树结构描述区位于数据表区之前,树结构描述区的结构为:开始符号第一数据点第二数据点,其中开始符号是树结构描述区描述文件夹开始的标识符号,为ansigbk编码的双反斜杠第一数据点表述文件夹级别;第二数据点表述文件夹名称;数据表区位于树结构描述区第二数据点后面,数据表区是将数据点以表形式存储构成的,数据表区的第一个数据点表述该文件夹下数据点的列数;数据点包括跳跃帮助区和有效数据区,有效数据区是由英语、汉语、二进制字符或其结合表示;跳跃帮助区是对紧随其后的有效数据区内的数据的宽度的描述,跳跃帮助区是以十进制整数字符串表示,字符串编码遵守GBK编码规则,常规字符串由〇〇_99表示;超长字符串用[[****]]表示,其中****是任意两位以上的十进制数。[0006]进一步的,文件夹级别为0的文件夹是root文件夹,root文件夹为开头部分隐藏的简化文件夹。[0007]本发明的数据存储格式的数据查找定位方法是:定位文件夹时,该文件夹的开始点跨越\\,再跨越第一数据点、跨越第二数据点,第二数据点后就是数据表开始。[000S]若该文件夹有下级文件夹,数据表的结束位置是下级文件夹开始符号位置前一存储字节的位置。[0009]若该文件夹无下级文件夹,数据表的结束是该文件夹后面的同级文件夹的开始符号前一存储字节的位置。[0010]若该文件夹无下级文件夹,同时其后面无同级文件夹,同时其后面无上级文件夹,数据表的结束是该文件尾最后一个存储有字符的字节。[0011]查询数据表的过程是遍历数据表每一行,数据行第一数据点与被搜索数据相同,则判断搜索结束,把该行全部数据提取出来。[0012]在遍历数据点时,数据点的读取过程是:a•读取数据描述区,识别双反斜杠\\记为文件夹开始;b.读取双反斜杠\\后面表述文件夹级别的第一数据点,首先读取其跳跃帮助区,根据该跳跃帮助区的值向下跳转相应的宽度,并将该宽度范围内的字符读出,识别出文件夹所在级别;c.读取表述文件夹名称的第二数据点,首先读取其跳跃帮助区,根据该跳跃帮助区的值向下跳转相应的宽度,并将该范围内的字符读出,识别出需要查找的文件夹名称;d.读取数据表区,首先读取该数据表述数据表列数的第一个数据点,先读该数据点的跳跃帮助区,根据该跳跃帮助区的值向下跳转相应的宽度,读出该宽度范围内的值,记为数据表列数;e.读取第一个数据点至下一个双反斜杠\\标记之间的所有数据点,按上述读取数点的方法读出文件夹所有有效内容,读到的数据点数量除以列数是此数据表的行数。[0013]本发明的有效果:提供每个名称或数值的宽度记录跳跃帮助jumphelper,以利于单片机直接定位读取、解析,避免搜索式读取,降低难度、提高速度。有效节约电能,减少cpu解析耗电,是更环保的数据协议。它能帮助单片机访问互联网和PC设备xrb-based-WDM-driver•使无操作系统的单片机访问大型数据库和互联网提供可能。具体实施方式[0014]本发明是一种包含跳跃信息的数据点构成文件系统,包括数据点的设计和层次结构文件夹的设计和数据表的设计。[0015]本发明提供一种数据存储格式,包括操作函数库functionlib,控制台指令集querylanguage,树结构描述区(folderdescription,数据表区(datatable。这种新型的数据存储格式可称为“xingrongbyte”,下面简称为XRB。[0016]树结构描述区(folderdescription位置在数据表区之前,它用于描述数据表区。树结构描述内具备文件夹开始符号和两个数据点。[0017]树结构描述区的结构为:开始符号第一数据点第二数据点,其中开始符号是文件夹开始标记,为ansigbk编码的双反斜杠\\;第一数据点表述文件夹级别;第二数据点表述文件夹名称。[0018]数据表区位于树结构描述区第二数据点后面,它是将数据点以表形式存储构成的,数据表区的第一个数据点表述该文件夹下数据点的列数。[0019]构成树结构描述区(folderdescription和数据表datatable的基本要素是数据点(xrbdatapoint。[0020]数据点的结构是:前面为人可视可读的跳跃帮助区,后面是全码任意码无限码有效数据区。每个跳跃帮助区和有效数据区的组合为一个数据点。[0021]跳跃帮助区是对紧随其后的有效数据区内的数据的宽度的描述。跳跃帮助区用十进制整数字符串表示,字符串编码遵守GBK编码规则,常规字符串由00-99表示,超长字符串用[[*林*]]表示,其中“林林”是任意两位以上的十进制数。跳跃帮助区的数据通常默认为00-99中的任意两数表数,在有效字符区占用的字节数据是个位数时,个位数前以〇补足,两位十进制数应对通常数据足够。跳跃帮助区的数大于等于100即三位及以上的十进制)时,记录用[[****]]实现。字节转字符串是asciigbk编码方案。字符串意义是十进制整数,它将是这样:00,01,02,......,98,99,[[0100]],[[0101]],......,[[0999]],[[1000]]......,[[9999]],[[010000]],......[[065536]]......[[16777216]]......[[4294967296]]......[[18446744073709551616]]......的样子。跳跃帮助区最小两位,最多理论上不限。如数值宽度不足两位,则在前面补一个0。[0022]在GBK规范下,一个汉字至少是占用2个字节存储的.一个英语字母和阿拉伯数字占用1个字节。所以,04中国05china是符合xrb数据点语法规范的。[0023]说明:65536对应64K,256*256,c语言的shortint短整型变量溢出值理论最大值;;4四4967296对应4G,25於256*256*256变c语言的int溢出值理论最大值;;;18446744073709551616对应16M个T,c语言的longint长整型变量溢出值理论最大值;.............)(18446744〇737〇%51616的数量大约是1844亿亿,一个xrb数据点可以容纳这么大的字节数的数据的,比它还大也可以的.这大约是一千六百万个1T磁盘的容量了)所述有效数据区可以是英语、汉语、二进制字节数据或其结合表示。[0024]树结构描述区的结构为:“开始标记第一数据点跳跃帮助区+有效数据区第二数据点跳跃帮助区+有效数据区”,其中,第一数据点有效数据区的内容是文件夹级别,它的内容可以是1、2、3或至无限大;第二数据点有效数据区的内容是文件夹名称,它是定义的名称,它可以是数字、字母、字符或其组合的字符串。[0025]数据表区的第一个数据点表述该数据表的列数,第一数据点的有效数据区的内容一般为数字。其它数据点是该数据表的内容信息,它们的有效数据区的内容可以是字符、文档、图片,也可以是某函数、指令等。[0026]数据点的宽度为该数据所占用的字节数,每个字母占一个字节,每个汉字占两个字节。[0027]数据点可以为空。当数据点为空时跳跃帮助区和数据表区表现为:其跳跃帮助区为00,并且跳跃帮助区后面无有效数据区。就是只有跳跃助手“00”,后面没有属于该数据点的有效有意义的字节,而是下一个数据点的跳跃帮助区的开始或\\。[0028]某L级别的文件夹F的FSI与同级的下一个邻居文件夹的FSI之间,是该文件夹F的界定范围。该范围内首先是数据表L+1级别),然后接着是下级文件夹L+1级别)。数据表的级别如此定义是为了xrb函数库编程的确定性的需要。[0029]以此类推,每个下级L+1级文件夹可以继续拥有自己的更下级L+2级数据表和自己的更下级L+2文件夹。[0030]某L级别的文件夹F的界定范围内的直属的L+1级的数据表的结束位置的获取方法是:若该文件夹F不包含下级文件夹,则F的直属的表的结束位置是F的同级L级)的下一个邻居文件夹的FSI之前:若该文件夹F包含下级文件夹,则F的直属的表的结束位置是F的第一个下级L+1级文件夹的FSI之前,这个判断方法已经验证。[0031]某L级别的文件夹F的界定范围内的直属的L+1级的数据表的开始位置的。[0032]获取方法是:该文件夹F的FSI之后跨越两个数据点DP,就是数据表。[0033]本发明所述数据存储格式的数据查找定位方法是:定位文件夹时,该文件夹的开始点跨越\\,再跨越第一数据点、跨越第二数据点,第二数据点后就是数据表开始。[0034]若该文件夹有下级文件夹,数据表的结束位置是下级文件夹开始符号位置前一存储字节的位置。[0035]若该文件夹无下级文件夹,数据表的结束是该文件夹后面的同级文件夹的开始符号前一存储字节的位置。[0036]若该文件夹无下级文件夹,同时其后面无同级文件夹,数据表的结束是该文件尾最后一个存储有字符的字节。[0037]查线数据表的过程是遍历数据表每一行,数据行第一数据点与被搜索数据相同,则判断搜索结束,把该行全部数据提取出来。分别存入数组3的1^111311^^1116[1],seekednamevalue[2],......seekednamevalue[N],N是表的列数。[0038]在遍历数据点时,数据点读取过程是:a.读取数据描述区,识别双反斜杠\\记为文件夹开始;b.读取双反斜杠\\后面表述文件夹级别的第一数据点,首先读取其跳跃帮助区,根据该跳跃帮助区的值向下跳转相应的宽度,并将该宽度范围内的字符读出,识别出文件夹所在级别;c.读取表述文件夹名称的第二数据点,首先读取其跳跃帮助区,根据该跳跃帮助区的值向下跳转相应的宽度,并将该范围内的字符读出,识别出需要查找的文件夹名称;d•继续读取后面的数据表区,首先读取该数据表述数据表列数的第一个数据点,先读该数据点的跳跃帮助区,根据该跳跃帮助区的值向下跳转相应的宽度,读出该宽度范围内的值,记为数据表列数;e.读取第一个数据点至下一个双反斜杠\\标记之间的所述数据点,读到的数据点数量除以列数是此数据表的行数;按上述读取数点的方法读出文件夹所有有效内容。[0039]举例一,文件夹描述语句:\\01207windows其中\\表示文件夹开始标记。第一数据点“012”,2为有效内容字符区,第2级文件夹,该数据点的有效内容字符区的宽度为1个字节,01为跳跃帮助区。因此,此跳跃助手的值为01。第二数据点“07windows”,表示目录文件夹名为windows,该有数据点的有效字符区的有效数据宽度为7,因此它的跳跃助手为07。[0040]你看到的第一文件夹必第1级..ro〇t是第0级,是隐藏看不见的。你看到的都是root文件夹内的。可以认为\\〇l〇〇4root被隐藏了。[0041]举例二,采用xrb描述的一个表:01204name06button05color03red该描述语言的含义是:数据点012说明:表的宽为2表每行2个数据点);表的第一行〇4name〇6button•意思是name:button;表的第二行〇5color03red意思是color:red。[0042]举例三,数据表描述:数据表的设计对比举例:3行*4列数组,名称为myarray123456789101112上述数组用Xml描述如下:l234567〈d8〈d910〈dll〈d12上述数组用xrb描述如下012\\01107myarray012\\0202pb014011012013014015016017018019021002110212xrb体系是隐藏root名称的,效率更高。文件夹描述区后面紧接着是数据表区,第一数据点“014”是表的列数信息M。之后的是N行M列的共N*M个数据点序列。[0043]将XML描述与xrb描述进行对比,结果:paidloadbytes有效字节数:AXrb为:1myarray2pbl23456789101112224共计29个字节。[0044]BXml对同一数据表的表述用了1M的字节。totalbytes总字节数:xrb70字节,而xml有164个字节。[0045]Effective效率百分比:xml29164=18%,xrb2970=41%,差距:41%-18%=23%.xrb比xml增加了23%的效率。[0046]意义:若提高10%速度,节约10%电费•减少10%硬盘存储,若超算中心每天大约17.8MW功率30-60万元电费,每年1-2亿元电费,10%节约意味1000-2000万元。[0047]xml获得数据点过程:xml需要和作为一段代码的起始和结束语。读三次判断为,知道数据点开始。若一段代码中数据点开始和结束标记字符有'10000个字,就要10000次字符读取10000次判断。读取这些字符工作量合计起来就很大,致使处理器效率是很低的。初步获得数据点,转义恢复,继续10000次字符读取10000次判断,是否有转义符,若有,则恢复操作。[0048]xrb获得数据点过程:同样读取一个拥有10000个字的数据点,跳跃助手是[[010000]],分析跳跃助手的过程仅需要读5次,得到“[[”、“01”、“00”、“00”、“]]”,判断为“]]”表示跳跃助手结束。截“[[”和“]]”之间的字符串,得到010000,进行6次字符的拷贝,十进制字符串转计算机整数。6个字符,每个的ASCII值减48,乘以自己的权,分别是:100000,10000,1000,100,10,1,求和•总计6次减法6次乘法、6次加法。[0049]通过现有的xml与本发明提供的xrb的对比,xml3次读字符,3次判断字符,10000次字符读取10000次判断,转义恢复的10000次字符读取,转义恢复10000次判断。而xrb5次读字符5次判断字符6次字符的拷贝6次减法6次乘法6次加法。对相同一数据点的描述,xrb的处理速度明显比xml速度快。[0050]本xrb数据存储格式的网页应用实施例:012\\01112myguideclare01310MYTEXTB0X102*107textbox\\01112myguiinitial0131OMYTEXTBOX10111Ohe11owor1d08MYLABEL101104home\\0111lmyguilayout01710MYTEXTB0X101104504004196004197504149508bymyself08MYLABEL1011045040042160039750349513newlinecenter\\01112myguimission01508MYLABEL101115inside:webl.xrb02no02no本Xrb数据存储格式的4维矩阵存储举例:dimmyarray2,3,4,5asstring012\\01107myarray01305array072,3,4,528comment:totimeaddreverse\\012041,1,015011011011011011011011011011011011011011011011011011011011011\\012041,2,015011011011011011011011011011011011011011011011011011011011011\\012041,3,015011011011011011011011011011011011011011011011011011011011011\\012042,1,015011011011011011011011011011011011011011011011011011011011011\\012042,2,015011011011011011011011011011011011011011011011011011011011011\\012042,3,015011011011011011011011011011011011011011011011011011011011011本发明提供的数据存储格式包含文件夹和数据表的完整系统保存文件后缀名为*.xrb,不包含文件夹和数据表的若千自定义数据点的简化系统保存文件后缀名为*.bxr。[0051]本发明技术方案,突出的特点是:①优越性:避免了有效数据串内部出现协议专用的特定功能符需要转义问题。伺服区域仅用0123456789字符[[]]特定功能符和\\特定功能符,读取跳跃步数按十进制字符串转换为整数或得到文件夹开始,跳跃模式能确保不进入有效数据区就能获取到有效数据,数据直传,转义零依赖;②人免工具可读可写,使用notepad可读写文本格式的xrb文件;③包装效率:xrb格式的伺服数据很少,paidloadtotal有效字节百分比率高,可比xml高23%。[0052]经试验:xrb格式包装效率:paidloadtotal..。[0053]超小数据点数据点1字节,30个数据点)20%_32%包装效率。[0054]小数据点数据点3字节-20个数据点)67%-73%包装效率。[0055]中数据点数据点百个字节1个数据点)96%包装效率。[0056]大数据点数据点千个字节1个数据点)99%包装效率。[0057]意味着:若提高10%速度,节约10%电费,减少10%硬盘存储。若超算中心每天大约17.8MW功率30-60万元电费,每年1-2亿元电费,10%节约意味1000-2000万元。

权利要求:1.一种数据存储格式,包括操作函数库,控制台指令集,其特征是:还包括树结构描述区和数据表区;所述树结构描述区位于数据表区之前,树结构描述区的结构为:开始符号第一数据点第二数据点,其中开始符号是树结构描述区描述文件夹开始的标记符号,为ansigbk编码的双反斜杠\\;第一数据点表述文件夹级别;第二数据点表述文件夹名称;数据表区位于树结构描述区第二数据点后面,数据表区是将数据点以表形式存储构成的,数据表区的第一个数据点表述该文件夹下数据点的列数;数据点包括跳跃帮助区和有效数据区,有效数据区是由英语、汉语、二进制字符或其结合表示;跳跃帮助区是对紧随其后的有效数据区内的数据的宽度的描述,跳跃帮助区是以十进制整数字符串表示,字符串编码遵守GBK编码规则,常规字符串由00-99表示;超长字符串用[[*林*]]表示,其中*林*是任意两位以上的十进制数。2.如权利要求1所述数据存储格式,其特征是:文件夹级别为0的文件夹是root文件夹,root文件夹为开头部分隐藏的简化文件夹。3.如上述权利要求所述数据存储格式的数据查找定位方法是:定位文件夹时,该文件夹的开始点跨越\\,再跨越第一数据点、跨越第二数据点,第二数据点后就是数据表开始;若该文件夹有下级文件夹,数据表的结束位置是下级文件夹开始符号位置前一存储字节的位置;若该文件夹无下级文件夹,数据表的结束是该文件夹后面的同级文件夹的开始符号前一存储字节的位置;若该文件夹无下级文件夹,同时其后面无同级文件夹,同时其后面无上级文件夹,数据表的结束是该文件尾最后一个存储有字符的字节,查询数据表的过程是遍历数据表每一行,数据行第一数据点与被搜索数据相同,则判断搜索结束,把该行全部数据提取出来。4.如权利要求3所述的数据查找定位的方法:在遍历数据点时,数据点的读取过程是,a•读取数据描述区,识别双反斜杠\\记为文件夹开始;b.读取双反斜杠\\后面表述文件夹级别的第一数据点,首先读取其跳跃帮助区,根据该跳跃帮助区的值向下跳转相应的宽度,并将该宽度范围内的字符读出,识别出文件夹所在级别;c.读取表述文件夹名称的第二数据点,首先读取其跳跃帮助区,根据该跳跃帮助区的值向下跳转相应的宽度,并将该范围内的字符读出,识别出需要查找的文件夹名称;d.继续读取后面的数据表区,首先读取该数据表述数据表列数的第一个数据点,先读该数据点的跳跃帮助区,根据该跳跃帮助区的值向下跳转相应的宽度,读出该宽度范围内的值,记为数据表列数;e•读取第一个数据点至下一个双反斜杠\\标记之间的所有数据点,按上述读取数点的方法读出文件夹所有有效内容,读到的数据点数量除以列数是此数据表的行数。5.如权利要求3或4所述的数据查找定位的方法,其特征是:文件夹为〇级的root文件夹的开头的说明部分的树结构描述区为隐藏的不读的,查找的文件夹从1级文件夹开始。

百度查询: 唐山高新技术产业园区兴荣科技有限公司 基于数据存储格式的数据查找定位方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。