【发明授权】一种中药和症状关系的数据挖掘方法_中国传媒大学_202010708196.5

导航：龙图腾网> 最新专利技术> 一种中药和症状关系的数据挖掘方法_中国传媒大学_202010708196.5

申请/专利权人：中国传媒大学

申请日：2020-07-21

公开（公告）日：2024-04-19

公开（公告）号：CN111951971B

主分类号：G16H50/70

分类号：G16H50/70;G16H20/90

优先权：

专利状态码：有效-授权

法律状态：2024.04.19#授权;2020.12.04#实质审查的生效;2020.11.17#公开

摘要：本发明公开了一种中药和症状关系的数据挖掘方法，为挖掘中药对象与症状对象的准确对应关系，本发明先采用熵聚类算法从中药处方数据中挖掘常用方药配伍，然后以方药配伍为整体，依据共现信息寻找可能与方药配伍存在映射关系的候选症状对象。接着，为了从大量不确定的方药配伍与症状对象的映射关系中过滤不准确的结果，采用关联度系数分析法和共现频次分析法确定中药与症状的关联强度，筛除关联强度弱的候选症状对象。本发明挖掘方药配伍采用的改进熵聚类算法，动态选择中药向量的亲密变量个数，只考虑与目标中药的关联度系数非负的中药；改进后方法可以过滤掉临床上实际并未同时使用的中药药对，使挖掘结果更准确且更具实际意义。

主权项：1.一种中药和症状关系的数据挖掘方法，其特征在于，该方法包括如下步骤，步骤1、对中医诊疗老年病数据集进行相关预处理，输入数据为文本形式的医案数据，输出数据为向量形式：步骤2、采用熵聚类算法挖掘方药配伍，输入是经过数据预处理后得到的所有中药向量，输出是方药配伍组合；具体步骤如下：步骤3、依据中医学上用一组方药配伍共同发挥功效治疗症状的中医常识为支撑，在得到方药配伍结果的基础上，探索方药配伍与症状的对应关系，如果某组方药配伍与某个症状具有映射关系，则所有组成方药配伍的中药与此症状具有映射关系；中药和症状关系的计算机数据挖掘方法的实施过程包括三大部分；第一部分是数据预处理模块，实现了由病例文本数据到结构化向量数据的转换，得到用于数据挖掘的实验数据集；第二部分以中药向量作为输入，采用熵聚类算法得到方药配伍结果；第三部分是中药-症状映射关系挖掘模块，设计基于关联强度规则过滤症状的方法，以方药配伍、中药向量、症状向量为输入，经过多步操作得到中药-症状的映射关系；具体实施步骤叙述如下：步骤1的实施过程如下：步骤1.1、将文本解析成字符串，并进行字符串匹配、字符串分割操作，从中提取出症状词、中药词；步骤1.2、对不规范的症状词、中药词进行数据清洗；针对一义多词、多词一义、复合表述的情况，基于设计聚合、拆分规则，纠正错误用语，保证症状词、中药词的唯一性和准确性；步骤1.3、进行数据变换，根据症状词、中药词在就诊记录中存在与否，映射到对应的二进制值1、0；存在用1表示，不存在用0表示；步骤1.4、进行降维，统计各个症状词、中药词出现的频次，将频次不足样本量十分之一的词删除；步骤2的实施过程如下：步骤2.1、输入N个中药向量，计算中药向量两两之间的关联度系数；关联度系数值为正表示两个中药向量是正相关的，有组成方药配伍的可能；反之，则为负相关，两个中药向量不曾出现在一剂处方中，不适合组成方药配伍；步骤2.2、规定与给定中药向量关联度系数大小排名位列前M位且关联度系数大于0的中药向量为该中药向量的亲密变量；为每个中药向量按照此规定寻找亲密变量；M的实际意义表示可组成方药配伍的中药个数，由于一剂处方至少与两个以上的症状相对应，M的取处方平均中药味数的二分之一较为合适；步骤2.3、将两个互为亲密变量的中药向量组成二元组方药配伍；接着搜索下一个可能聚类的中药向量，如果该中药向量能够与二元组方药配伍中的任意一个中药互为亲密变量，则这三个中药向量聚为一类，形成三元组方药配伍；以此类推，直到饱和，即不能再往里添加任何一个中药向量才结束迭代过程；经过方药配伍生成过程，可得到二元组、三元组、四元组、五元组方药配伍；动态地选择中药的亲密变量个数，只考虑与目标中药的关联度系数非负的中药，改进后方法过滤掉临床上实际并未同时使用的中药药对；算法中关联度系数的公式如下：其中HXi表示中药向量Xi的自信息熵，pi,j表示两种中药在同一剂处方中同时出现的频率；两味中药共现频率大于0时，计算关联度系数，结果是一个大于0的数；反之，中药之间共现频率等于0时，计算关联度系数，结果是一个小于0的数；步骤3的实施过程如下：步骤3.1、依据共现信息寻找可能与方药配伍存在映射关系的所有候选症状对象，只要在某个病历记录中与方药配伍同时存在的症状都暂定为与其具有映射关系；步骤3.2、为了在暂定症状中筛选与方药配伍真正存在映射关系的症状，设计了基于关联强度规则过滤症状的方法：首先对于每一个症状向量，根据关联度系数的公式计算其与各个中药向量的关联度系数，并降序排列；这样各个中药向量有一个关于该症状向量的关联强度排名r1hs；对于每一个中药向量，计算其与各个症状向量的关联度系数，各个症状向量也有一个关于该中药向量的关联强度排名r1sh；任意一组症状向量与中药向量的关联程度可由r1hs+r1sh的大小决定；根据r1hs+r1sh重新调整基于关联度系数各症状向量与中药向量的关联强度排序rank1；然后，通过统计中药与症状的共现频次，获得基于共现频次各症状向量与中药向量的关联强度排序rank2；那么，基于关联强度规则过滤候选症状的思路为：如果方药配伍中的所有中药Hi均满足与某个候选症状的关联强度排序rank1或rank2不大于K，即候选症状满足式子2：{rank1ofHi≤KORrank2ofHi≤K，Hi∈方药配伍}2则保留该症状，否则剔除，K取值为处方平均中药味数的二分之一；经过过滤步骤，最终获得符合临床认识的症状与中药的映射关系。

全文数据：

权利要求：

百度查询：中国传媒大学一种中药和症状关系的数据挖掘方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种全自动铜铝焊接装置_怀化亚信科技股份有限公司_202410351666.5

下一篇：一种双频段相控阵雷达智能抗干扰方法_成都金武科技有限公司_202410410853.6

相关技术

一种全自动铜铝焊接装置_怀化亚信科技股份有限公司_202410351666.5

一种双频段相控阵雷达智能抗干扰方法_成都金武科技有限公司_202410410853.6

一种CNT复合纤维及其制备方法和应用_中国科学院苏州纳米技术与纳米仿生研究所_202311856225.2

为放大器操作进行的平台资源的选择_超威半导体公司_202280065509.7

全氟异丁腈的合成方法_天津市长芦化工新材料有限公司_202410424719.1

POCT血细胞分析仪_深圳市帝迈生物技术有限公司_202410426762.1

一种化合物及其制备方法和在卷烟中的应用_湖北中烟工业有限责任公司_202410162764.4

一种助力外骨骼辅助运动装置_中国人民解放军总医院第四医学中心_202311762144.6

用药患者血浆中抗人胸腺/淋巴细胞兔免疫球蛋白总IgG抗体浓度检测试剂盒及应用_武汉中生毓晋生物医药有限责任公司_202410128193.2

用于超声速进发直连风洞试验的发动机台架及设计方法_中国空气动力研究与发展中心高速空气动力研究所_202410420425.1

一种设备锁定方法、装置及电子设备_联想(北京)有限公司_202410116925.6

一种脑膜炎球菌发酵培养基及其制备方法和应用_成大生物(本溪)有限公司_202410343870.2

症状相关技术

腹腔神经节作为帕金森病相关运动症状的干预靶点的应用_中国科学院深圳先进技术研究院_202211398884.1

一种用于喘憋症状患者的安睡枕_首都医科大学附属北京朝阳医院_202322662986.6

一种缓解慢性胃炎症状的中药提取物及其制备方法_苏州爱云医科技有限公司_202410270203.6

一种可减少膀胱刺激症状的三腔导尿管_上海中医药大学附属曙光医院_202310863086.X

基于概率图的中医症状推荐方法及系统_福建中医药大学_202311842676.0

使用三辛精治疗偏头痛和有关头痛症状的方法_睿升公司_202280063279.0

一种基于患者自主报告的症状捕捉方法_安徽医科大学_202410064025.1

基于医学症状词汇的问诊方法及系统_中国科学院自动化研究所_201911230745.6

用于使症状与医学病症相关联的系统和方法_查可神经科技有限公司_202180043081.1

一种空鼻症症状缓解器_宋子良_202410219327.1

关系相关技术

一种基于关系代数的血缘关系生成方法_天津南大通用数据技术股份有限公司_202410411546.X

用于转换开关系统的电气互锁装置及转换开关系统_施耐德电气工业公司_202322980161.9

空间关系切换方法和用户设备_联发科技(新加坡)私人有限公司_202110143540.5

机组网络关系的控制系统_珠海格力电器股份有限公司_202211449590.7

网络连接关系确定方法及通信装置_华为技术有限公司_202211407813.3

多模态实体和关系抽取方法及系统_清华大学_202311267702.1

递送系统辅助装置及相关系统和方法_W.L.戈尔及同仁股份有限公司_202410271941.2

通信方法、通信装置、计算机可读存储介质及相关系统_荣耀终端有限公司_202410411755.4

一种中文实体关系抽取方法、装置、介质及产品_北京邮电大学_202410166185.7

通信方法、通信装置、计算机可读存储介质及相关系统_荣耀终端有限公司_202410411778.5

方法相关技术

制造方法_意法半导体(克洛尔2)公司_202311475458.8

增殖方法_花王株式会社_202080014224.1

训练数据生成方法、图像检测方法、图像分类方法及装置_第四范式(北京)技术有限公司_202211345497.1

编码方法、解码方法和处理比特流的方法_松下电器(美国)知识产权公司_202410304249.5

控制棒组件的安装方法、取出方法以及更换方法_中国原子能科学研究院_202111129136.9

排烟机拖车及其掉头方法、自行行走方法_苏州瑞奇安机电科技有限公司_202410210474.2

视频处理方法、影视视频处理方法及装置_阿里巴巴集团控股有限公司_202010147566.2

半导体结构及其制备方法、晶圆切割方法_北京弘图半导体有限公司_202410157714.7

喷墨记录方法及层合体的制造方法_富士胶片株式会社_202280064929.3

分类模型训练方法、分类方法、装置和设备_海通证券股份有限公司_202410186760.X

龙图腾网&IPTOP

【发明授权】一种中药和症状关系的数据挖掘方法_中国传媒大学_202010708196.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务