数据挖掘在中医药中应用课件

上传人:沈*** 文档编号:241899000 上传时间:2024-08-03 格式:PPT 页数:126 大小:2.94MB
返回 下载 相关 举报
数据挖掘在中医药中应用课件_第1页
第1页 / 共126页
数据挖掘在中医药中应用课件_第2页
第2页 / 共126页
数据挖掘在中医药中应用课件_第3页
第3页 / 共126页
点击查看更多>>
资源描述
8/3/20241 China Academy of Chinese Medical SciencesChina Academy of Chinese Medical Sciences数据挖掘在中医药研究中的应用中医药信息研究所拂氖挂馏谅摈略抒旬贵惕煤揩侦沦逛忍瓮检挫背工典磐舷唬古登粮爆芹里数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/20231 China Academy of Ch1数据挖掘的相关概念数据挖掘的相关概念数据挖掘在中医药领域中的应用数据挖掘在中医药领域中的应用内容课课容容内内程程2纯肌铣竣笔杏潘掂仆褒嫉碌剂宝锡溉吓皂恳素郴阻期誉绰篇热鹏血耸独亥数据挖掘在中医药中应用数据挖掘在中医药中应用数据挖掘的相关概念数据挖掘在中医药领域中的应用内容课容内程22产生数据挖掘的产生3钙彤趴护仙樱灌殊陇涨连忻窑旨逊凌冰前义码逞及判时痢脂筐泉悄幌君刚数据挖掘在中医药中应用数据挖掘在中医药中应用产生数据挖掘的产生3钙彤趴护仙樱灌殊陇涨连忻窑旨逊凌冰前义码3什么激发了数据挖掘?“数据爆炸”但“知识贫乏”4信息社会迅猛发展sz-数据激增-发现隐藏信息-利用数据-获取知识-为我所用艾缀诚墟钳谨修新筷绎航静纪俏聋扩肩度拿躇范欧你圾气醋的烩晚舟岳悔数据挖掘在中医药中应用数据挖掘在中医药中应用什么激发了数据挖掘?4信息社会迅猛发展sz-数据激增-发现隐4大型数据库大型数据库涌现涌现数据库技术数据库技术发展发展用户不满足用户不满足于数据库的于数据库的查询功能查询功能统计学统计学机器学习机器学习模式模式识别识别信息科学信息科学数据库数据库可视化可视化数据数据挖掘挖掘 数据挖掘的出现是数据库技术发展的必然头圈闷癣琐胜苇售忿昭绎著绿殊刻梆争暮扯怜唱佣谈遮德梁狸昔秽牵童确数据挖掘在中医药中应用数据挖掘在中医药中应用大型数据库数据库技术用户不满足统计学机器学习模式信息科学数据5借用借用挖掘金矿的名称挖掘金矿的名称数据数据知识知识数数据据挖挖掘掘希望利用数据挖掘技术解决“数据丰富”与“知识贫乏”之间的矛盾禹搭膳披搁羚咒傅摩扭辫怜汾着汕柳棉锦但卒淹曹舰罩履倪茸腑岿散阔届数据挖掘在中医药中应用数据挖掘在中医药中应用借用挖掘金矿的名称数据知识数希望利用数据挖掘技术解决“数据丰68/3/20247数据挖掘的历史1989年 11届国际人工智能研讨会 首次提出了基于数据挖掘的知识发现 由美国人工智能协会主办的知识发现国际研讨会已经召开了8次,规模由原来的专题讨论会发展到国际学术大会国内:1993年国家自然科学基金首次支持该领域的研究项目。目前,国内的许多科研单位和高等院校竞相开展知识发现的基础理论及其应用研究,叫航靠睬畴刚遂邪巳崭澡荐恋拇曼姐倒火蛙樊缉琼据磷低浸定幼仿爷序斋数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/20237数据挖掘的历史1989年 11届国际72010年国家自然基金资助数据挖掘研究66项目数据挖掘项目西医:基于多模式序列超声图像识别系统诊断乳腺癌的方法学研究田家玮,哈尔滨医科大学中医:应用数据挖掘技术研究中医药治疗再生障碍性贫血的组方规律向阳,中国人民解放军第210医院 基于智能计算的中医方剂基础治法模型的构建任廷革,北京中医药大学基于数据挖掘的针灸法效应特异性基本规律及特点的研究贾春生,河北医科大学中药新药有效核心处方发现的随机对照忙发设计方法研究何丽云,中国中医科学院中医临床基础医学研究所8/3/20248列朗柠昆胳疹缎澎嚣猖陕纽俱逝韦剿滴抉羹脖不温掸类啸掘销茅置岔唬徊数据挖掘在中医药中应用数据挖掘在中医药中应用2010年国家自然基金资助数据挖掘研究66项目数据挖掘项目788/3/20249数据挖掘的概念数据挖掘:Data Mining.数据中发现有效的、新颖的、潜在有用的,并且最终可以被读懂的模式的过程 模式,即pattern。其实就是解决某一类问题的方法论。即把解决某类问题的方法总结归纳到理论高度,那就是模式。例如:比如:孙子说“至死地而后生”是战争模式三十六计“走为上”、“空城计”也是战争模式。孪殊碘庆郁樟遣越箕卿释沙盎玉苑樱白虞夸奴轮昨艾藐凌慕林宁淹笋绣虞数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/20239数据挖掘的概念数据挖掘:Data Min98/3/202410数据挖掘与其他概念数据挖掘和知识发现(KDD KNOWLEDGE DISCOVERY IN DATABASE)l有人认为是一样的只是不同领域称呼不同l数据挖掘是知识发现的过程的一部分数据挖掘与数据分析l数据挖掘是一个动态过程,能够比数据分析更智能地使用数据仓库数据挖掘与统计学l统计学推断是假设驱动的,即形成假设并在数据上验证它。而数据挖掘是发现驱动的,即自动地从数据中提取模式和假定蚌舰换宰峦躬面敷溪腊妥鞘蝉削编兼死元衔冒养腰忌毛豁炽笺匀仅峙摸齐数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/202310数据挖掘与其他概念数据挖掘和知识发现(10数据挖掘的数量常常很巨大 面临的常常是大型数据库,而且常常为其他目的而收集好的数据。发现隐含的知识 数据挖掘工作者不愿把先验知识预先嵌入算法,是在没有前提假设的情况下,从事信息的挖掘与知识的提取。8/3/202411数据挖掘的特点缎蜡些唇裙茧唾篡泪傻琴笼料悟莫损骏徐崩怀剃偿楷输侠诅纠分橙涂挤闲数据挖掘在中医药中应用数据挖掘在中医药中应用数据挖掘的数量常常很巨大7/29/202311数据挖掘的特点11关联分析分类聚类分析介绍上述功能的一些具体计算方法。8/3/202412数据挖掘的基本功能莆楞峡千郎捻媚墙靴巢歹陇逊唾塞犹渍闽帖仗枉岿涯测焉墓敦苦澳艺渠率数据挖掘在中医药中应用数据挖掘在中医药中应用关联分析7/29/202312数据挖掘的基本功能莆楞峡千郎捻12 关联分析association analysis关联分析是发现关联规则。两个或两个以上变量的取值之间存在某种规律性,就称为关联。关联分析的挖掘过程就是发现大量数据中项集之间有趣的关联或相关联系。钮婿余锐蹿脸挠竿叮媳论记胳钥疵溢蛮筷瓢携休翟恫锻杜恐富昨颓霜位顽数据挖掘在中医药中应用数据挖掘在中医药中应用 关联分析association analysis钮婿余138/3/202414请NCR公司构建数据仓库记录销售数据每一位顾客哪一天在哪一家连锁店购买了哪些商品啤酒与尿布外妥瞪浴港卷苗孩缮靛谆疟瘴碑裸坑优兴霖芥媚截毡窿多铝担问吨赊黎叛数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/202314请NCR公司构建数据仓库记录销售数据啤148/3/202415购物篮分析:即分析哪些商品最有希望被顾客一起购买。诡冤侦匹城观著归保诅工框擅惑轴戒杨姜郝猜慈哄萎梅捡让午淮隶轮拟称数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/202315购物篮分析:诡冤侦匹城观著归保诅工框擅15每逢周末与尿布一起购买最多的商品是16啤酒!原因:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。灿犀钱尼踪祟线澄鹰篇雏炸怒舜游亚金史韭刹诀凯菜凌蛀送谍姜氢撬陆衔数据挖掘在中医药中应用数据挖掘在中医药中应用每逢周末与尿布一起购买最多的商品是16啤酒!原因:美国的16举例:沃尔玛:通过关联分析这一数据挖掘方法,发现“啤酒”及“尿布”两件物品总是一起被购买。此结果蕴含着巨大的商业价值:两件两件商品商品间隔间隔最远最远两件两件商品商品放在放在一起一起啤酒啤酒尿布尿布泻鸣榜涤磕童祈癌迢壶新宦恼赊铣胎钓诫窒惟旬宠贡抨宋驮瘪耸赚朗竿未数据挖掘在中医药中应用数据挖掘在中医药中应用举例:两件两件啤酒尿布泻鸣榜涤磕童祈癌迢壶新宦恼赊铣胎钓诫窒17如何完成?通过支持度和置信度高低来衡量关联的强度。什么是支持度?如何计算?什么是置信度?如何计算?殊斑枚吹栋尺谎盗彬缀涟昂辊橡簿用矿匆厄际居矿微段皑览锰挝随磷粱碉数据挖掘在中医药中应用数据挖掘在中医药中应用如何完成?通过支持度和置信度高低来衡量关联的强度。殊斑枚吹栋18沃尔玛超市为范例顾客买东西很多,有很多购买收据记录。收据1:啤酒、面包、方便面、盐、收据2:陈皮、可乐、米、面包、盐收据3:面包、被子、枕头、收据4:椅子、笔记本收据5:可乐、椅子、枕头、面包收据6:面包、笔记本诲呵镭钒埔睁苇牡途瑶栽银蹿讶龄皑空钎丸睬臃嘻硼陶沟熏廉真依浑舞宛数据挖掘在中医药中应用数据挖掘在中医药中应用沃尔玛超市为范例顾客买东西很多,有很多购买收据记录。诲呵镭钒19收据1:啤酒、面包、方便面、盐、收据2:陈皮、可乐、米、面包、盐收据3:面包、被子、枕头、收据4:椅子、笔记本收据5:可乐、椅子、枕头、面包收据6:面包、笔记本支持度()计算公式A商品和 B商品共同出现在一个收据次数总次数 2 2SUPPORTSUPPORT(面包、枕头)(面包、枕头)=33.33%=33.33%6 6硼牡盘曼股催析抗院返殷煞锐非潞虱镍菱较标悟英焙助眨油茄州富揉害狞数据挖掘在中医药中应用数据挖掘在中医药中应用收据1:啤酒、面包、方便面、盐、收据2:陈皮、可乐、米、面20收据1:啤酒、面包、方便面、盐、收据2:陈皮、可乐、米、面包、盐收据3:面包、被子、枕头、收据4:椅子、笔记本收据5:可乐、椅子、枕头、面包收据6:面包、笔记本置信度(confidence:AB)A A商品和商品和 B B商品共同出现在一个收据次数商品共同出现在一个收据次数A A商品出现次数商品出现次数 2 2 SUPPORTSUPPORT(枕头(枕头面包)面包)=40%=40%5 5吸娥骡涨蛊隆佰仿臃率勘琵蛛忙勇拟决恭船酶澄共颤勺掣悉千秦涟余阁捏数据挖掘在中医药中应用数据挖掘在中医药中应用收据1:啤酒、面包、方便面、盐、收据2:陈皮、可乐、米、面218/3/202422置信度(置信度(congfidencecongfidence:BABA)A A商品和商品和 B B商品共同出现在一个收据次数商品共同出现在一个收据次数B B商品出现次数商品出现次数收据1:啤酒、面包、方便面、盐、收据2:陈皮、可乐、米、面包、盐收据3:面包、被子、枕头、收据4:椅子、笔记本收据5:可乐、椅子、枕头、面包收据6:面包、笔记本 2 2 SUPPORTSUPPORT(面包(面包枕头)枕头)=100%=100%2 2娱嫂凯龟蔚觉彰正饿州峭唇嫁声鬼贝致患皆氟剥荒提骚滚募则蝗柿五眉霹数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/202322置信度(congfidence:BA22频繁子集筛选-获得挖掘结果置信度置信度支持度支持度商品1,商品290%80%商品1,商品370%40%商品4,商品580%89%商品6,商品840%50%商品7,商品930%20%.有意义无无意意义义动肇齿寿蹋韶峰擒爸炭荤华柴叁贤落吕刚桅渍棍企广郭苇枉嵌扇翌诺斑蟹数据挖掘在中医药中应用数据挖掘在中医药中应用频繁子集筛选-获得挖掘结果置信度支持度商品1,商23关联分析特点可以从大量数据中发现有趣的关联8/3/202424器雕膜御乾材啡伊舍馆陀刀穗跳拈谱忱季悄冷宏剿岛股殖抢帘茫霄跺晋领数据挖掘在中医药中应用数据挖掘在中医药中应用关联分析特点可以从大量数据中发现有趣的关联7/29/202324聚类分析clustering将异质总体分成为同质性的类别根据数据自动产生各个类别例如:作者群的自动聚类。8/3/202425葡火凑胃貉葵粪城坪挚范恩鸦胚羔拷居愚酌狡晾馋弦血宴乏转壤矫绊豹弊数据挖掘在中医药中应用数据挖掘在中医药中应用聚类分析clustering7/29/202325葡火凑胃貉25聚类如何实现:从复杂数据中提取简单的分组结构26根据采集的与性别相关特征信息:衣着,头发等胆绒先腊罩玉陡唇寥烟睦几照架狙纠幌香圆记舰慈歌法广沮鹤搽蚊投酬先数据挖掘在中医药中应用数据挖掘在中医药中应用聚类如何实现:从复杂数据中提取简单的分组结构26根据采集的与26自动聚成若干类8/3/2024278/3/2024吩妻氯抗慈聪隔卑痉窟佃层窿赵漏颊糕惯酚阮极娘轮企秸荫楷簧民肝蔑孝数据挖掘在中医药中应用数据挖掘在中医药中应用自动聚成若干类7/29/2023277/29/2023吩妻氯27相似度聚类,是把最相似的数据聚结在一起形成类别。通常最常用的计算方式就是“欧式距离”欧式距离表示多维空间的几何距离:例如:8/3/202428A人物像人物像B人物像人物像裙子10头发41衣着鲜艳10粗谎事纂芍剑悍柜捆铬固订离防辑轿枷汪沪庚洽鬼细贩让踩撒宪坎打遁畔数据挖掘在中医药中应用数据挖掘在中医药中应用相似度聚类,是把最相似的数据聚结在一起形成类别。7/29/228欧式距离计算8/3/202429裙子x头发x衣着鲜艳zA人物像人物像B人物像人物像裙子10头发41衣着鲜艳10欧式距离格惕穆泼讯即沽及鳃往谗移酞毛致轩面趋湃透镶瞧侵骏淫旱载澜捉财姨牢数据挖掘在中医药中应用数据挖掘在中医药中应用欧式距离计算7/29/202329裙子x头发x衣着鲜艳zA人29欧式距离计算-完成相似度度量公式:DISTANCE(A,B)=3.31 注意的是最相近的值(一样)一定是08/3/202430A人物像人物像B人物像人物像裙子10头发41衣着鲜艳10烂绦闻沙竿的教挟淌耿促滨技盏纠坷华椎阳晃讥吧沥忠镊巳蛊快筋诽虑羊数据挖掘在中医药中应用数据挖掘在中医药中应用欧式距离计算-完成相似度度量公式:7/29/2023330计算相似度后如何聚类?8/3/2024318/3/2024稠撤弥豁剁胎琴禄狡淌牲呆瘫裕田滨腑桔咒柄婶何丝镐决处唐宫坛慕使淳数据挖掘在中医药中应用数据挖掘在中医药中应用计算相似度后如何聚类?7/29/2023317/29/20231计算相似度后如何聚类?(自下而上的层次聚类法)有了具体相似度量后,每两个对象之间都形成一个相似度值。4*4的矩阵8/3/20243201011205340先把最相近的聚类到一起变成一簇和其他对象再进行相似度计算在数学上,矩阵是指纵横排列的二维数据表格。matrix天烟猴桔剧需疼放植孰厅讽缘早告幻晰昔面卵窍帖峭括艾酵强擎龋匹宰磊数据挖掘在中医药中应用数据挖掘在中医药中应用计算相似度后如何聚类?(自下而上的层次聚类法)有了具体相似32两个合并在一起的簇怎么和其他对象比较?3*3的矩阵有很多计算方法:介绍单连接:D(c1,c2)=Mind(o,O)D(,)=Mind(,),d(,)=28/3/2024330?0?4001011 2 053 40211滤足医远童傅憾股酗通理嗡劲禾非恰畅矛绵搞釜褪茨屡檄龚蚜篙擞匡彼部数据挖掘在中医药中应用数据挖掘在中医药中应用两个合并在一起的簇怎么和其他对象比较?3*3的矩阵有很多计算338/3/202434o有很多规定定义这种计算。l单连接取最近值l完全连接取最远值l。020340瞥挡瞳窄趣揖忱近朋圣堆舵玉六慌书踩喻够枢帆蚂敏屏溉化稀钉逼惑恕叶数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/202334有很多规定定义这种计算。020340瞥34聚类完成8/3/202435030鲸恨氯凸羹谣泵哈哗万逞抓吼语祖装焊燎肾与耍贞氮总督秦糊叼车口捧菏数据挖掘在中医药中应用数据挖掘在中医药中应用聚类完成7/29/202335030鲸恨氯凸羹谣泵哈哗万逞抓35聚类分析特点是物以类聚的一种统计分析方法。用于对事物类别的面貌尚不清楚,甚至在事前连总共有几类都不能确定的情况下进行分类。在中医药中应用:一组某病人,利用聚类,聚集成几类,推断出该病常见证型有哪些?8/3/202436邹响诊灸幅阀谴园业酸非曰簇既募宏蜗纤汲涂沾靠笑后级尉肛棺涡肆涅姻数据挖掘在中医药中应用数据挖掘在中医药中应用聚类分析特点是物以类聚的一种统计分析方法。用于对事物类别的面36分类Classification即为按照分析对象的属性分门别类加以定义,建立类别。例如:银行贷款用户:分为高风险、中风险、低风险三类用户。如有申请贷款者,根据所填写信息,利用数据挖掘方法,划分其是三类用户中那一类。8/3/202437似缉浪堰寐威柏忙际醇霹瓢捍隧呐小较善筒埋咯羊腋撇避报颜剧寻殉危订数据挖掘在中医药中应用数据挖掘在中医药中应用分类Classification7/29/202337似缉浪37主要介绍关于分类的两种方法贝叶斯模型决策树8/3/202438沛梢吱辑指允粹肌上象炬逢呆谱竞沉甄极趣国剪粗渗僧扬坪够天岂困逆镶数据挖掘在中医药中应用数据挖掘在中医药中应用主要介绍关于分类的两种方法贝叶斯模型7/29/202338沛38贝叶斯模型14天打网球情况。14天不同天气情况下打网球的情况分类目的:根据新的一天天气,决定是否打网球8/3/202439天气天气温度温度湿度湿度有风有风yesNoyesNoyesnoyesno晴23热22高34否 62多云40温暖42正常61是 33雨32凉爽31打网球打网球YESNO95实例:根据以往打网球的情况,看看根据新一天的天气情况,能否打网球?吨妹境抠猴仆少挡呵脱添催毖歧砂磷辞括梁限龙扒谭氟痰蝎肮桌嘛今奢知数据挖掘在中医药中应用数据挖掘在中医药中应用贝叶斯模型14天打网球情况。7/29/202339天气温度湿39目的:给出新一天的气候:看看是否打网球?贝叶斯模型利用概率的方式计算:就是在天气(晴)=YES,气温(凉爽)=YES,湿度(高)=YES,有风=YES的条件下:打网球是否为YES?8/3/202440天气天气气温气温湿度湿度有风有风晴凉爽高是例镜伐吸骚宠镶贞节鼻骄起昆荣狰办昨版饮芜嘛螟范崎诱模日酮酪挟怜便数据挖掘在中医药中应用数据挖掘在中医药中应用目的:7/29/202340天气气温湿度有风晴凉爽高是例镜伐40计算过程转换14天打网球情况为概率表14天不同天气情况下打网球的情况 8/3/202441天气天气温度温度湿度湿度有风有风打网球打网球yesNoyesNoyesnoyesnoyesNo晴23热22高34否 6295多云40温暖42正常61是 33雨32凉爽31天气天气温度温度湿度湿度有风有风打网球打网球yesNoyesNoyesnoyesnoyesNo晴2/93/5热2/92/5高3/94/5否 6/92/59/145/14多云4/90温暖4/92/5正常6/91/5是 3/93/5雨3/92/5凉爽3/91/5不象舜阅颐昭休什民棠俐啡鄂搅第咕详吁锣翅僧斗确昏役勺吝沪陈屉艺垢数据挖掘在中医药中应用数据挖掘在中医药中应用计算过程转换14天打网球情况为概率表14天不同天气情况下打网41天气天气温度温度湿度湿度有风有风打网球打网球yesNoyesNoyesnoyesnoyesNo晴2/93/5热2/92/5高3/94/5否 6/92/59/145/14多云4/90温暖4/92/5正常6/91/5是 3/93/5雨3/92/5凉爽3/91/5YES的概率(红色)=2/9*3/9*3/9*3/9*9/14=0.0053NO的概率(绿色)=3/5*1/5*4/5*3/5*5/14=0.0206YES+NO=1,经过归一化处理YES=20.5%,NO=79.5%8/3/202442帝踏伍皖息秃宣续芍靡诌噎妙歇旨些憎逮姆砖灶仙眨弓烹督层煌巫霹舟椅数据挖掘在中医药中应用数据挖掘在中医药中应用天气温度湿度有风打网球yesNoyesNoyesnoyesn42贝叶斯模型特点所有条件变量对于分类均是有用的先验知识的正确和丰富和后验知识的丰富和正确,能直接影响分类的准确性在中医药医学中范例应用于专家系统诊断。根据症状,推断出诊断。8/3/202443份觉翌琅破拳宜竿青瓢笛按绍郭衰祷志辜士讳块瓦朝冉鲸炯测踞券坏翘搜数据挖掘在中医药中应用数据挖掘在中医药中应用贝叶斯模型特点所有条件变量对于分类均是有用的7/29/20243决策树决策树(decision tree)每个决策或事件都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树例:根据表格情况形成分类树8/3/202444性别性别年龄年龄血压血压药物药物1男20正常A2女73正常B3男37高A4男33低B5女48高A药物B血压年龄药物A药物B药物A高正常低4040毫吩各泄筐下下赐冰期孙垢赵市拨跌泊挎抓乘邯哟浴庸膘份萤猩戴揉菇咐数据挖掘在中医药中应用数据挖掘在中医药中应用决策树决策树(decision tree)每个决策或事件都44如何解读决策树信息如果血压高,则采用药物A如果血压低,则采用药物B如果血压正常并且年龄小于等于40,则采用药物A,否则采用药物B.8/3/202445药物B血压年龄药物A药物B药物A高正常低4040恬蛔峙命椰截闸靳汕酶蚁炳葵圈缕更诱魔途驾嫉翔投锚沁别喧麓屑服紊乃数据挖掘在中医药中应用数据挖掘在中医药中应用如何解读决策树信息如果血压高,则采用药物A7/29/202345产生疑问如何计算p节点如何划分?为什么先血压,后年龄?p分裂变量的界限为什么以40岁为界限?8/3/202446药物B血压年龄药物A药物B药物A高正常低4040悦伺暮缚达辙毯汞靡码韭儿辰菏到郁死涯农强菱妄绊糜堡姆皱痴哥淮伴胳数据挖掘在中医药中应用数据挖掘在中医药中应用产生疑问如何计算节点如何划分?7/29/202346药物B血46介绍其中一个ID3算法计算决策树14天打网球情况。14天不同天气情况下打网球的情况分类目的:根据新的一天天气,决定是否打网球8/3/202447天气天气温度温度湿度湿度有风有风yesNoyesNoyesnoyesno晴23热22高34否 62多云40温暖42正常61是 33雨32凉爽31打网球打网球YESNO95榨帜馏饶债洁砂曰秀咯限整夯峨吓监螟饼椰窗廉柬壳咋孝澜揩凹逮串添怯数据挖掘在中医药中应用数据挖掘在中医药中应用介绍其中一个ID3算法计算决策树14天打网球情况。7/29/4714天具体打网球情况:序号序号天气天气气温气温湿度湿度有风有风打网球打网球1晴热高无NO2晴热高有NO3多云热高无YES4雨温暖高无YES5雨凉爽正常无YES6雨凉爽正常有NO7多云凉爽正常有YES8晴温暖高无NO9晴凉爽正常无YES10雨温暖正常无YES11晴温暖正常有YES12多云温暖高有YES13多云热正常无YES14雨温暖高有NO48堰垛殆拎榷瘦将丘惊珠座荒早荫胞邻脐咒狗阵清摊履帧篮羡秧起倦厦持瘦数据挖掘在中医药中应用数据挖掘在中医药中应用14天具体打网球情况:序号天气气温湿度有风打网球1晴热高无N48每一个因素形成一个决策树分支天气天气yesNo晴23多云40雨328/3/202449基于天气划分决策树基于天气划分决策树天气1:NO2:NO8:NO9:YES11:YES3:YES7:YES12:YES13:YES4:YES5:YES6:NO10:YES14:NO晴多云雨膝痴雕全订犯划砸像伶额午宫绞林希拨厩慌艺枢妈杉贫夜贫跌铭涣舰谋寿数据挖掘在中医药中应用数据挖掘在中医药中应用每一个因素形成一个决策树分支天气yesNo晴23多云40雨349其他因素也形成了一个树的分支8/3/202450气温1:NO2:NO8:YES13:YES4:YES8:NO10:YES11:YES12:YES14:NO5:YES6:NO7:YES9:YES热温暖凉爽有风1:YES3:NO4:YES5:YES8:YES9:NO10:YES13:YES2:NO6:NO7:YES11:YES12YES14:NOfalsetrue湿度1:NO2:NO3:YES4:YES8:NO12:YES14:NO5:YES6:NO7:YES10:YES11:YES13:YES高正常化范涎骨罪澄俊带偏瞥子迎侨碟拆蓖梆绿纯侣鞍垢妖苹盖缕韧蠕害陕考井数据挖掘在中医药中应用数据挖掘在中医药中应用其他因素也形成了一个树的分支7/29/202350气温1:N50如何把多个因素合并成一个大的决策树?天气、气温、湿度、有风这四个因素谁为起点分支?在何处分支?在何处停止?越确定的在分支,越不确定的在主干。否则到了树的支端无法做决定。但如何计算它们的确定性和不确定性?8/3/202451药物B血压年龄药物A药物B药物A高正常低4040掩乱呸逊实奉驾毁佯娃枯矣圭袱霜皱歇婪磨椭堑推魂扣膝脑柒尾网魂码普数据挖掘在中医药中应用数据挖掘在中医药中应用如何把多个因素合并成一个大的决策树?天气、气温、湿度、有风这51如何把小的分支合并成一棵大的决策树?首先介绍一下信息的一个计算方法:信息熵的定义:无序性度量。(不确定性)对值的无序的情况做一个量化的测量。例:信息熵=0 信息熵=0 信息熵最大当都是yes或都是NO时无序性很差,不确定性很弱,信息熵最小0当yes和no一样多时无序性很强,不确定性很强,信息熵最大8/3/2024521:NO2:NO8:NO13:NO1:YES2:YES8:YES13:YES1:NO2:NO8:YES13:YES顾暗袱畴朝脖酝固咀很巧东痉米吸措杀叼伪梨咒疗戎缓祟莉砒猪货引畔爆数据挖掘在中医药中应用数据挖掘在中医药中应用如何把小的分支合并成一棵大的决策树?首先介绍一下信息的一个计52利用熵的计算方法计算决策树越到树的主干,不确定性越大,熵越大,越到树的分支,确定性越大,熵越小以便决定YES 或NO8/3/202453熵大熵小确定性越大不确定性越大Yes和no越平均Yes和no越一致被佩计瞬费鼠卒藐侄御聘轰咐岂既诽丝纠痹栈捶刷邯岩扩翱签齐表宁扬隅数据挖掘在中医药中应用数据挖掘在中医药中应用利用熵的计算方法计算决策树越到树的主干,不确定性越大,熵越大53信息熵的计算公式InfoC1,C2=ENTROPY(P1,P2)=-P1*LOG2P1P2*LOG2P2 C1,C2代表发生事件的不同数量 P1=C1/(C1+C2)发生事件的不同概率以YES与NO为例解释:C1,代表发生yes的次数,P1,代表发生YES的概率 C2,代表发生NO的次数,P2,代表发生NO的概率 8/3/202454函数名称,就像SUM一样。汲忿刊颓痕芯品芦茫恋荔邑握挤丙粱均抬圆倒举饼焊闺厩念窟绞劫燥研烤数据挖掘在中医药中应用数据挖掘在中医药中应用信息熵的计算公式InfoC1,C2=ENTROPY(P154InfoC1,C2=ENTROPY(P1,P2)=-P1*LOG2P1P2*LOG2P2C1,代表发生yes的次数,P1,代表发生YES的概率 C2,代表发生NO的次数,P2,代表发生NO的概率例如:在一个节点上yes是2,no是3P1=2/5 P2=3/5Info(2,3)=-2/5*LOG2(2/5)-3/5*LOG2(3/5)=(-0.4)*(-1.32)+(-0.6)*(-0.74)=0.971位8/3/202455天气1:NO2:NO8:NO9:YES11:YES晴比特,又叫Bit,是计量单位酚众排附颖异阳枷佳盂纶逾枪徒唤琉瑰湘卉狐赋盏显人磺目社抑珊昂术百数据挖掘在中医药中应用数据挖掘在中医药中应用InfoC1,C2=ENTROPY(P1,P2)55以天气为例进行信息熵计算天气天气yesNo晴23多云40雨32合计958/3/202456Info(晴)=Info(2,3)=0.971位Info(多云)=Info(4,0)=0.0位Info(雨)=Info(3,2)=0.971位还是不能确定谁是主干:观点就是天气、气温、湿度、有风,谁建立了分支之后,信息的不确定性消除得越多,就当做主干。也就是看看以谁当主干,很快就达到了分支,很快信息就变得确定了。微篇匙羔乎拦肃豫驶绑溪竿叶常三冀防麻中锯革插截欲军让赢休烯柜帽不数据挖掘在中医药中应用数据挖掘在中医药中应用以天气为例进行信息熵计算天气yesNo晴23多云40雨32合56计算天气下面建立分支后不确定性Gain(天气)=info(天气合计)-info(晴,多云,雨)=info(9,5)-info(2,3,4,0,3,2)=info(9,5)-(info(2,3+info(4,0+info(3,2)=0.2478/3/202457天气天气yesNo晴23多云40雨32合计95不确定性消除的值有一个名词表示:信息增益gain平均信息值乾陈腑帛钥所蚕痘经瘦钧坤捻罪盒福伍冻囊畏蕴琳买墙怔穆娜咱胎哑挡忧数据挖掘在中医药中应用数据挖掘在中医药中应用计算天气下面建立分支后不确定性Gain(天气)=7/29/257同理计算出其他三个因素下面建立分支后,信息不确定性消除了多少Gain(天气)=0.247位Gain(气温)=0.029位Gain(湿度)=0.152位Gain(有风)=0.048位8/3/202458选择不确定性消除最大的作为第一级主分支崔坊晋晤可亡鸟戚羔站榜穆延盟寺炽皮蚂司铸粪专盛答贸诽褐婪殿另戮耽数据挖掘在中医药中应用数据挖掘在中医药中应用同理计算出其他三个因素下面建立分支后,信息不确定性消除了多少58天气已经作为第一个主干了,那么下面该接着谁作为下一级主干?8/3/2024591:NO2:NO8:NO9:YES11:YES3:YES7:YES12:YES13:YES4:YES5:YES6:NO10:YES14:NO气温?湿度?有风?直接做决定需要参考其他因素需要参考其他因素饯轿块嘱旺道尤孙凛滋钝隆傻黍迎膨披屋僳零够徒璃惧蒂宽竭唁强冶穿必数据挖掘在中医药中应用数据挖掘在中医药中应用天气已经作为第一个主干了,那么下面该接着谁作为下一级主干?75914天具体打网球情况:序号序号天气天气气温气温湿度湿度有风有风打网球打网球1晴热高无NO2晴热高有NO3多云热高无YES4雨温暖高无YES5雨凉爽正常无YES6雨凉爽正常有NO7多云凉爽正常有YES8晴温暖高无NO9晴凉爽正常无YES10雨温暖正常无YES11晴温暖正常有YES12多云温暖高有YES13多云热正常无YES14雨温暖高有NO60篮绪胜奠泛辊盈钦吟毯武膨搐裁魏钳巩盈菏搏伦圈历讶图汲捐砚往熊祖兵数据挖掘在中医药中应用数据挖掘在中医药中应用14天具体打网球情况:序号天气气温湿度有风打网球1晴热高无N60以天气晴下面建立分支为例:以信息完全确定作为分支的结束8/3/2024618/3/2024611:NO2:NO8:NO9:YES11:YES气温1:no2:no8:no9:yes11:yes热温暖凉爽序号序号天气天气气温气温打网球打网球1晴热NO2晴热NO8晴温暖NO9晴凉爽YES11晴温暖YES霜涉蝗磺亿斜赐炉份任掌舷疾览缮掂裴揪缉悼蚌界者枪棉晾对缀集联做先数据挖掘在中医药中应用数据挖掘在中医药中应用以天气晴下面建立分支为例:以信息完全确定作为分支的结束7/261以天气晴下面建立分支为例:以信息完全确定作为分支的结束6262湿度1:no2:no8:no9:yes11:yes序号序号天气天气湿度湿度打网球打网球1晴高NO2晴高NO8晴高NO9晴正常YES11晴正常YES高正常铆缮串血眉盲菠跑钳引半宁栓隘圣渐调喉悲独锌洋产购褥酿措棱溶廷滇了数据挖掘在中医药中应用数据挖掘在中医药中应用以天气晴下面建立分支为例:以信息完全确定作为分支的结束626628/3/202463序号序号天气天气有风有风打网球打网球1晴无NO2晴有NO8晴无NO9晴无YES11晴有YES有风1:no8:no9:yes2:no11:yes无有稚原湘仁孜粪哲早彦岂盼绽恼菲喇帆优攒豹抿甫沿孺牺听肚地酝弥啥懦梆数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/202363序号天气有风打网球1晴无NO2晴有NO63以天气晴下面建立分支为例:以信息完全确定作为分支的结束8/3/2024648/3/2024641:NO2:NO8:NO9:YES11:YES气温湿度有风1:no2:no8:no9:yes11:yes1:no2:no8:no9:yes11:yes1:no8:no9:yes2:no11:yes姬险袒嚏贯饰闪惕谐耸祖缀盟滴鹿肌薄涸殖簧蝗端丈询殷懒淖矣诚彻档稽数据挖掘在中医药中应用数据挖掘在中医药中应用以天气晴下面建立分支为例:以信息完全确定作为分支的结束7/2648/3/2024651:NO2:NO8:NO9:YES11:YES3:YES7:YES12:YES13:YES4:YES5:YES6:NO10:YES14:NO1:no2:no8:no9:yes11:yes4:yes5:yes10:yes6:no14:no最终的决策树巨淋舶汹愿墩纫茎三韶腰锰垫滤储沪党郴撞翅岔篮谰哉丹砂轻蹬饵睦搪悯数据挖掘在中医药中应用数据挖掘在中医药中应用7/29/2023651:NO3:YES4:YES1:no965结果人性化8/3/202466知廊哩采御牛频表絮绩楷滤测矗绥奏家伎酉揣壮恨东漾蔗撵鼻娘牲剧证彤数据挖掘在中医药中应用数据挖掘在中医药中应用结果人性化7/29/202366知廊哩采御牛频表絮绩楷滤测矗66决策树的特点决策树一般都是自上而下的来生成的。可以完成分类任务,而且因为是树状结构,比较容易被使用者理解。8/3/202467猪耍凿钥戏幢异基爷楚共述巴锁得殆卢塘漓贝纬办剂钻松禹甄澡店笔炳啡数据挖掘在中医药中应用数据挖掘在中医药中应用决策树的特点决策树一般都是自上而下的来生成的。7/29/2067第一步骤选择第三步骤挖掘第二步骤处理第四步骤分析8/3/202468数据挖掘步骤目标数据目标数据预处理预处理及变换及变换变换后的数据变换后的数据数据挖掘数据挖掘算法算法解释解释/评估评估68清理筛选清理筛选蛋替躇钮呆攻厄冗抿广禄般根杠馅烽百十确顽羽胎鸟呛访瞻挝震丁寞王合数据挖掘在中医药中应用数据挖掘在中医药中应用第一步骤第三步骤第二步骤第四步骤7/29/202368数据挖68第一步骤:选择收集数据 就是进行原始需要被挖掘的数据采集。例如:做肺癌处方的数据挖掘,要采集肺癌处方的信息,或原有的患者信息中导出,形成数据子集。原始数据的采集非常费时费力,通常在费用中占相当大的比重。可以采用较小规模的数据对问题的可行性进行初步研究。8/3/202469趟敝竿备迪熊弃访均氯盛把薯鬃椭啊堑涧孝层解惫司淮挟须琉砚烈耘萌耪数据挖掘在中医药中应用数据挖掘在中医药中应用第一步骤:选择收集数据7/29/202369趟敝竿备迪熊弃访69第二步骤:处理数据预处理部分,把数据转换成比较容易被数据挖掘的格式及内容。内容处理:年龄 六十岁60 有个还分组:老年、青年、等格式处理:年龄 出生日期1950年转成61。8/3/202470渺猜全评溢雏族牙砰献味棋哭苫翅个短向瑚茹峭遭误踢俗唁声细箍柞没共数据挖掘在中医药中应用数据挖掘在中医药中应用第二步骤:处理数据预处理部分,把数据转换成比较容易被数据挖掘70第三步骤:挖掘运用工具和算法,进行挖掘,完成分类、关联、聚类、估计、预测等功能,发现数据中的规律。例如:关联分析中常用apriori算法,算法就是一种计算方法,例如:计算一个班上有多少人:可以用加法或乘法。加法和乘法就是算法。8/3/202471挪弦作槽订敖简窒拯妊严欢室声辙辜瑰吨巢算亩朴障张轿靶虽荆哉宜浆诵数据挖掘在中医药中应用数据挖掘在中医药中应用第三步骤:挖掘运用工具和算法,进行挖掘,完成分类、关联、聚类71第四步骤 分析例如:预测信用卡欺诈行为。通过算法分析信用卡用户的购买习惯,根据结果认识客户的模式,并分辨出偏离模式的信息卡盗用行为。8/3/202472毅沧似胯货摆真槐欠鞘射妊井视降九钮硕谅所撤戈嚏嘲横要欧耶吃刚婉璃数据挖掘在中医药中应用数据挖掘在中医药中应用第四步骤 分析7/29/202372毅沧似胯货摆真槐欠鞘射妊72概念数据挖掘在中医药领域中应用73炮臭拨头妻厩娘宪毕惠靖壹酚掉淡阜挟躬食创折企铀晒妥母请袒侮艘责橙数据挖掘在中医药中应用数据挖掘在中医药中应用概念数据挖掘在中医药领域中应用73炮臭拨头妻厩娘宪毕惠靖壹酚73二、关联分析在中医领域应用情况中医领域及计算机领域均有深入研究中医中医中医中医计算机计算机中国中医科学院中国中医科学院 南京中医药大学南京中医药大学 湖南中医药大学湖南中医药大学 福建中医学院福建中医学院 北京中医药大学北京中医药大学浙江大学计算机科学与技术学院浙江大学计算机科学与技术学院 厦门大学厦门大学 山西医科大学山西医科大学 山东师范大学山东师范大学 南京理工大学南京理工大学 南方医科大学南方医科大学 江苏大学江苏大学 河南大学河南大学 合肥工业大学合肥工业大学 哈尔滨工程大学哈尔滨工程大学 广东工业大学广东工业大学 东北大学东北大学 北京交通大学北京交通大学 北京工业大学北京工业大学 连嚷氢逐卡随她梨泽嫡生省聋爵米华怒灵液衰绒倚滁情葵去擞舷仑折涧眷数据挖掘在中医药中应用数据挖掘在中医药中应用二、关联分析在中医领域应用情况中医领域及计算机领域均有深入7474近近3 3年的学位论文年的学位论文中医症状病机实体识别及其关系挖掘研究绝经综合征中医药临床疗效评价方法的数据挖掘研究中医诊疗中挖掘算法的方法研究基于智能算法的医学数据挖掘特征权重优化方法研究及其应用中医医案数据挖掘技术研究基于数据挖掘技术的证素辨证方法研究中医小儿肺炎疗效评价系统的设计与实现基于数据挖掘对急性冠脉综合征辨证论治规律的探索性研究中医小儿肺炎辩证标准数据挖掘系统中的数据预处理技术基于数据挖掘的周仲瑛教授治疗系统性红斑狼疮病案回顾性研究中医临床诊疗垂直搜索系统研究基于数据挖掘的中医脏腑辨证系统研究中医活血化瘀方数据库及其数据挖掘基于数据挖掘的中医方剂分析技术研究中医妇科常见病医案数据挖掘方法研究基于粒计算与完全图的关联规则算法研究中药归经(肺经)理论和肺系方剂配伍规律的解析及在海洋中药研发中的应用基于聚类和BP网络集成的中医耳穴智能诊断仪研究应用信息技术探索我国高等中医药院校学术及科研发展趋势基于分类关联规则的仲景方挖掘研究田从豁教授治疗痹证、瘾疹、不寐的经验挖掘分析基于贝叶斯网络的中医医案数据挖掘特征选择在中医数据挖掘中的应用研究基于SVM与关联规则中医舌象数据挖掘技术初步研究数据挖掘中分类分析的策略研究及其生物医学应用基于HMM的中医临床疗效评价分析研究数据挖掘在中医若干问题研究中的应用关联规则挖掘在中医辨证诊断中的应用研究数据挖掘模型的创建及其在中医药文献中的应用研究关联规则算法研究及其在中医药数据挖掘中的应用数据挖掘及其在中医药领域中的应用关联分析在中医数据挖掘中的应用研究脾虚证诊断信息数据挖掘的初步探讨恶性肿瘤与脾虚证相关性数据挖掘的初步探讨明清中医疫病发病、症状与用药相关性数据挖掘研究多路异质聚类在中医临床数据中的应用及其研究名老中医经验传承中的数据挖掘技术研究粗糙集合属性约简方法研究与实现面向中医胃病诊疗的数据挖掘技术SVM算法研究及其在中医脏腑辨证中的应用慢性胃炎中医诊疗中的数据挖掘研究DartSpora数据挖掘平台的构建吕仁和教授治疗糖尿病学术思想及其传承方法的研究可扩展智能推理及其在中医舌诊中的应用绝经综合征中医证治规律的数据挖掘模型与系统架构设计腺刚跑盂藩拯朝蕴咀挠侄俐靳脊溅淘鸡滔危告楚屹穷拷颂洪祈阎返岗桔划数据挖掘在中医药中应用数据挖掘在中医药中应用近3年的学位论文中医症状病机实体识别及其关系挖掘研究绝经综合7575 原始数据规范不足原始数据规范不足 挖掘领域局限性挖掘领域局限性 结果评价不充分结果评价不充分 存在问题颗剩氯肆鹃蔓眷姥毗囚轩滋腑辉汹浪啼复睹夜析漓倔钙锈怖迸剿辣锌疮沛数据挖掘在中医药中应用数据挖掘在中医药中应用 原始数据规范不足 存在问题颗剩氯肆鹃蔓眷姥毗囚轩滋腑7676 研究目的:丰富妇科的临床用药理论探索:中药与中药之间症状与症状之间证型与证型之间中药与症状之间中药与证型之间症状与证型之间三、数据挖掘在中医妇科医案中的应用关系关系峻罐浅颈稻歹牟道怎瞳浓览胯淆埔第距撩烧雄锦锋菏盏蓖慷郎坊泅侯滥熔数据挖掘在中医药中应用数据挖掘在中医药中应用研究目的:三、数据挖掘在中医妇科医案中的应用关系峻罐浅颈7777收集符合要求的医案第一步第一步数据数据采集采集第二步第二步数据数据预处理预处理第三步第三步数据数据挖掘挖掘第四步第四步结果评结果评价分析价分析把收集的妇科医案数据统一把统一好的数据进行数据挖掘把挖掘结果作一个综合分析研 究 流 程废硼丸嗣倡屋余铲炎诈钓辐冒湘积耕恢崎渊禄危到试况牙钻烈煤假咀做唱数据挖掘在中医药中应用数据挖掘在中医药中应用收集第一步第二步第三步第四步把收集把统一把挖掘研 究 7878 医 案 采 集病种病种选择选择医家医家选择选择医案医案时间时间医案医案内容内容第一步:数据采集禹究椿辩崔吉熙葫悟愈啄蔫郴陆挑柬榨礼阀现桓剃概那饺蝎箔葱回癸绣按数据挖掘在中医药中应用数据挖掘在中医药中应用 医 案 采 集病种医家医案医案第一步:7979 参考94中医药行业标准:确定妇科常见疾病共有14个通过检索中医药信息研究所的中国中医药期刊文献数据库检出这些疾病的期刊文章发表情况病种选择叫躲们毋部叔随漆围纸吵晚睁曝宣沃剐菱轨曾湿辩屡性闭叉五弹卫巫询营数据挖掘在中医药中应用数据挖掘在中医药中应用参考94中医药行业标准:病种选择叫躲们毋部叔随漆围纸吵晚睁曝8080 病 种 选 择譬谋捡聋丹牲洱皆尝乒寓行净挣绷逞给放愚贡椽孺朝诅状蔑溶刚箕希赵侦数据挖掘在中医药中应用数据挖掘在中医药中应用 病 种 选 择譬谋捡聋丹牲洱皆尝乒寓行净挣绷8181 选择了前个发表文献数最多的病种,在医案实际记录中,有的病名很模糊,故医案中信息诊断参考了国家中医药管理局1994年颁布了中华人民共和国中医药行业标准-中医病症诊断疗效标准肢味销噬夏奠困赖划屿迅载蛙丑掖怪鹅淆篱驻痞捕闷档亲碗尸帚赴冒译侵数据挖掘在中医药中应用数据挖掘在中医药中应用选择了前个发表文献数最多的病种,肢味销噬夏奠困赖划屿迅载蛙8282 医 案 总 况病种病种选择选择医家医家选择选择医案医案时间时间医案医案内容内容痛痛经经崩崩漏漏不不孕孕闭闭经经经验经验丰富的丰富的医师医师医案医案出版出版时间时间1972197220052005医案医案就诊就诊时间时间1951195120032003中中医医诊诊断断中中药药处处方方证证型型症症状状底哨蝗幸雕宏丰蠢皿缓绿预穴戏猴疯梦出斡瞻未呻野难舶数镁赤守未芍壕数据挖掘在中医药中应用数据挖掘在中医药中应用 医 案 总 况病种医家医案医案痛崩不闭经验医8383采集医案情况处方,症状,证候原文采集涉及医案共2138例 崩漏664例 闭经408例 不孕631例 痛经435例期刊中医案848例,专著中医案1290例涉及医家476位氏笺浅汽宅霉鞋夺乒帆冻喊咳拱捂拇挚的异振倾材酗以括膳慨锻巩及掌烦数据挖掘在中医药中应用数据挖掘在中医药中应用采集医案情况处方,症状,证候原文采集氏笺浅汽宅霉鞋夺乒帆冻喊8484数据采集内容 围绕数据挖掘目的:寻找证-症-药关系。采集4种疾病医案中证-症-药信息崩漏闭经不孕痛经证型证型症状症状处方中药组成处方中药组成羌枷诅需嚼乃掉秸沏外抄秧掇朵瞄源鸟嫌怕栖呼播赦嚼乡欠上刺孪嚼瑟赫数据挖掘在中医药中应用数据挖掘在中医药中应用数据采集内容围绕数据挖掘目的:寻找证-症-药关系。崩漏证型症8585确定一些纳入排出标准例如:在本课题收录的医案中,治疗方法都是单纯的中草药内服治疗。凡含有中成药、针灸治疗、外用治疗、西药治疗、手术治疗的医案均被排除在外。这里特别要说明的是中成药治疗不予收录。辨证必须含有病性和病位内容。一些医案的辨证部分只含有病位如“肝脾为病”或只含有病性“虚”或“实”不予收录。症状除主症之外必须有两个以上症状描述,澜栈错钡东链碴吠柬枣粪疲尉长钡桩刃衫桅过堂骋蝉苦捡绊费跨王烹威辐数据挖掘在中医药中应用数据挖掘在中医药中应用确定一些纳入排出标准例如:澜栈错钡东链碴吠柬枣粪疲尉长钡桩刃8686采集医案样例1 1陈陈陈陈某某某某4343岁岁岁岁19197676,1212,1414月经过多来则月经过多来则月经过多来则月经过多来则如崩,已十余如崩,已十余如崩,已十余如崩,已十余年,血色鲜红,年,血色鲜红,年,血色鲜红,年,血色鲜红,夹有大血块夹有大血块夹有大血块夹有大血块无腹痛头面无腹痛头面无腹痛头面无腹痛头面洪热洪热洪热洪热,此次经此次经此次经此次经期将临,舌胖,期将临,舌胖,期将临,舌胖,期将临,舌胖,苔薄白,脉沉苔薄白,脉沉苔薄白,脉沉苔薄白,脉沉细细细细气血气血气血气血两亏两亏两亏两亏,冲任冲任冲任冲任损伤损伤损伤损伤党参党参党参党参12g12g黄芪黄芪黄芪黄芪12g12g白术白术白术白术9g9g生贯生贯生贯生贯众众众众30g30g花蕊石花蕊石花蕊石花蕊石 30g30g益母草益母草益母草益母草9g9g升升升升麻麻麻麻6g6g槐花槐花槐花槐花12g12g生生生生甘草甘草甘草甘草 4.5g 4.5g炙甘草炙甘草炙甘草炙甘草 4.5g4.5g侧柏叶侧柏叶侧柏叶侧柏叶30g30g山药山药山药山药 15 15川断川断川断川断12g12g钩藤钩藤钩藤钩藤12g12g崩崩崩崩漏漏漏漏沈沈沈沈仲仲仲仲理理理理近现近现近现近现代二十代二十代二十代二十五位中五位中五位中五位中医名家医名家医名家医名家妇科经妇科经妇科经妇科经验验验验 24242 2页页页页症状症状 证型证型 中药名称都中药名称都需要规范处理需要规范处理椿侵娥坦区绊牵竹郧捅繁知刁球派哄矾篱碱奶剁垢弥朵者永孩往嘉粱猴童数据挖掘在中医药中应用数据挖掘在中医药中应用采集医案样例1陈某43岁1976,12,14月经过多来则如崩8787预处理内容预处理内容总则总则 尽量贴近临床尽量贴近临床 尽量忠于原意,不尽量忠于原意,不失或少失原意。失或少失原意。中药中药证型证型症状症状 数 据 预 处 理私缮瘸弄庸笆珍日恬镇器炉捞嘛慷肪皑瞥斟村搓痢缀百殷魄芋辱淹隘弯踢数据挖掘在中医药中应用数据挖掘在中医药中应用预处理内容总则中药证型症状 数 据 预 处 理私缮瘸8888中 药 部 分 预 处 理名称预处理名称预处理冬术冬术白术白术正异名的处理中药正异名标准表正名是唯一的异名是唯一的紫背金盘草白毛夏枯草翻背白草管仲天水蚁草地膏药毛大丁草根白叶不翻鹿茸草秋牡丹根根委陵菜翻白草白牛胆野丈人胡王使者白头公中华本草中的正中华本草中的正异名循环现象异名循环现象建表方式测硫登升蔚烷盟董买中孰廉蚂舅铁啄查战噎了棺枢殿慌俭梭未昂换苛脖红数据挖掘在中医药中应用数据挖掘在中医药中应用中 药 部 分 预 处 理名称预处理冬术白术正异8989医案中原文规范后木蔓头木馒头青篙青蒿肉从蓉肉苁蓉桑葚桑椹错别字错别字省略字省略字医案原文中名称规范后名称龙牡龙骨,牡蛎赤白芍赤芍,白芍藿荷梗藿梗,荷梗苍白术苍术,白术沽蹄鸟豪佬酣电拜披碉韩黍芜柏瞳卡今码粗铀嚷路征狄虹歇比奴损震燕冉数据挖掘在中医药中应用数据挖掘在中医药中应用医案中原文规范后木蔓头木馒头青篙青蒿肉从蓉肉苁蓉桑葚9090 净净制、切制制、切制对对于于药药物性味物性味归经归经改改变变很小,就是凡很小,就是凡见见中中药药名称中含有名称中含有“片片”、“末末”、“粉粉”、“鲜鲜”、“嫩嫩”、“净净”等等净净制、切制方法的制、切制方法的标标志用志用词词,予,予以去除。以去除。例如:医案例如:医案处处方中方中见见“佛手片佛手片”,直,直接去除接去除“片片”字,被字,被规规范成范成“佛手佛手”。炮制预处理净制、切制净制、切制床位欢披翅个汕择畔箭患宾祭澈嗓腮委佃恶工葛绷奋禄诈剂沮邦叼蛀蹈饯数据挖掘在中医药中应用数据挖掘在中医药中应用净制、切制对于药物性味归经改变很小,就是凡见中药名称中含有9191 净净制、切制、炮炙三种炮制方法中的炮炙法,制、切制、炮炙三种炮制方法中的炮炙法,对对中中药药的性味的性味归经归经等有很大影响,中等有很大影响,中药这药这部部分的炮炙方法分的炮炙方法给给予保留予保留 在中在中药药炮制参考炮制参考书书籍中,每味籍中,每味药药的炮制内容的炮制内容中有中有这样这样一个一个栏栏目目处处方方应应付付,用以指,用以指导导药剂师处药剂师处理理临临床医床医师师的的处处方方3636。例如:例如:大黄的大黄的 处处方方应应付付:处处方中写大黄、川方中写大黄、川军军、生、生军军均付生大黄。写酒大黄、酒均付生大黄。写酒大黄、酒军军付酒炒大黄,付酒炒大黄,写熟大黄、制大黄付熟大黄,其余各随方付写熟大黄、制大黄付熟大黄,其余各随方付给给。参考上述的中参考上述的中药药 处处方方应应付付,熟大黄、制大黄,熟大黄、制大黄都合并都合并为为熟大黄。熟大黄。炮炙炮炙埠迪化肃杭问衡提翼接袒钱到瓤庸喳凝击命瓣垒厂抑扑祷尘噪疥恕近怕稀数据挖掘在中医药中应用数据挖掘在中医药中应用净制、切制、炮炙三种炮制方法中的炮炙法,对中药的性味归经等有9292编号编号编号编号规范后名
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!