资源描述
,标题,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,隐结构模型与中医辨证,/,第,81,页,*,张连文,1,2,隐结构模型与中医辨证,张连文,香港科技大学,2004,年冬,这项工作是与,袁世宏,合作完成的,3,内容概要,介绍,一个机器学习,(machine learning),在中医中应用的例子。,展示,机器学习在中医研究中的大有作为。,中医为机器学习提出的新问题、新挑战。,4,提纲,问题与背景,新方法,基本思想,隐结构分析工具,新方法的可行性,肾虚数据及其分析,结果的意义,总结与展望,致谢,5,问题与背景,/,中医诊断,收集病情资料,望、闻、问、切,例:,小便余沥不尽,夜尿频,精神不振,齿松脱落,下肢困乏不便,记忆力减退,失眠,头部昏晕,,苔薄、,尺脉不足,辨证,对病情资料进行综合分析,从而对疾病当前的病因、病位、病势、病性等本质作出判断,结果:,证,或,证候,例:,肾精亏虚,膀胱失约,6,问题与背景,/,中医辨证,特点,中医辨证没有客观标准,医师辨证技能的高低很大程度取决于经验,老医师才会受到充分信任,辨证结果受主观因素的严重影响,对同一病人不同医师所做的辨证结论往往不同,7,我们的工作,问题,怎样为辨证建立一个客观的、定量的标准?,提出一种研究辨证的方法,利用机器学习为中医辨证提供一个统计学基础、从而为它建立客观标准。,8,问题与背景,/,相关工作,证实质研究,兴起于五十年代,的目标是,,寻找证候的客观检测指标,用客观检测指标对疾病作出诊断;,成功标志:,是否找到与经验基本相符的指标,既具有敏感性,又具有特异性,9,问题与背景,/,相关工作,证实质研究未成功。,例:肾虚证研究,“不同的学者从不同的组织系统和生理病理角度选择了上百个指标,但目前还没有发现一个指标相对肾虚具有特异性” (王洪琦等,1999,),指标例,: 24,小时尿,17,羟,(qiang4),皮质类固醇降低,曾一度被认为是,肾阳虚,的特异性指标,但后来发现,它在,脾阳虚,时也会出现,10,问题与背景,/,相关工作,证实质研究,“,40,年来,中医证实质研究已经将成百上千的实验数据摆在我们面前,按照原定研究目标,这些不争气的数据给予我们的只是困惑和迷茫”。(赵国求,1999,),目前多数学者认为证不能用类似西医的方法靠几个特异性的指标来判定。,11,问题与背景,/,相关工作,回归分析和判别分析,出发点,一组已由专家分类的病例,(labelled data),,,每份病例不但有病人的症状,而且还有专家对病人所作的辨证结论。,目的,建立回归方程或判别函数,症状为自变量,而证候为应变量。,12,问题与背景,/,相关工作,回归分析和判别分析,刘士敬等,1994,数据:中医产科脾气虚证,57,例,非脾气虚证,23,例,回归方程:,X,33,-,滑胎,; X,30,-,胎漏, X,26,-,妊娠腹痛,取值,1,或,0,,分别代表症状的出现和不出现。,辨证,Y=37.54,时判断为脾气虚证,,Y Y,2,则判为痰证,Y,1, Y,2,则判为非痰证。,14,问题与背景,/,相关工作,回归方程和判别函数可以用作辨证的标准,但是说不上是客观的。,它们是对数据的数学总结,,而每份数据中的应变量的取值是专家的主观判断,所以它们其实是专家经验的数学总结,。,因此,用它们作为辨证标准其实就是用专家作为标准,缺乏客观性,15,问题与背景,/,相关工作,聚类分析,出发点,一组未分类的病例,(unlabelled data),,,每份病例只有病人的症状,无辨证结论。,目的,按症状对病例进行聚类,,症状相近的聚为同一类,症状不相似的聚到不同的类,成功标志:,所得的类与中医证侯吻合,杨学鹏(,1993,),用基于距离的聚类,对阴阳两证进行了研究,结果不理想:所得的类与阴证和阳证的特性不吻合。,16,问题与背景,/,相关工作,聚类分析,杨学鹏(,1993,)基于上述思想,对阴阳两证进行了研究,结果不理想:所得的类与阴证和阳证的特性不吻合。,我们也从这个角度做了一些尝试,不成功。,一般来讲,聚类分析有实质性困难。,证候很少单个出现,出现的往往是复合证,其数目十分庞大。,由于类的数目众多,“相邻”类之间的区别未必明显,加上随机性,要通过聚类来确定这些自然类是十分困难的。,我们曾试图用基于模型的聚类分析来研究证,得到如上体会。,17,提纲,问题与背景,新方法,基本思想,隐结构分析工具,新方法的可行性,肾虚数据及其分析,结果的意义,总结与展望,致谢,18,基本思想,辨证理论与隐结构,例如关于肾阴虚,中医认为:,肾阴亏虚,,脑髓、官窍、骨骼,失养,,则见腰膝酸痛、眩晕耳鸣、健忘、齿松发落;,;,虚火,上扰心神,故烦热少寐;肾阴不足,,失于滋润,,,虚火,蕴蒸,故见口燥咽干,形体消瘦,潮热盗汗,或骨蒸发热,颧红,尿黄少。舌红少苔,脉细数,为,阴虚内热,之象。,显变量,(manifest variable),:直接观察到,/”,测量到”,腰膝酸痛、舌红少苔、脉细数,。,隐变量,(latentvariable),:不是直接观察到,/”,测量到”的,肾阴虚、肾阴虚失养、肾阴虚失滋润、阴虚内热,隐结构,:,隐变量之间以及隐变量与显变量之间的关系,19,基本思想,隐变量是什么?,Sobel (1994):,隐变量是人脑思维的产物,是为了解释在众多事例中所观察到的规律而引入的。,例:,观察:数学成绩好的学生,物理、化学成绩往往也好;反之亦然,引入隐变量:,分析能力,分析能力强,则数学、物理、化学成绩一般都较好;,分析能力差,则这三科成绩往往都较差。,例:,“舌上少津”、“口渴喜饮”、“小便黄赤短少”、 “小便涩少”常常结伴出现。,引入隐变量:,津亏,有津亏,则导致这些个症状的出现;,而无津亏时,它们则一般不会出现。,20,基本思想,中医理论:,人脑通过对众多病例的观察,发现规律,为解释这一些规律而引入的隐结构。,中医辨证,用人脑构造的隐结构来指导辨证,缺乏客观性,并且是不定量的,新方法的基本思想,系统收集病例,用计算机:进行分析数据,找出规律性,并且构造隐结构,用这个电脑构造的隐结构来指导辨证,客观性会大大提高,,定量化不再是一个问题。,21,提纲,问题与背景,新方法,基本思想,隐结构分析工具,新方法的可行性,肾虚数据及其分析,结果的意义,总结与展望,致谢,22,隐结构分析工具,统计学中现存的隐结构分析工具,隐类分析,(latent class analysis),、,隐特性分析,(latent trait analysis),、,隐概况分析,(latent pro),、,因子分析,(factor analysis),。,23,隐结构分析工具,隐类分析,隐类模型:,一个隐变量,多个显变量,基于数据,决定,隐变量取值个数,即隐类个数,每个类的统计特性,24,隐结构分析工具,隐类分析的应用领域,社会科学,教育,心理学,及医疗卫生等,西医用它探讨一些病症的诊断标准, 包括,类风湿关节炎,抑郁症,慢性疲劳综合症,注意:,上述三个西医病症与中医证侯有共同特点:,它们都是无法直接观测的,没有诊断金标准,属于隐变量,25,隐结构分析工具,多层隐类分析模型,隐类模型:只有一个隐变量,对证候研究不足够,推广:,多层树状隐结构,多层隐类模型(,hierarchical latent class model),简称,HLC,模型,26,隐结构分析工具,进化树,物种之间的进化关系,进化树构造,基于:当代物种的,DNA,(显变量),推测:过去物种的,DNA,以及它们之间的进化关系 (隐结构),AG,G,GCAT,TA,G,CCCA,TA,G,ACTT,AG,C,ACAA,AG,C,GCTT,AA,G,ACTT,AG,C,ACTT,AA,G,GCCT,AO,G,GCCT,27,隐结构分析工具,进化树构造,假设:不同,site,独立进化,这时,进化树是特殊,HLC,模型,既然进化树构造是一门科学,那么我们也可以用类似方法为中医辨证建立一个科学的基础,。,AG,G,GCAT,TA,G,CCCA,TA,G,ACTT,AG,C,ACAA,AG,C,GCTT,AA,G,ACTT,AG,C,ACTT,AA,G,GCCT,AO,G,GCCT,28,隐结构分析工具,隐结构学习原理,隐结构不可直接观测,为什么可以基于对隐结构进行推测呢?,在数据中能够找到隐结构的踪迹,分析能力的存在表现为,数理化这三科成绩的相互关联:,数学成绩好则其它两科成绩往往也好,反之亦然。,例:彩灯原理 (,run program,),29,隐结构分析工具,例:彩灯原理,30,隐结构分析工具,HLC,模型研究,Zhang (AAAI 02, JMLR 04),基本理论问题:,equivalence, regularity, identifiability,基本算法:,DHC (,双重爬山法,),Kocka & Zhang (UAI 02), Zhang & Kocka (JAIR 04), Chen, Kocka & Zhang (IJAR 04),模型有效复杂度,Zhang & Kocka (ICTAI 04),算法:,HSHC (,启发式单重爬山法,),Zhang, Nielsen & Jensen (AIMED 04),Hierarchical Nave Bayes model:,分类,Chen, Wang, Zhang,研究更快算法,31,提纲,问题与背景,新方法,基本思想,隐结构分析工具,新方法的可行性,肾虚数据及其分析,结果的意义,总结与展望,致谢,32,肾虚数据,症状变量选择,67,个:,国家证候诊疗标准,和 中医诊断学教材,反映了肾脏各个方面的生理功能和病理变化,33,肾虚数据,症状轻重程度判别标准:,严石林,王米渠,等,.,肾虚证辨证因子等级评判操作标准的研究,J,成都中医药大学学报,,2001,,,24(1),34,肾虚数据,样本空间:,60,岁或以上的老年人,35,36,肾虚数据,37,肾虚数据分析,算法,HSHC,:,Zhang & Kocka (2004),暂时无法处理所有,67,个变量,选择,35,个来进行分析,2.4GHz,奔腾,IV,98.5,小,38,分析结果:模型,M,*,之结构,39,提纲,问题与背景,新方法,基本思想,隐结构分析工具,新方法的可行性,肾虚数据及其分析,结果的意义,总结与展望,致谢,40,结果的意义,模型,M,*,有何用途?,用它来指导辨证,建立辨证标准。,三个问题:,怎样用,M,*,来指导辨证?,用,M,*,来指导辨证的意义何在?,辨证质量是否有保证?,41,结果的意义,怎样用,M,*,来指导辨证?,模型辨证,给定:症状变量的取值,可以计算隐变量的后验概率分布。,问题:,M,*,中的隐变量是否对应证候?,对应哪些证候?,42,结果的意义,模型辨证的意义何在?,提高辨证的客观性,推理过程的客观性,模型,M,*,的内容的客观性,数据只包含症状显变量的取值,不包含对证候隐变量的主观判断。,上述第,2,点与回归分析不同,43,结果的意义,模型辨证质量是否有保证?,无金标准可比较,只能与专家辨证比较,出发点相同:症状,推理的基础的比较,M,*,的内容与辨证理论,推理的结果,案例分析,44,模型质量,在定性层面,M,*,与辨证理论吻合,在定量层面, M,*,与辨证理论吻合,在辨证结果方面,模型辨专家组辨证实质上一致。,45,M,*,与辨证理论在定性层面的比较,这里,M,*,说:,有一个隐变量,h1,,,接影响,畏寒怕冷,、,四肢冷,、,腰背冷,间接地通过隐变量,h2,影响,便稀,、,完谷不化,这与中医理论是否吻合?,隐变量和,h1,和,h2,的意义是什么?,46,M,*,与辨证理论在定性层面的比较,中医理论认为,,肾藏元阳内寓命火,既可温煦脏腑经络、推动激发脏腑功能活动,又能温肢体暖周身。,当,肾阳不足失温煦,时则可见,畏寒,肢冷,、,腰背怕冷,。,同时,肾阳虚衰火不温脾土,,则可见,完谷不化,,,便稀,。,在这个局部,M*,与中医理论完全吻合,h1,可解释为“肾阳虚失温煦程度”,h2,可解释为“火不温脾土程度”,47,M,*,与辨证理论在定性层面的比较,这里,M*,说:,有隐变量,h4,,,直接影响,小便余沥,、,夜尿频多,、,昼尿次多,同时又通过隐变量,h5,间接影响昼,小便失禁,和,夜遗尿,这与中医理论是否吻合?,隐变量和,h4,和,h5,的意义是什么?,48,M,*,与辨证理论在定性层面的比较,中医理论认为,,膀胱为洲渎之官,它的气化约束作用控制着小便开合排泄。,当膀胱气化失司,,约束失职关门不利,,则可见,小便余沥不尽,、,夜尿频多,、,昼尿次多,。,当气化约束,失职较重,关门不能,则可使尿失禁固,而见,夜遗尿,、,昼小便失禁,。,这一局部,,M*,与中医理论基本吻合,h4,可解释为“膀胱失约程度”,,h5,可解释为“尿失禁固程度”。,49,其它部分也基本吻合,肾阳虚失温煦,肾阳虚水泛,肾精亏虚,肾阴虚,肾阴虚内热,肾阴虚伤津,膀胱失约,50,M,*,与辨证理论在定性层面的比较,中医辨证理论,是人脑为了解释在众多病人的症状中所呈现的规律而引进的一个隐结构,,学者们为证明它的科学性做了很多努力,但没有成功。,我们,从关于肾虚症状在人群众中的分布的数据出发,,按照统计学原则,利用电脑获得一个隐结构模型,,发现它与肾虚辨证理论基本吻合。,这就为即肾虚辨证理论,的科学性提供了客观的、统计学的证据,因此对中医辨证理论本身有重要意义。,51,不一致的地方,例:,中医理论中,,阴虚和精亏都可以导致失眠和头晕,,在,M*,中,失眠和头晕,只与,h10(,阴虚,),相连,不与,h8(,精亏,),相连,源自,HLC,模型的限制,一个显变量只能与一个隐变量相连。,肾精亏虚,肾阴虚,52,模型质量,在定性层面,M,*,与辨证理论吻合,在定量层面, M,*,与辨证理论吻合,在辨证结果方面,模型辨专家组辨证实质上一致。,53,M,*,与辨证理论在定量层面的比较,M*,的定量内容,隐变量取值个数,:,h2 :s0, s1, s2,按,火不温脾土程度,把样本聚为,3,类,变量之间的定量关系,:,类概率,P(v0|h2=s0), P(v1|h2=s0),P(v0|h2=s1), P(v1|h2=s1),P(v0|h2=s2), P(v1|h2=s2),54,M,*,与辨证理论在定量层面的比较,中医理论关于量的内容,症状对证候的正单调依赖关系,证候越重,症状越多、越重,症状出现相对易难关系,中医认为,便稀泻泄,多由中焦水谷不分、清浊不别而为之,,完谷不化,则多有下焦肾虚、命门火衰水谷不得腐熟蒸化而成,,故前者比后者更易见,。,55,M,*,与辨证理论在定量层面的比较,吻合,便稀,和,完谷不化,正单调依赖,肾阳虚火不温脾土,如果排序:,s0 s1 s2,则吻合,隐变量取值诠释:为便于使用,不对应人们心目中的程度,s0 ,无,; s1,中,; s2,重,.,便稀,比,完谷不化,更易见,56,M,*,与辨证理论在定量层面的比较,例,2,:,心慌心跳,、,五心烦热,、,身潮热,正单调依赖,肾阴虚阳亢程度,(h11),.,如果排序:,s0 s1 s2,则吻合,隐变量取值诠释:,s0 ,轻,; s1,中,; s2,重,.,57,M,*,与辨证理论在定量层面的比较,脉细数,(v28),脉细数,是,脉细,加,脉数,;,当,肾,阴虚阳亢程度,在低水平增强时,,脉细,和,脉数,出现的概率都会增加;,但是,当,肾,阴虚阳亢,增强到一定程度以后,脉象主要表现为,细弱无力,,而,数,反而不明显, 于是,脉细,和,脉数,同时出现的概率反而降低,58,例,3,:,h4(,膀胱失约程度,),s0 s1, s2 s3,诠释:,s0 ,轻,; s3,重,.,s1 ,中,A:,症状多而轻,s2 ,中,B:,症状少而重,M,*,与辨证理论在定量层面的比较,59,例,3,:,症状出现相对易难关系,中医学认为当肾气亏虚,膀胱气化失司,失去约束固摄功能,,轻则,夜尿频多,、,小便余沥不尽,,,重则,昼小便失禁,、,夜遗尿,。,M,*,与辨证理论在定量层面的比较,60,模型质量,在定性层面,M,*,与辨证理论吻合,在定量层面, M,*,与辨证理论吻合,在辨证结果方面,模型辨专家组辨证实质上一致。,61,模型辩证结果与专家组辨证结果的比较,案例分析,选择一些病例,请多位专家对每份病例进行证侯分析、给出辨证结果;,然后对收集到的专家意见进行分析,找出其实质内容;,最后把这些内容与模型辨证的结果进行比较。,62,案例,病例,1,的特点:症状多,阳虚症状、阴虚 症状都有,63,病例,2,:基本没有阳虚症状;,病例,3,:中基本没有阴虚症状;,病例,4,:症状为数不多,阳虚、阴虚症状基本上都没有,这,4,个病例已经具有很好的代表性。,64,病例,1,的专家辨证情况,65,专家辨证的特点,两位专家在证侯分析中提及的病理因子相似,专家甲,肾虚腰膝失养,(,肾虚机能活动减退,则腰膝酸困),,肾阳虚火不温土,(,火不生土,脾失健运,),,,肾阳虚失温煦,(,肾阳亏虚,不能温煦肌肤,),,,肾气虚膀胱失约,肾精不足,(,机能活动减退,则耳鸣、精神不振,),肾阴虚津亏,(,肾津不足,则口渴喜饮,),。,专家丙,肾虚腰膝失养,(,肾精亏虚,不能主骨生髓,可见腰膝酸困,),,,肾阳虚火不温土,(,肾阳亏虚,脾失温煦,),,,肾阳虚失温煦,(,肾阳亏虚,虚寒内生,),,,肾阳虚水泛,(,肾阳亏虚,水液不化,),,,肾精不足,(,肾精亏虚,),肾阴虚失滋养,(,肾阴亏虚,心失滋养,),,,肾阴虚津亏,(,肾阴亏虚,化源不足,),。,66,专家辨证的特点,辨证结果明显不同,专家甲,主证,:,肾气不固证,(,中度,),,,肾阳虚证,(,中度,),;兼证:,肾精不足,(,轻度,),专家丙,主证,:,肾阳虚证,(,中度,),;兼证:,肾阴虚证,(,轻度,),。,反映不同的治疗取向,专家丙,会着重温补肾阳,兼适当地滋肾阴 。,专家甲,虽然会同专家丙一样用温补肾阳之药,但他认为首先要解决的是肾气不固,用药可能会以固摄药物为主,辅以适当温阳和滋阴之品。,专家辨证结果已经加入了论治考虑。,67,模型辨证,模型辨证应与专家证侯分析进行比较,68,模型辩证结果与专家组辨证结果的比较,内容性质,模型辨证:证侯隐变量的验后概率分布,专家证侯分析的实质内容:一组在病人身上出现的证侯,比较基础:,如果两者吻合,那么,模型辩证,:若,证侯,A,出现的概率或,/,及程度,大于,证侯,B,出现的概率或,/,及程度,,专家证侯分析,:则,证侯,A,被选择的可能性,大于,证侯,B,被选择的可能性,如果有众多专家,,那么选择,A,的人就会比选择,B,的人多,。,69,模型辩证结果与专家组辨证结果的比较,70,模型辩证结果与专家组辨证结果的比较,71,结果的意义,模型辨证的质量是否有保证?,与专家辨证比较,出发点相同:症状,推理的基础的,吻合,M*,的内容与辨证理论,推理的结果,吻合,案例分析,辨证质量是,有保证,!,72,提纲,问题与背景,新方法,基本思想,隐结构分析工具,新方法的可行性,肾虚数据及其分析,结果的意义,总结与展望,致谢,73,总结,提出一种研究证的新方法:,隐结构法,目的:,为中医辨证提供统计学基础,从而建立起客观的、定量的标准。,基本步骤:,对症状在自然人群中的分布情况作流行病学调查,,利用电脑按照统计学原则对数据进行分析、建立隐结构模型,,最后用所得的隐结构模型指导辨证,建立起可客观辨证标准。,74,新方法的特点,基于:通过望、问、闻、切传统手段所获得的病情资料,不像证实质研究那样需要引用实验室指标,,也不像回归,/,判别分析那样需要依赖专家做出的关于证型的主观判断。,新方法保存了中医特色,.,75,核心思想,/,一个中心、两个基本点,基本点,1,辨证:基于症状,将病人分类,。,客观定量化方法:聚类分析,流调数据中是否,客观存在,相应的类?,基本点,2,辨证:从,不同角度,将病人分类:肾气不固,肾阳虚,肾精不足,。,简单聚类不足够:需要多维聚类,需要隐结构。,一个中心,中医理论:人脑基于经验构建的隐结构。,新方法:用电脑分析流调数据,构建的隐结构。,76,总结,隐结构法的可行性,,我们用,HLC,模型对老年人群中的肾虚辨证进行了研究,所得到的模型在定性、定量层面都与肾虚辨证理论基本吻合,,而且,案例分析显示,用它来指导辨证所得的结论与几位专家的集体意见实质上一致,77,展望,两个主要方向,用隐结构法研究中医辨证,各个不同领域,不同人群,关于隐结构分析工具的研究,更快算法,其它隐结构模型,78,提纲,问题与背景,新方法,基本思想,隐结构分析工具,新方法的可行性,肾虚数据及其分析,结果的意义,总结与展望,致谢,79,致谢,探索及数据收集阶段,(2000-01),杨维益:,中医证研究的现状及其面临的问题,形成了用聚类方法来研究证的想法,王米渠:,建议:在肾虚辨证的范围类探索可行性,数据收集:,王米渠、严石林、吴斌,燕平、李琳荣,使用了严石林、王米渠等提出的肾虚辨证因子评判标准,80,致谢,数据分析工具研发阶段,(2001-03,),01/02: Visit Aalborg University,Finn Jensen, Tomas Kocka, Thomas Nielsen,数据分析及结果诠释阶段,(2003-04),肾虚数据分析,: 2003,年夏,思想突破,:,核心概念不是聚类,而是隐结构,最后的一年半,:,隐结构模型与中医理论、 模型辨证与专家辨证比较,吴子明、王淑恒、王天芳、扬毅玲、李洪娟、于景玲、章洪流、赵辛、原明忠、毕焕英、段建忠、燕平、邹本贵、李琳荣、张晓雪、师健、严石林、吴斌、谭从娥、陆明等,81,
展开阅读全文