模糊集与粗糙集的简单入门

资源描述

模糊集与粗糙集的简单入门模糊集与粗糙集的简单入门1. 刖言Zadeh在1965年创立了模糊集理论1,Pawlak在1982年又给出了粗糙集的概念2,模糊集理论和粗糙集理论都是研究信息系统中只是不完全，不确定问题的两种方法，是经典集合论的推广，它们各自具有优点和特点，并且分别在许多领域都有成功的应用，如模式识别、机器学习、决策分析、决策支持、知识获取、知识发现等模糊理论是简历集合的子集边缘的病态定义模型，隶属函数多数是凭经验给出的，带有明显的主观性；粗糙集理论基于集合中对象间的不可分辨行的思想，作为一种刻画不完整想和不确定性的数学工具，它无需任何先验信息，能邮箱分析处理不精确、不完整等不完备信息，对不确定集合的分析方法是客观的两种理论之间有着密切的关系和很强的互补性，同事粗糙集理论和模糊集理论可以进行结合，产生粗糙模糊集理论和模糊粗糙集理论，并且发挥着不同的优势本文在已有的模糊集理论和粗糙集理论的基础之上，分析和总结了模糊集和粗糙集理论，对二者进行了全面的比较.2. 基本概念这部分将集中介绍模糊集和粗糙集的基本概念及其性质2.1模糊集模糊理论34是一种用以数学模型来描述语意式的模糊信息的方法模糊概念也是没有明确外延的概念.根据普通集合论的要求，一个对象对应于一个集合,要么属于，要么不属于，二者必居其一；而模糊集则通常用隶属函数表示模糊概念.2.1.1模糊集合的基本定义定义1设X是有限非空集合，称为论域，X上的模糊集A用隶属函数表示如下：A: X 0,1, x A(x)其中A(x)表示元素x隶属于模糊集合A的程度,记X上的模糊集合全体为F(X).模糊集合的数学表示方式为A =( x, A(x) | x X, where A(x) 0,12.1.2模糊集合的运算设代B为X上的两个模糊集，它们的并集，交集和余集都是模糊集，且其隶属函数分别定义为A B = max A(x), B(x) - x XA B 二 min A(x), B(x) x X_A =1 _ A2.1.3模糊集合的关系模糊集合之间关系的表示方式,是以集合所存在的隶属函数A(x), B(x)作为集合之间的关系表示的.(1) 模糊集合之间的相等：rwnrrvA = B= A(x)二 B(x) x X(2) 模糊集合之间的包含：A B= A(x)乞 B(x) x X2.1.4截集与支集定义2 对于 A F(X)和任意 0,1,定义=x A(x) 人A； = x A(x) 人分别为A的截集和A的强截集.特别的,当，=1时,A为A的核；当 =0 时,A为A的支集.表示为如下：core( A) = A =x A(x) =lsupport (A)=兀=x A(x) =0则根据上面截集的概念，模糊子集通过截集就变成了普通集合.截集就是将模糊集合转化为普通集合的方法，截集的概念是联系模糊集合与普通集合之间的桥梁.2.2粗糙集2.2.1粗糙集合的基本定义(1) 粗糙集合提出的背景由于经典逻辑只有真假二值之分，而在现实生活中存在许多含糊的现象，并不能简单的用真假值来表示.于是，在1904年,谓词逻辑的创始人G.frege提出了含糊(vague) 一词，他把含糊现象归结到边界线上.1965年丄.A. Zadeh 提出Fuzzy Sets 的概念，试图通过这一理论解决 G.frege的含糊概念.Zadeh的FS方法是利用隶属函数描述边界上的不确定对象.1982年，波兰华沙理工大学乙Pawlak教授针对G. frege的边界线区域思想提出了 Rough Sets理论.Pawlak的RS方法：把无法确认的个体都归属于边界区域,把边界区域定义为上近似集和下近似集的差集.(2) 粗糙集合的定义粗糙集理论特点是不需要预先给定默写特征或属性的数量描述，直接从给定的问题的描述集合出发，通过不可分辨关系和不可分辨类确定给定问题的近似域找出问题内在规律定义2设K =(X,A,V, f)是一个知识库,其中X是一个非空集合,称为论域.A=C D是属性的非空有限集合，C为D的决策属性，C D-：，Va是属性 a A的值域，f : X A V是一个信息函数,它为每个对象赋予一个信息值定义3设X是一个有限的非空论域，R为X上的等价关系,等价关系R把集合X划分为多个互不相交的子集，每个子集称为一个等价类，用xr来表示，xr二yX xRy,其中xX ,称x,y为关于R的等价关系或者不可分辨关系.论域X上的所有等价类的集合用X / R来表示.2.2.2上、下近似集,粗糙度(1) 上下近似集的定义定义4对于任意的丫 X,Y的R上、下近似集分别定义为R(Y) = Z X / R|Z 丫 =门R(Y)二Z X / R| Z Y集合posR(Y)称为集合丫的正域，posR(Y) =R(Y);集合negR(Y) = X -貝X) 称为集合Y的负域；集合bnR(Y)二R(Y) -R(Y)称为Y的R边界域.集合的不确定性是由于边界域的存在，集合的边界域越大，精确性越低,粗糙度越大.当R(Y)=R(Y)时，称Y为R的精确集；当R(Y)=R(Y)时，称Y为R的粗糙集, 粗糙集可以近似使用精确集的两个上下近似集来描述.(2) 粗糙度粗糙度是表示知识的不完全程度，由等价关系R定义的集合X的粗糙度为：门|rx|：r(X)十一RX其中X学,X表示集合X的基数.3研究对象、应用领域及研究方法3.1模糊集的研究对象、应用领域及研究方法(1) 模糊集的研究对象模糊集研究不确定性问题，主要着眼于知识的模糊性，强调的是集合边界的不分明性(2) 模糊集的应用领域模糊集理论广泛应用与现代社会与生活中，主要有以下几个方面：消费电子产品、工业控制器、语音辨识、影像处理、机器人、决策分析、数据探勘、数学规划以及软件工程等等(3) 研究方法模糊集理论的计算方法是知识的表达和简化.从知识的“粒度”的描述上来看,模糊集是通过计算对象关于集合的隶属程度来近似描述不确定性；从集合的关系来看,模糊集强调的是集合边界上的病态定义，也即集合边界的不分明性；从研究的对象来看，模糊集研究属于同一类的不同对象间的隶属关系，强调隶属程度；从隶属函数来看，模糊集的隶属函数反映了概念的模糊性，而且模糊集的隶属函数大多是专家凭经验给出的，带有强烈的主观意志.3.2粗糙集的研究对象、应用领域及研究方法(1) 粗糙集的研究对象6粗糙集理论研究不确定性问题，基于集合中对象间的不可分辨性思想，建立集合的子集边缘的病态定义模型(2) 粗糙集的应用领域粗糙集理论在近些年得到飞速发展，在数据挖掘，模式识别,粗糙逻辑方面取得较大进展与粗糙集理论相关的学科主要有以下几方面：人工智能，离散数学, 概率论,模糊集理论，神经网络,计算机控制，专家系统等等7.(3) 粗糙集的研究方法粗糙集理论的研究方法就是对知识的含糊度的一个刻画，其计算方法主要是连续特征函数的产生粗糙集理论研究认知能力产生的集合对象之间的不可分辨性,通过引入一对上下近似集合，用它们的差集来描述不确定的对象从集合的关系来看,粗糙集强调的是对象间的不可分辨性，与集合上的等价关系相联系；从研究的对象来看，粗糙集研究的是不同类对象组成的集合关系，强调分类；从隶属函数来看,粗糙集的粗糙隶属函数的计算是从被分析的数据中直接获得，是客观的8 .4.基本研究内容4.1模糊集理论研究的主要内容模糊集理论研究的内容很广泛，主要包括以下几方面：模糊控制，模糊聚类分析,模糊模式识别，模糊综合评判，模糊集的扩展4.1.1模糊控制自从Zadeh发展出模糊集理论之后，对于不明确系统的控制有极大的贡献，自七十年代以后，便有一些实用的模糊控制器相继的完成，使得我们在控制领域中又向前迈进了一大步，在此将对模糊控制理论做一番浅介6.模糊控制利用模糊集理论的基本思想和理论的控制方法在传统的控制领域里，控制系统动态模式的精确与否是影响控制优劣的最主要关键，系统动态的信息越详细,则越能达到精确控制的目的然而,对于复杂的系统，由于变量太多，往往难以正确的描述系统的动态，于是工程师便利用各种方法来简化系统动态，以达成控制的目的，但却不尽理想.换言之，传统的控制理论对于明确系统有强而有力的控制能力，但对于过于复杂或难以精确描述的系统，则显得无能为力了 .所以,模糊集理论便被用来处理这些控制问题.4.1.2模糊聚类分析模糊聚类分析的研究是基于模糊等价关系和以及模糊分类上的4.主要有以下的定理以及定义.定理1令R是一个模糊等价关系,并且0 ： : -1,则对- y X有y=yR：.定义5设数据集X二X1,X2，,Xn,且A1,A2,，Ac是其一个分类,若该分类满足以下条件：对- k ,存在i使得Xk三A ；(2) 对所以i均有A =门;则称该分类是X的一个模糊划分.基于上面的理论，我们可以用一个划分矩阵D = (dik)cn来刻画数据集的分类其中dik 二0 , XkAD,若其满足以下三个条件：定义6对于上面的矩阵(1) dik ；c dik =1, -k;i ni(3) dik 0, -i ；c-划分矩阵.k 4则称D是X上的一个精确的定义7设c和n时两个给定的正整数若模糊矩阵D = (dik)cn满足以下三个条件：(1) dik0,1；c(2) 二.dik = 1, _ k ;i吕 n(3) 0 ；二 dik : n, -i ;k丝则称D为X上的一个模糊的c-划分矩阵.定义 8 设 X 二X1,X2,XnRm, V 二V1,V2,Vc Rm, D=(dik)cn(CE n)是X上的一个模糊的c-划分矩阵,则c nJ(D,V) 乂乂 dik 卩 M Xk 彳(p R )4 k z!称为模糊划分上的一个聚类准则函数，这里m2丄|x|送(X)2i 7定义9如果对于任意的X =x,x2，,XnRm,存在Vv；,v2,，v；5 Rm以及模糊的c-划分矩阵D*使得J(D,Vi J(D*,V*)对所有的X二X1,X2，Xn Rm以及模糊的c-划分矩阵D都成立，则称D*为最优模糊c-划分矩阵，V*为一个模糊聚类中心.4.1.3模糊模式识别模糊模式识别是利用模糊集理论对行为的识别 .根据识别模式的性质，可以将模式识别分为两类：具体事物的识别，如对文字，音乐,语言等周围事物的识别；抽象事物的识别，如对已知的一个论点或者一个问题的理解等 .下面介绍一些基本的定理及定义.定义10清晰度增强因子：令A F(X)是X上的一个模糊集,定义另外一个2A(x)2 ,1-2(1-A(x)A(x) 0,0.5A(x) (0.5,1模糊集I(A) F(X),其中I (A)(x)称I(A)(x)为清晰度增强因子4.1.4模糊综合评判模糊综合评判是利用模糊集理论对一个事物进行评价.具体的过程为：将评价目标看成是由多种因素组成的模糊集合X,再设定这些因素所能选取的评审等级,组成评语的模糊集合(称为评判集V ),分别求出各单一因素对各个评审等级的归属程度(称为模糊矩阵D),然后根据各个因素在评价目标中的权重分配，通过计算(称为模糊矩阵合成),求出评价的定量解值.定义11设f ：0,1n 0,1满足以下几个条件：(1) 花=X2 二二Xn =X= f(X1,X2,Xn)二 X；(2) Xj兰 Xj二 f (捲，,Xij, X(1),X+ 必)兰 f (洛，,Xi，X(2),Xy , Xn), W ；(3) f(X1,X2/ ,Xn)对每个变量都是连续的；则称f为n-维综合函数.常用的n-维综合函数主要有加权平均函数，几何平均函数，单因素决策函数显著因素准则函数等等.4.2粗糙集理论研究的主要内容粗糙集理论作为一种数据分析处理理论，无论是在理论方面还是在应用实践方面都取得了很大的进展，展示了它光明的前景，因而其研究内容以及领域也是非常广泛的，主要包括以下几方面：变精度粗糙集，集值信息系统，粗糙集理论的应用，支持向量基等.421变精度粗糙集变精度粗糙集模型9是Pawlak粗糙集模型的扩充,它是在基本粗糙集模型的基础上引入了 ( - :：: 0.5),即允许一定的错误分类率存在，这一方面完善了近似空间的概率，另一方面也有利于用粗糙集理论从认为不相关的数据集中发现相关的数据.当然,变精度粗糙集模型的主要任务是解决属性间无函数或不确定关系的数据分类问题.当1 =0时,Pawlak粗糙集模型是变精度粗糙集模型的一个特例.4.2.2集值信息系统集值信息系统是信息系统的一般化模型，在实际应用中信息系统随着对象的变化而不断地动态变化.S = (X ,AT)是信息系统,其中X是对象的非空有限集合,AT是属性的非空有限集合,对于每个AT有a:X Va,其中Va称为a的值域.每个属性子集A AT决定了一个不可区分关系ind(A):ind(A)=(x, y) X X|a代 a(x)二 a(y).关系ind (A)( AT)构成了 X的划分,用X/i nd (A)来表示.对于一个对象，一些属性值可能是缺省的.为了表明这种情况，通常给定一个区分值(即空值null value)给出这些属性定义12如果至少有一个属性aAT使得Va含有空值,则称S是一个不完备信息系统5,否则称它是完备的，我们用*表示空值.设S是一个不完备信息系统，a AT使得Va含有空值*时，并且该空值*的取值为一个集合，该集合的元素是这个属性中其他所有可能值的集合，则S就是集值信息系统.F面是一个不完备信息系统的例子CarPriceMileageSizeMax-Speed1HighHighFullLow2Low*FullLow3*CompactHigh4High*FullHigh5*FullHigh6LowHighFull*423支持向量基支持向量机(Support Vector Machine,SVM)1011 是 Corinna Cortes 和 Vapnik8等于1995年首先提出的.SVM起初是广泛应用在神经信息处理系统 (Neural Information Processing Systems,NIPS),但是，现今,SVM 已经在所有的机器学习研究领域中起着重要作用SVM 是一种学习系统，他利用高维空间中的线性分类器，在这个空间中建立一个最大的间隔超平面，这里的最大是基于最优化理论的.广义的SVM起源于统计学习理论12.5.模糊集与粗糙集的结合由上面的讨论可知，模糊集理论与粗糙集理论各具特点，两种理论有着很强的联系与互补性，因此将两者的特点结合起来形成研究不完全数据集的有效方法.此外,通过模糊聚类和粗糙集两种方法进行属性的对象约简和属性约简，可以使数据得到横向和纵向两个方向上的约简，对象约简是引入了相似性的概念进行模糊聚类的过程，对象约简改变了标准粗糙集模型的不可分辨关系的确定条件由于粗糙集所处理的都是离散数据，所以在数据分析中需要应用模糊聚类或隶属函数离散化，进而应用粗糙集理论属性约简、提取规则.所以结合模糊集、粗糙集理论能够有效地分析数据，提高生成规则的可信性和和合理性，倒出可信的规则集.5.1模糊粗糙集及粗糙模糊集结合模糊集和粗糙集两种理论可以得到模糊粗糙集及粗糙模糊集模型，当知识库中的知识模块是清晰的概念，而被描述的概念是一个模糊的概念，人们建立粗糙模糊集模型来解决此类问题的近似推理；当知识库中的知识模块是模糊知识而被近似的概念是模糊概念时，则需要建立模糊粗糙集模型，也有人将普通关系推广称模糊关系或者模糊划分而获得模糊粗糙集模型定义13设R是X上的一个等价关系,A F(X) , 0,1,模糊集A、A以 fij 及As的上下近似分别为：R(A,)=x X|xr A, *, R(A,)二x X|xr a, sc s .SsR(A )二x X |xr A, -：, R(AJ =x X |xr A, R(A)二x X |xr A：，, R(A)二x X|xrA可以验证，当A是X上的经典集合时，上面所介绍的上下近似就是 Pawlak意义下的上下近似.定义14设R是X上的等价关系，A是X的一个模糊集合，A- F(X),则A 关于R的上下近似分别定义如下：Ar(x) =supA(y) | y xr,企(x) =inf A(y)|y xr可以看出，模糊集A F(X)关于等价关系R的上下近似仍为模糊集合，若Ar = Ar ,则称A是可定义的，否则称A是粗糙集，称A是A关于近似空间(X , R) 的正域，称 AR是A关于(X , R)的负域，称AR ( Ar)为A的边界 Ar可以理解为对象X肯定属于模糊集A的隶属程度；AR理解为对象x可能属于模糊集A的隶属程度，同样可以验证，当A时X上的经典集合时，就是Pawlak意义下的上下近似在标准粗糙集模型中引入变精度，提高了相对近似精度，而在粗糙模糊集引入变精度,得到新定义：Ar(x) 二supA(y) | y xr A(y) 1 - ：Ar(x)，infA(y)|y xr A(y) 一 J这样下近似集合中元素隶属度降低，而上近似的隶属度提高，提高了相对精度5.2粗糙隶属函数粗糙隶属函数式借助模糊理论来研究粗糙集理论的方法，通过粗糙隶属度函数可以将粗糙集理论与模糊集理论联系起来，建立一种粗糙集理论与模糊集理论的关系,并得到一些性质.定义15设R是论域X上的一个相似关系，若A是X上的一个模糊集合，则 A关于R的一个下近似R(A)和上近似R(A)分别定义为X上的一个模糊集合，称为粗糙隶属度函数，定义为A(x)粗糙隶属函数表示的是一个模糊概念|A xr|般不是Zadeh意义下的隶属函数.粗糙隶属函数A(x)表示的是x的等价类xr隶属于A的程度.由定义14和定义15可以得到：模糊集A的下近似且关于等价关系R的等价类隶属于A的程度为1;模糊集A的上近似且关于等价关系R的等价类隶属于A 的程度为大于0小于1,因此有：性质 1 Core(A)二 & =x| A(x) =1,x X/R二RAssupport(A) =A0 =x| A(x)0,x e X / RbnR(A)二Ra RA 二x|0 ： A(x) ：1,x X / RnegR(A) =X Ra=x| A(x) =0,x X / R性质 2 y xr 二 A(x)二 A(y)xrA= A(x) =1xr A - 一A(x) = 0xr 二 A a nd xR二 A(x) (0,1)6总结本文系统的介绍了模糊集理论与粗糙集理论，二者研究的主要内容，以及二者的结合的相关理论是对本学期所学的模糊计算和粗糙计算的一个简单的小结，也是我本人对该学科的一个简单的入门15模糊集与粗糙集的简单入门参考文献1 L.A.Zadeh, Fuzzy setsJ, I nformation and Con trol, 1965,8:338-353.2 Pawlak Z, Rough setsJ, I ntern ati onal Jour nal of Computer andIn formation scie nee, 1982,1(11):341-356.3 胡宝清,模糊理论基础，武汉:武汉大学出版社,2010.4 张文修,模糊数学基础，西安:西安交通大学出版社，1984. 张文修,粗糙集理论与方法，北京:科学出版社,20016 http:/baike.baidu.eom/view/87377.htm7 K. Y. Cha n, C.K. Kwo ng, B.Q. Hu, Market segme ntation and ideal poi ntidentificationfor newproduet design using fuzzy data eompression andfuzzy clusteri ng methodsJ, Applied Soft Computi ng, 2012,12,1371-1378.8 Z.Pawlak, Rough sets and fuzzy sets J,Fuzzy sets and Systems,1985,17,99-102.9 Beynon M.Reducts within the variable precision rough sets model: afurther investigationJ, European Journal of Operational Research, 2001,134:592-605.10 邓乃扬，田英杰，数据挖掘中的新方法：支持向量基，北京：科学出版社,2004.11 邓乃扬，田英杰，支持向量基-理论、算法与拓展，北京：科学出版社,2009.12 V.Vap nik, Statistical Learni ng Theory, Joh n Wiley & Son s, 1998.16

展开阅读全文

模糊集与粗糙集的简单入门

最新文档