第八章--特征选择与特征提取课件

资源描述

模模式式识别Pattern Classification模式识别Pattern Classification第八章第八章:特征特征选择与特征提取与特征提取第八章:特征选择与特征提取引言引言特征是决定样本之间的相似性和分类器设计的关键如何找到合适的特征是模式识别的核心问题在实际问题中,常常不容易找到那些最重要的特征或者受条件限制不能对它们进行测量,这使得特征选择和提取的任务复杂化特征选择成为构造模式识别系统、提高决策精度的最困难的任务之一.3引言特征是决定样本之间的相似性和分类器设计的关键.3引言引言模式三大基本特征：物理、结构和数字特征物理和结构特征：易于为人的直觉感知，但有时难于定量描述，因而不易用于机器判别数字特征：易于用机器定量描述和判别，如基于统计的特征.4引言模式三大基本特征：物理、结构和数字特征.4引言引言一般情况下普遍认为，增加特征向量的维数（增加特征数）将有助于提高分类器的质量但实际应用中特征维数却收到多方面因素的约束和限制用较多的特征进行分类器设计，无论从计算的复杂程度还是就分类器性能来看都是不适宜的.5引言一般情况下普遍认为，增加特征向量的维数（增加特征数）将有特征的形成特征形成特征形成(acquisition)：信号采集信号采集原始原始测量量原始特征原始特征实例例数字数字图像中的各像素灰度像中的各像素灰度值人体的各种生理指人体的各种生理指标语音的音音的音调周期、共振峰、声道参数、周期、共振峰、声道参数、频谱.6特征的形成特征形成(acquisition)：.6特征的形成高高维原始特征不利于分原始特征不利于分类器器设计计算量大算量大信息冗余信息冗余.7特征的形成高维原始特征不利于分类器设计.7特征选择与提取分析原始特征的有效性，选出最有代表性的特征是模式识别的关键一步降低特征维数在很多情况下是有效设计分类器的重要课题.8特征选择与提取分析原始特征的有效性，选出最有代表性的特征是模特征选择与提取两类获取有效特征信息、压缩特征空间的方法：特征提取和特征选择基本任务是如何从原始特征中获取最有效的信息.9特征选择与提取两类获取有效特征信息、压缩特征空间的方法：特征特征选择与提取特征选择(selection)从原始特征中挑选出一些最有代表性，分类性能最好的特征特征提取(extraction)通过映射或变换的方法把高维的原始特征变换为低维的新特征，新的特征包含了原有特征的有用信息.10特征选择与提取特征选择(selection).10特征选择与提取目前，还没有特征选择和提取的一般方法，这是由于特征选择一般是面向问题的，很难对这些方法去作评价和比较特征选择与提取是模式识别中重要而困难的一个环节.11特征选择与提取目前，还没有特征选择和提取的一般方法，这是由于特征选择与提取细胞自动识别原始测量正常或异常细胞的数字图像原始特征找到一组代表细胞性质的特征：细胞面积，胞核面积，形状系数，光密度，核内纹理，和浆比原始特征的维数仍很高，需压缩以便于分类！.12特征选择与提取细胞自动识别.12特征选择与提取细胞自动识别特征选择挑选最有分类信息的特征特征提取数学变换：傅立叶变换或小波变换、特征压缩.13特征选择与提取细胞自动识别.13特征特征选择特征选择的任务是从一组数量为D的特征中选择出数量为d(D d)的一组最优特征各个特征之间存在复杂的相互关系如果仅对每个单独的特征按照一定的统计进行排队,取排在前面的d个特征所得结果在大多数情况下不是最优特征组.14特征选择特征选择的任务是从一组数量为D的特征中选择出数量为d特征特征选择从D个特征中选择出d个最优的特征,在这两个参数都已知的状况下,所有可能的组合数为如果D=100，d=10，则的Q数量级是1013.15特征选择从D个特征中选择出d个最优的特征,在这两个参数都已特征特征选择在实际问题的研究过程当中，D的维数往往远远高于100例如,在利用生物芯片来进行药物设计和癌症诊断时,其产生的有效特征维数往往在10000左右实际需要选取的优化特征组的特征数量是未知的寻找可行的特征选择算法已逐渐成为国际上研究的热点.16特征选择在实际问题的研究过程当中，D的维数往往远远高于100特征特征选择一般来看，特征选择（确定优化的特征子集）需要两个主要步骤确定评价准则来评价所选择的特征子集的性能确定进行特征搜索所需要的策略.17特征选择一般来看，特征选择（确定优化的特征子集）需要两个主要特征特征选择按搜索策略划分的特征选择算法全局最优搜索策略 “分支定界”算法：该方法能保证在事先确定优化特征子集中特征数目的情况下,找到相对于所设计的可分性判据而言的最优特征子集。如何事先确定优化特征子集当中特征的数目？当处理高维度多类问题时，算法运算效率低下.18特征选择按搜索策略划分的特征选择算法.18特征特征选择按搜索策略划分的特征选择算法随机搜索策略将特征选择视为组合优化问题，采用非全局最优搜索方法把特征选择问题和模拟退火算法、禁忌搜索算法、遗传算法、或随机重采样过程结合,以概率推理和采样过程作为算法基础遗传算法在这一领域的应用最为广泛.19特征选择按搜索策略划分的特征选择算法.19特征特征选择按搜索策略划分的特征选择算法启发式搜索策略单独最优特征组合算法序列前向选择算法序列后向选择算法浮动搜索算法.20特征选择按搜索策略划分的特征选择算法.20特征特征选择特征选择的原则选择反映模式本质特性的参数作为特征使样本类间距离较大、类内距离较小与类别信息不相关的变换（平移、旋转、尺度变换）具有不变性尽量选择相关性小的特征尽可能不受噪声的干扰.21特征选择特征选择的原则.21基于主成份的特征提取：K-L变换K-L变换(Karhunen-Loeve Transform,卡洛南-洛伊变换)是将高维特征向量映射为低维特征向量的有效方法目的：提取出空间原始数据的主要特征(主元或主成份)，减少数据冗余，使得数据在一个低维的特征空间被处理，同时保持原始数据的绝大部份有用信息，从而解决数据维度过高的瓶颈问题。.22基于主成份的特征提取：K-L变换K-L变换(Karhunen方法：将维特征向量，通过特征变换得到另一维特征向量特征向量，使得与原向量的均方误差最小.23方法：.23K-L变换设为维特征向量，即：现在维特征空间中选取一组新的正交基底向量即：.24K-L变换设为维特征向量，即：.24K-L变换将在该基底向量上进行投影得到新向量，即则向量可表示为：.25K-L变换将在该基底向量上进行投影得到新向量，即K-L变换X原空原空间Y新空新空间y1y2x1x2.26K-L变换X原空间Y新空间y1y2x1x2.26K-L变换可见不同的基底向量，将投影后可产生不同的向量现要寻求一组有效的基底向量，实现特征压缩的目的.27K-L变换可见不同的基底向量，将 K-L变换考虑：.28K-L变换考虑：.28K-L变换将中以后各项用常数代替得：.29K-L变换将中以后各项用常数代K-L变换定义误差向量.30K-L变换.30K-L变换X原空原空间y新空新空间yX.31K-L变换X原空间y新空间yX.31K-L变换则平方误差为.32K-L变换则平方误差为.32K-L变换由于则有.33K-L变换由于.33K-L变换若现有一批样本，则均方误差为：可见，均方误差与基底向量和有关.34K-L变换若现有一批样本，则均方误差为：.34K-L变换如何选择和，使得均方误差最小？为什么要这样做？.35K-L变换如何选择和，使得均方误差 K-L变换首先考虑若确定，如何选择？令即.36K-L变换首先考虑若确定，如何选择？.36K-L变换则有.37K-L变换则有.37K-L变换再考虑当用最佳值代替后，如何确定？.38K-L变换再考虑当用最佳值代替后，K-L变换确定后，均方误差.39K-L变换确定后，均方误差.39K-L变换即：协方差矩方差矩阵经典数学典数学问题.40K-L变换即：协方差矩阵经典数学问题.40K-L变换结论：使均方误差最小的基底向量，即是协方差矩阵的本征向量如何求本征向量？.41K-L变换结论：.41K-L变换本征值协方差矩阵的本征值，即满足的值共有i 个本征值单位矩位矩阵.42K-L变换本征值单位矩阵.42K-L变换本征向量满足方程的向量共有i 个本征向量.43K-L变换本征向量.43K-L变换当为协方差矩阵的本征向量时，均方误差可见应保留本征值较大的本征向量为基底向量！为什么？.44K-L变换当为协方差矩阵的本征向K-L变换总结：将压缩到将产生误差压缩维数越多将越大，即丢失的信息越多。.45K-L变换总结：.45K-L变换为了有效减少，应在压缩时，保留本征较大的本征向量为基底向量，即排序而选择本征值较大的m个本征向量为基底向量压缩后的特征向量为.46K-L变换为了有效减少，应在压缩时，保留本征较大的本K-L变换而称为X的m个主成份.47K-L变换而.47K-L变换K-L变换进行特征维数压缩的过程：获取一批学习样本计算其均值计算其协方差矩阵计算协方差矩阵的n个本征值.48K-L变换K-L变换进行特征维数压缩的过程：.48K-L变换将由大到小排序值为计算本征值对应的本征向量，即根据具体要求将特征向量降为m维向量.49K-L变换将由大到小排序值为.49K-L变换例：设已知样本的特征向量为：试用K-L变换将X压缩为一维的4个样本，并求出均方误差 .50K-L变换例：设已知样本的特征向量为：.50K-L变换X2X3X4X1.51K-L变换X2X3X4X1.51K-L变换解：求出样本均值（期望值）.52K-L变换解：.52K-L变换求协方差矩阵.53K-L变换求协方差矩阵.53K-L变换计算协方差矩阵的本征值即计算解得.54K-L变换计算协方差矩阵的本征值.54K-L变换计算协方差矩阵的本征向量解得：.55K-L变换计算协方差矩阵的本征向量.55K-L变换特征压缩后.56K-L变换特征压缩后.56K-L变换Y3Y4Y1Y2.57K-L变换Y3Y4Y1Y2.57K-L变换均方误差.58K-L变换均方误差.58

展开阅读全文

第八章--特征选择与特征提取课件

最新文档