非参数回归的介绍ppt课件

返回 举报
资源描述
我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1参数回归与非参数回归的优缺点比较:参数回归与非参数回归的优缺点比较:参数回归:参数回归:非参数回归:非参数回归:优点:优点:(1).(1).模型形式简单明确,仅由一些参数表达模型形式简单明确,仅由一些参数表达 (2).(2).在经济中,模型的参数具有一般都具有明确的经济含义在经济中,模型的参数具有一般都具有明确的经济含义 (3).(3).当模型参数假设成立,统计推断的精度较高,能经受实际检验当模型参数假设成立,统计推断的精度较高,能经受实际检验 (4).(4).模型能够进行外推运算模型能够进行外推运算 (5).(5).模型可以用于小样本的统计推断模型可以用于小样本的统计推断缺点:缺点:(1).(1).回归函数的形式预先假定回归函数的形式预先假定 (2).(2).模型限制较多:一般要求样本满足某种分布要求,随机误差满足模型限制较多:一般要求样本满足某种分布要求,随机误差满足 正态假设,解释变量间独立,解释变量与随机误差不相关,等正态假设,解释变量间独立,解释变量与随机误差不相关,等 (3)(3)需要对模型的参数进行严格的检验推断,步骤较多需要对模型的参数进行严格的检验推断,步骤较多 (4).(4).模型泛化能力弱,缺乏稳健性,当模型假设不成立,拟合效果模型泛化能力弱,缺乏稳健性,当模型假设不成立,拟合效果 不好,需要修正或者甚至更换模型不好,需要修正或者甚至更换模型优点;优点;(1)(1)回归函数形式自由,受约束少,对数据的分布一般不做任何要求回归函数形式自由,受约束少,对数据的分布一般不做任何要求 (2)(2)适应能力强,稳健性高,回归模型完全由数据驱动适应能力强,稳健性高,回归模型完全由数据驱动 (3)(3)模型的精度高模型的精度高 ;(4);(4)对于非线性、非齐次问题,有非常好的效果对于非线性、非齐次问题,有非常好的效果缺点缺点:(1)(1)不能进行外推运算不能进行外推运算,(2),(2)估计的收敛速度慢估计的收敛速度慢 (3)(3)一般只有在大样本的情况下才能得到很好的效果,一般只有在大样本的情况下才能得到很好的效果,而小样本的效果较差而小样本的效果较差 (4)(4)高维诅咒高维诅咒,光滑参数的选取一般较复杂光滑参数的选取一般较复杂我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2非参数回归方法样条光滑样条光滑正交回归正交回归核回归:核回归:N-WN-W估计、估计、P-CP-C估计、估计、G-MG-M估计估计局部多项式回归:线性、多项式局部多项式回归:线性、多项式 光滑样条:光滑样条、光滑样条:光滑样条、B B样条样条近邻回归:近邻回归:k-NNk-NN、k k近邻核、对称近邻近邻核、对称近邻正交级数光滑正交级数光滑稳健回归:稳健回归:LOWESSLOWESS、L L光滑、光滑、R R光滑、光滑、M M光滑光滑局部回归局部回归FourierFourier级数光滑级数光滑waveletwavelet光滑光滑处理高维的非参数方法:多元局部回归、薄片样条、处理高维的非参数方法:多元局部回归、薄片样条、可加模型、投影寻踪、可加模型、投影寻踪、回归树、张量积,等回归树、张量积,等我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物3核函数核函数K K:函数:函数K(.)K(.)满足满足:()0K x 22()Kx Kx dx()0 xKx dx()1Kx dx(2)(3)(4)2()KcKxdx 常见的核函数:常见的核函数:BoxcarBoxcar核:核:(1)GaussianGaussian核:核:EpanechnikovEpanechnikov核:核:tricubetricube核:核:()1/2()K xI x2/2()1/2xK xe2()3/4(1)()K xxI x3 3()70/81(1|)()K xxI x()I x为示性函数为示性函数我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物4回归模型:回归模型:()Ymx20,()EVar(1)(1)模型为随机设计模型模型为随机设计模型,样本观测样本观测 (X i,Yi)iid(X i,Yi)iid(2)(2)模型为固定设计模型模型为固定设计模型Xi 为为R中中n个试验点列个试验点列,i=1,2,n()(|)m xE YXxYi为固定为固定Xi的的n次独立观测,次独立观测,i=1,2,nm(x)为为一未知函数,用一些方法来拟合为为一未知函数,用一些方法来拟合定义:线性光滑器定义:线性光滑器(linear smoother)(linear smoother)()()iiim xlx Y我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物5光滑参数的选取光滑参数的选取风险风险(均方误差均方误差)(mean squared error,MSE)(mean squared error,MSE)211()()()nhiiiR hEmxm xn 理想的情况是希望选择合适的光滑参数理想的情况是希望选择合适的光滑参数h,使得通过样本数,使得通过样本数据拟合的回归曲线能够最好的逼近真实的回归曲线据拟合的回归曲线能够最好的逼近真实的回归曲线(即达到风险即达到风险最小最小),这里真实回归函数,这里真实回归函数m(x)一般一般是未知的。是未知的。可能会想到用平均残差平方和来估计风险可能会想到用平均残差平方和来估计风险R(h)211()nihiiYmxn但是这并不是一个好的估计,会导致过拟合(欠光滑),但是这并不是一个好的估计,会导致过拟合(欠光滑),原因在于两次利用了数据,一次估计函数,一次估计风险。原因在于两次利用了数据,一次估计函数,一次估计风险。我们选择的函数估计就是使得残差平方和达到最小,因此我们选择的函数估计就是使得残差平方和达到最小,因此它倾向于低估了风险。它倾向于低估了风险。是是 的估计,的估计,h是光滑参数,称为带宽或窗宽是光滑参数,称为带宽或窗宽()hm x()mx我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物6光滑参数光滑参数的选取的选取缺一交叉验证方法缺一交叉验证方法(leave-one-out cross validation,CV)(leave-one-out cross validation,CV)2()11()()nii hiiCVR hYmxn这里这里 是略去第是略去第i个数据点后得到的函数估计个数据点后得到的函数估计()()i hmx交叉验证的直观意义:交叉验证的直观意义:22()(1)()()()()ii hiiiihiE YmxE Ym xm xmx22(1)22(1)22()()()()()()()iiihiihiihiE Ym xE m xmxE m xmxE m xm x2()E R hR预测风险因此:因此:我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物7光滑参数光滑参数的选取的选取定理:若定理:若 那么缺一交叉验证得分那么缺一交叉验证得分 能够写成:能够写成:1()()nhjjjm xx Y()R h21()1()1nihiiiiYmxR hhL这里这里 是光滑矩阵是光滑矩阵L的第的第i个对角线元素个对角线元素()iiiiLx 广义交叉验证广义交叉验证(generalized cross-validation,GCV)(generalized cross-validation,GCV)21()1()1/nihiiYm xGCV hhn其中:其中:为有效自由度为有效自由度11/niiinnL()tr L我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物8光滑参数光滑参数的选取的选取其他标准其他标准(1)(1)直接插入法直接插入法(Direct Plug-In,DPI)(Direct Plug-In,DPI)相关文献可以参考:相关文献可以参考:Wolfgang Hrdle(1994),Applied Nonparametric Regression,Berlin Jeffrey D.Hart(1997),Nonparametric Smoothing and Lack-of-Fit Tests,Springer Series in Statistics 李竹渝、鲁万波、龚金国李竹渝、鲁万波、龚金国(2007),经济、金融计量学中的非,经济、金融计量学中的非参数估计技术,科学出版社,北京参数估计技术,科学出版社,北京 吴喜之译吴喜之译(2008),现代非参数统计,科学出版社,北京,现代非参数统计,科学出版社,北京 (2)(2)罚函数法罚函数法(penalizing function)(penalizing function)(3)(3)单边交叉验证单边交叉验证(One Sided Cross Validation(One Sided Cross Validation,OSCV)OSCV)(4)(4)拇指规则拇指规则(Rule Of Thumb)(Rule Of Thumb)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物91.1.核回归(核光滑)核回归(核光滑)N-WN-W估计是一种简单的加权平均估计,可以写成线性光滑器:估计是一种简单的加权平均估计,可以写成线性光滑器:局部回归局部回归由由Nadaraya(1964)Nadaraya(1964)和和 Watson(1964)Watson(1964)分别提出,分别提出,(1 1)N-WN-W估计估计形式:形式:11()()()nNWhihinihjjKxXmxYKxX,1()()nNWhhiiimxWx Y,1()()()hihinhjjKxXWxKxX()(/)/hKKhh 其中:其中:,为核函数,为核函数,为带宽或窗宽为带宽或窗宽()Kh01x我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物10局部回归局部回归(2 2)P-C-P-C-估计估计由由PriestleyPriestley and Chao(1972)and Chao(1972)提出,形式:提出,形式:11()()(),nPChiiihiimxxxYKxx01x写成线性光滑器的形式:写成线性光滑器的形式:1()()nPChhiiimxWx Y1()()()hiiihiWxxxKxx在随机设计模型下,在随机设计模型下,P-CP-C估计可由估计可由x x的密度估计:的密度估计:11()()iif xn xx推导出来,相关文献可参考推导出来,相关文献可参考h hrdle(1994)rdle(1994)和和李竹渝等李竹渝等(2007)(2007)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物11局部回归局部回归(3)(3)G-MG-M估计估计由由Gasser and Mller(1979)Gasser and Mller(1979)提出,形式如下提出,形式如下:11()()iisnGMhihismxYKxu du其中其中010,()/2,1,1,1iiinssxxins写成线性光滑器的形式写成线性光滑器的形式:1()()nGMhhiiimxWx Y1()()iishihsW xK x u duG-MG-M估计是卷积形式的估计,估计是卷积形式的估计,P-CP-C估计可看成估计可看成G-MG-M估计的近似估计的近似:当当K K连续连续11()()()()nGMPChiiihhimxYssKxxmx1(,)iixss我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物12局部回归局部回归核估计存在边界效应,边界点的估计偏差较大核估计存在边界效应,边界点的估计偏差较大,以以N-WN-W估计为例,如下图估计为例,如下图我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物13局部回归局部回归一般,核函数的选取并不是很重要,重要的是带宽的选取一般,核函数的选取并不是很重要,重要的是带宽的选取我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物14局部回归局部回归一般,核函数的选取并不是很重要,重要的是带宽的选取一般,核函数的选取并不是很重要,重要的是带宽的选取我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物15局部回归局部回归一般,核函数的选取并不是很重要,重要的是带宽的选取一般,核函数的选取并不是很重要,重要的是带宽的选取可以看到:拟合曲线的光滑度受到光滑参数可以看到:拟合曲线的光滑度受到光滑参数h h变化的影响变化的影响我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物16局部回归局部回归核估计的渐近方差核渐近偏差核估计的渐近方差核渐近偏差核估计渐近偏差渐近方差N-W估计G-M估计22()2Khm fmdf22Khm d2()Kxcnhf23()2Kxcnhf其中,其中,h h为光滑参数,为光滑参数,f f为为X X的密度函数,且的密度函数,且2()Kdu K u du2()KcK u du我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物17局部回归局部回归 2.2.局部多项式光滑局部多项式光滑多项式的回归模型多项式的回归模型()Ym X2012()ppm xxxx其中其中 可由最小二乘法估计可由最小二乘法估计,即即 01(,)Tp21arg min()niiiYm X局部多项式回归:对局部多项式回归:对m(x)m(x)在在u u处进行处进行p p阶泰勒展开,略去阶泰勒展开,略去p p阶阶高阶无穷小量,得到高阶无穷小量,得到m(x)m(x)在在u u处的一个处的一个p p阶多项式近似,即阶多项式近似,即01()()()()()()ppm xuu xuu xu()()()/!,1,2,jjumujjp此时,此时,x x应该靠近应该靠近u u,且,且我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物18局部回归局部回归通过最小二乘来估计系数通过最小二乘来估计系数01()(),(),()Tpuuuu注意:是在注意:是在x x的一个邻域内进行多项式估计,因此,最小二乘应的一个邻域内进行多项式估计,因此,最小二乘应该与该与x x的邻域有关的邻域有关局部加权平方和:局部加权平方和:2011()()()(),npiipihiiYxxXxXK xX使上述问题最小化,可以得到系数的局部多项式的最小二乘估计使上述问题最小化,可以得到系数的局部多项式的最小二乘估计可以很容易得到,取可以很容易得到,取p=0p=0时为局部常数估计,即时为局部常数估计,即N-WN-W核估计核估计取取p=1p=1,为局部线性估计,为局部线性估计我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物19局部回归局部回归写成矩阵形式:写成矩阵形式:(-)(-)TxxxYXWYX使上式最小化,可以得到系数的估计使上式最小化,可以得到系数的估计-1()=()TTxxxxxxX W XX W Y其中其中1122()1!()1!()1!ppxpnnxxxxpxxxxXpxxxxp()xhin nWdiag K xx12nYYYY 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物20局部回归局部回归得到加权最小二乘估计得到加权最小二乘估计-1()()()LPETThxxxxxxxmxXxX X W XX WY当当p=1p=1时(局部线性估计)的渐近偏差和渐近方差时(局部线性估计)的渐近偏差和渐近方差2()(),2LPEhKhbias mxm x d2()()()LPEhKxVar mxcnhf x其中其中2()Kdu K u du2()KcKu du可以看到局部线性回归的渐近方差和可以看到局部线性回归的渐近方差和N-WN-W估计相同,估计相同,而渐近偏差却比而渐近偏差却比N-WN-W回归小,说明局部线性多项式回归小,说明局部线性多项式可以减少边界效应,局部线性估计由于可以减少边界效应,局部线性估计由于N-WN-W估计估计我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物21局部回归局部回归局部多项式光滑可以很好的减少边界效应局部多项式光滑可以很好的减少边界效应我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物22局部回归局部回归检验函数检验函数(Doppler(Doppler函数函数)2.1()(1)sin,010.05m xxxxx我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物23局部回归局部回归使用使用GCVGCV选取最优带宽选取最优带宽h=0.017h=0.017,权函数为,权函数为tricubetricube核函数核函数我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物24局部回归局部回归使用使用GCVGCV选取最优带宽选取最优带宽h=0.017h=0.017,权函数为权函数为tricubetricube核函数核函数我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物25局部回归局部回归3.3.近邻光滑近邻光滑(1)(1)k-NNk-NN回归回归(k-nearest neighbor regression)(k-nearest neighbor regression)1()()nkkiiimxWx Y1/()0,xkikiJWxotherwise,其中其中 =i:xi是离是离x最近的最近的k个观测值之一个观测值之一 xJK-NNK-NN估计的渐近偏差和渐近方差:估计的渐近偏差和渐近方差:231()()()(2)()(/)24()kkbias m xEm xm xm fm fxk nfx2()()kxVar mxk对于随机设计模型,近邻估计写成线性光滑器的形式对于随机设计模型,近邻估计写成线性光滑器的形式权函数:权函数:我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物26局部回归局部回归(1)(1)k-NNk-NN回归回归(k-nearest neighbor regression)(k-nearest neighbor regression)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物27局部回归局部回归(1)(1)k-NNk-NN回归回归(k-nearest neighbor regression)(k-nearest neighbor regression)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物28局部回归局部回归(2)(2)k-k-近邻核回归近邻核回归K K近邻核估计的权重近邻核估计的权重1()()()RikinRiiKxxWxKxx其中其中R为为xi 中中离离x最近的第最近的第k k个距离,个距离,K K为核函数为核函数()()/)/RiiKxxKxxRR渐近偏差和渐近方差:渐近偏差和渐近方差:232 ()()()()()8kkKkm fm fbias m xEm xm xx dnf22()()kKxVar m xck我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物29局部回归局部回归(2)(2)k-k-近邻核回归近邻核回归我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物30局部回归局部回归(2)(2)k-k-近邻核回归近邻核回归我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物31局部回归局部回归(3)(3)对称化近邻回归对称化近邻回归(Symmetrized Nearest Neighbor Estimate)(Symmetrized Nearest Neighbor Estimate)Yang(1981)Yang(1981),Stute(1984)Stute(1984)研究了这种估计研究了这种估计其中权重其中权重()1()()1()nnnik hiiF xF xmxKYnhh()1()()k h ihnniWKF xF xn写成线性光滑器写成线性光滑器()()1()nk hk h iiimxWY这里的这里的k(h)相当于相当于nh,可以看出实质上相当于可以看出实质上相当于nh个个Yi值加权平均值加权平均我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物32局部回归局部回归4.4.稳健光滑稳健光滑(1)(1)局部加权描点光滑局部加权描点光滑(Locally Weighted Scatter plot Smoothing,LOWESS)(Locally Weighted Scatter plot Smoothing,LOWESS)Step1Step1:在在x x的邻域内,用一个多项式进行拟合,求出系数的邻域内,用一个多项式进行拟合,求出系数 j 21111(,)argmin()nnTipkiijijnW xYx其中其中Wki(x)为为k-NN权权Step2Step2:根据残差根据残差 计算尺度估计计算尺度估计 ,i|imedian定义稳健权重定义稳健权重(/(6)iiK2 2()(15/16)(1)(|1)K uuI uStep3Step3:用新的权重用新的权重 重复重复Step1Step1、Step2Step2,直到第,直到第N N次结束次结束()ikiWx我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物33(1)(1)局部加权描点光滑局部加权描点光滑(LOWESS)(LOWESS)局部回归局部回归我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物34(1)(1)局部加权描点光滑局部加权描点光滑(LOWESS)(LOWESS)局部回归局部回归我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物35局部回归局部回归(2)(2)L-光滑光滑条件条件L函数函数110()()(|)l xJ v Fv x dv其中其中为为条件分位数函数条件分位数函数特别:特别:a)a)当当 时时1(|)inf:(|),01Fv xy F y xvv()(1)/(1 2),01/2J vIv 0111(1|)10(0|)(|)(|)(|)()FxFxFv x dvydF y xE Y Xxm xb)b)当当 时,为中位数光滑时,为中位数光滑1/2():ixm xmed Y iJ()1J v 其中其中 =i:xi是离是离x最近的最近的k个观测值之一个观测值之一 xJ我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物36局部回归局部回归(2)(2)L-光滑光滑对于条件对于条件L函数函数110()()(|)l xJ v Fv x dv其中用其中用 来估计来估计F(y|x)()(1)/(1 2),01/2J vIv 得到得到L-估计估计11()(|)()()nhihinihjjK x xF y xI YyK x x110()()(|)Lhhm xJ v Fv x dv11(1|)(0|)(|)(|)hhFxhhFxy J F y x dF y x我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物37局部回归局部回归(3)(3)M-光滑光滑(局部局部)最小二乘方法得到的光滑估计最小二乘方法得到的光滑估计1()()nhhiiim xWx Y是通过考虑损失函数为二次函数得到的,现在考虑是通过考虑损失函数为二次函数得到的,现在考虑损失函数损失函数2212(1/2),|()|,|u if ucuc uc if ucc c较大时,为普通的二次损失函数,较大时,为普通的二次损失函数,c c较小较小(1(1倍或倍或2 2倍观测误倍观测误差的标准差差的标准差)可以获得更多的稳健性可以获得更多的稳健性我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物38局部回归局部回归M-M-样条样条(Cox,1983)(Cox,1983)21()argmin()()nMhiiimxYm xm xdx核核M-M-光滑光滑(kernel M-smoother)(kernel M-smoother)(Hubber,1979;Silverman,1985)(Hubber,1979;Silverman,1985)1()argmin()()nMhhiiiimxWxYm x我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物39局部回归局部回归(3)R-(3)R-光滑光滑12(,(|)(|)1(2|)(|)TFxJF v xFv xdF v x 定义得分函数定义得分函数其中其中J是定义在是定义在(0,1)上的非减函数,满足上的非减函数,满足J(1-s)=J(s)用用 来估计来估计F(y|x),则则 应该粗略地接近应该粗略地接近0对于对于 ,则,则()m x(,(|)0TFx(|)hFy x(,(|)hTFxCheng and Cheng(1986)Cheng and Cheng(1986)提出的提出的R-R-估计:估计:1()sup:(,(|)0 inf:(,(|)02RhmxTFxTFx我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物40样条回归样条回归设设m(x)m(x)在在a,ba,b连续可微,且二阶导数平方可积连续可微,且二阶导数平方可积221min()()()niiiSmYm xmxdx(1),0()()iim xY不光滑01(2),()()m xx线性(3),0()m x 三次样条考查形式考查形式其中其中 为粗糙惩罚为粗糙惩罚2()mxdx1.1.光滑光滑样条样条我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物41样条回归样条回归定义一组样条基函数:定义一组样条基函数:()max,0,4zzNn1()1x2()xx23()xx34()xx351()()xxx3362()(),()()Nnxx xxx x注意,这里样条基函数可以是其他样条基注意,这里样条基函数可以是其他样条基 如如:B:B样条基样条基(吴喜之译吴喜之译(2008)(2008)样条样条1()()Njjjm xx 1()()Njjjm xx 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物42样条回归样条回归将前面的优化问题写成矩阵形式:将前面的优化问题写成矩阵形式:min()()TTYY其中其中,()ijijjjn nx ()()jkxx dx1()TTY 1()TTmY 上述问题的最优解上述问题的最优解其中其中12(,)TnYY YY1(),()Tnmm xm x112111222212()()()()()()()()()nnnnnnxxxxxxxxx我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物43样条回归样条回归下面的图利用的是下面的图利用的是B B样条基函数,样条基函数,我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物44样条回归样条回归下面的图利用的是下面的图利用的是B B样条基函数,样条基函数,我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物45样条回归样条回归下面的图利用的是下面的图利用的是B B样条基函数,样条基函数,我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物46正交光滑正交光滑1.1.正交多项式回归正交多项式回归回归函数回归函数0()()jjjm xx 其中其中 是正交基函数,如是正交基函数,如Laguerre,Legendre正交多项式正交多项式0()jjx正交基满足正交基满足110,()()1,jkikxx dxik系数系数11110()()()()jkkjjkxx dxm xx dx系数估计系数估计111()()()injjijAim xx dxYx dx1 1,1,niiA,ikAAik如如(1),()iiiAxx我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物47正交光滑正交光滑回归函数估计回归函数估计()0()()N nNjjjmxx 写成线性光滑器:写成线性光滑器:()011()()()()iN nnnNijjNiiAjiimxYu duxWx Y()0()()()iN nNijjAjWxu dux 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物48LegendreLegendre正交多项式正交多项式正交光滑正交光滑0()1/2P x 1()/2/3P xx2122()(31)/2/5P xx3132()(53)/2/7P xxx42148()(35303)/2/9P xxx53158()(637015)/2/11P xxxx11(1)()(21)()()mmmmPxmxP xmPx我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物49正交光滑正交光滑2.Fourier 2.Fourier 级数光滑级数光滑01()2cos(),01jjm xjxx在实际中,将无穷用有限值在实际中,将无穷用有限值r r替换,替换,r r称为截断点,相当于光滑参数称为截断点,相当于光滑参数1,cos(),cos(2),cos(3),Cxxx是正交是正交cosinecosine基空间基空间10cos()cos()0,jxkx dxjk10()cos(),0,1,2,jm xjx dx j系数系数系数系数 的估计的估计j11cos()iinsjisiYju du 010,()/2,1,1,1iiinssxxins其中其中我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物50正交光滑正交光滑m(x)m(x)的估计的估计01(;)2cos()rjjm x rjx将将 代入,得代入,得j1(,)12cos()cos()rrjKx ujxju()()rrD x uD x u11(;)(,)iinsirsim x rYKx u du其中其中,()sin(21)/2)/2sin(/2)rrDDirichletD trtt为核可以看到上面的估计与可以看到上面的估计与G-MG-M估计有相同的表达估计有相同的表达形式,都为卷积形式,只是核函数不相同形式,都为卷积形式,只是核函数不相同我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物51正交光滑正交光滑另外一种的另外一种的FourierFourier估计估计101(,)()cos(),01njjm x wwjjxx一般要求:一般要求:1(1)(2)(1)0wwwn同样可以写成卷积形式:同样可以写成卷积形式:11(,)(,)iinsinsim x wYKx u w du 其中其中11(,)1 2()cos()cos()nnjK x u wwjjxju 关于权函数选取可以是满足前面条件任意的权函数关于权函数选取可以是满足前面条件任意的权函数我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物52正交光滑正交光滑常见的权函数常见的权函数.Fejr权:权:Rogosinski权:权:特征权特征权:()()1(1)/,rw jw jjrr r 若令若令n-1=r,n-1=r,则则11(,)(,)rrjm x wm x jr()()cos(),1,;121rRjw jwjjr rr(,)()()RrrrKu vR uvR uv111()()()22121rrrR tD tD trr()(),0Kw jj K是是K的特征函数,的特征函数,K是关于原点对称的连是关于原点对称的连续概率密度函数续概率密度函数我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物53正交光滑正交光滑3.3.小波回归小波回归(wavelet regression)(wavelet regression)具有空间适应性,是一种适应性估计,一般对信噪具有空间适应性,是一种适应性估计,一般对信噪比很大的数据可以很好的拟合比很大的数据可以很好的拟合/2.,()2(2)jjj kj km xcxk/2.2()(2),jjj kcm xxk dx其中其中在实际中,可以这样近似:在实际中,可以这样近似:21000,1,()()()jJjkjkjkxJm xxx 其中:其中:10()(),m xx dx10()()jkjkm xx dx我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物54正交光滑正交光滑小波基函数:小波基函数:HaarHaar父小波父小波母母HaarHaar小波小波1,01()0,ifxxelse1,01/2()1,1/210,ifxxifxelse/2()2(2)jjjkxxk我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物55正交光滑正交光滑函数集函数集 2(0,1)L是是 上的正交基上的正交基00101120212223,父小波:父小波:水平水平1 1:水平水平2 2:水平水平3 3:水平水平4 4:00()1011,20212223,3031323334353637,我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物56正交光滑正交光滑2100()()(),0,1jJjkjkjkm xxxx 10()(),m xx dx10()()jkjkm xx dx通过小波基函数可以发现大多数通过小波基函数可以发现大多数 因此可以略去,但需要识别因此可以略去,但需要识别.0jk对于:对于:回归函数估计的步骤回归函数估计的步骤:(1)(1)估计系数估计系数:1011()()()njkijkijkjkiYxm xx dxn(2)(2)收缩收缩:jkjkshrink(3)(3)重新构造重新构造:2100()()()jJjkjkjkm xxx 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物57正交光滑正交光滑常用的收缩方法:软阈与硬阈常用的收缩方法:软阈与硬阈软阈软阈(soft threshold):(soft threshold):硬阈硬阈(hard threshold):(hard threshold):其中阈值的确定其中阈值的确定()(|)jkjkjksign0,|,|jkjkjkjkifif2lognn11,1,|:0,1,210.6745JJkJkmedianmediankn我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物58正交光滑正交光滑我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物59正交光滑正交光滑我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物60正交光滑正交光滑
展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
相关资源
正为您匹配相似的精品文档
相关搜索

当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!