资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第,11,章 监督学习,剩余课,程,程安排,本周是,第,第八周,,,,周四,结,结束所,有,有课程,第八周,第,第2节结束,实,实验三,验,验收,第9周考试,,,,考试,时,时间11.01,8周.周日晚,上,上交实,验,验三的,报,报告,大纲,分类,逻辑斯,特,特回归,支持向,量,量机SVM,神经网,络,络,Bagging andBoosting,回归,自主学,习,习课程,论,论文3:SVR,实例,Logistic回归基,本,本理论,和,和方法,研究某,一,一事件,发,发生的,概,概率,P=P,(,(y=1),与若干,因,因素之,间,间的关,系,系,在0和1之间,任意范,围,围之间,的,的数量,若干个,状,状态的,标,标量,logistic变换,logistic变换,Logistic回归模型,优势比,概率p的预测,P与多因,素,素之间,的,的关系,预,预测,P与单特,征,征之间,的,的关系,图,图,p,x,1,最可能,成,成功范,围,围,最不可,能,能成功,范,范围,LR模型公,式,式,二分类,:,:,多项逻,辑,辑斯特,回,回归(Multinomiallogisticregression,MLR):,注意:在实际,分,分类应,用,用时,,因,因为特,征,征向量,往,往往维,数,数较多,,,,标签,值,值的分,类,类,优,先,先选择MLR模型,支持向,量,量机SVM,在机器,学,学习领,域,域,支持向,量,量机SVM,(,(SupportVectorMachine)是一个,有,有监督,的,的学习,模,模型,,通,通常用,来,来进行,模,模式识,别,别、分,类,类、以,及,及回归,分,分析。,线性分,类,类器,Binaryclassificationcan be viewedasthetaskofseparating classesinfeaturespace(特征,空,空间):,LinearClassification,Whichofthelinear separatorsisoptimal?,ClassificationMargin(间距,),),ClassificationMargin(间距,),),Maximum MarginClassification最大间,距,距分类,Maximizing themarginisgoodaccordingtointuition andPACtheory.,意味着,分,分类时,只,只考虑,支,支持向,量,量,其,他,他的训,练,练样本,被,被忽略,。,。,Maximum MarginClassification最大间,距,距分类,Maximizing themarginisgoodaccordingtointuition andPACtheory.,意味着,分,分类时,只,只考虑,支,支持向,量,量,其,他,他的训,练,练样本,被,被忽略,。,。,Maximum MarginClassificationMathematically,Maximum MarginClassificationMathematically,非线性SVMs,非线性SVMs:特征空,间,间,课堂讨,论,论,神经网,络,络,问题求,解,解,求解线,性,性子问,题,题,激活函,数,数,图形化,描,描述求,解,解过程,图形化,描,描述求,解,解过程,图形化,描,描述求,解,解过程,深度神,经,经网络,Bagging,bagging是一种,用,用来提,高,高学习,算,算法准,确,确度的,方,方法,,这,这种方,法,法通过,构,构造一,个,个预测,函,函数系,列,列,然,后,后以一,定,定的方,式,式将它,们,们组合,成,成一个,预,预测函,数,数,基本思,想,想,1.给定一,个,个弱学,习,习算法,和一个,训,训练集;,2.单个弱,学,学习算,法,法准确,率,率不高;,3.将该学,习,习算法,使,使用多,次,次,得出预,测,测函数,序,序列,进行投,票,票;,4.最后结,果,果准确,率,率将得,到,到提高,Bagging,算法,1.Fort=1,2,TDo,从数据,集,集S中取样,(,(放回,选,选样),训练得,到,到模型Ht,对未知,样,样本X分类时,每个模,型,型Ht都得出,一,一个分,类,类,得,票,票最高,的,的即为,未,未知样,本,本X的分类,2.也可通,过,过得票,的,的平均,值,值用于,连,连续值,的,的预测,要求的,分,分类算,法,法,Bagging要求“,不,不稳定,”,”(不,稳,稳定是,指,指数据,集,集的小,的,的变动,能,能够使,得,得分类,结,结果的,显,显著的,变,变动),的,的分类,方,方法。,比,比如:决策树,神经网,络,络算法,Boosting,发展历,史,史,Boosting,AdaBoost,AdaBoost,回归,多项式,最,最小二,乘,乘回归,支持向,量,量回归SVR,神经网,络,络,深度神,经,经网络,。,。,。,实例,淘宝母,婴,婴预测,分组,1,2,3,4,5,年龄段,1 to 6 months,6 to 12 months,1 to 3 years,3 to 6 years,older than 6 years,预测模,型,型整体,框,框架,特征提,取,取,商品编号,一级类目,叶子类目,属性,1,属性,2,1,服装,裤子,适用年龄:,2,岁,型号:,L,2,食物,奶粉,适用年龄:,3,到,6,个月,3,用品,奶瓶,适用年龄:,2,岁,容量:,250ml,分类器,分类器,选,选择:MLR,评价标,准,准MicroF1值,实验结,果,果,总体准,确,确率:78.2%,70%覆盖率,下,下各年,龄,龄段上,的,的MicroF1值,
展开阅读全文