2017-2018年中国科学院自动化研究所考博试题 模式识别

上传人:黑** 文档编号:50985606 上传时间:2022-01-24 格式:DOCX 页数:6 大小:12.68KB
返回 下载 相关 举报
2017-2018年中国科学院自动化研究所考博试题 模式识别_第1页
第1页 / 共6页
2017-2018年中国科学院自动化研究所考博试题 模式识别_第2页
第2页 / 共6页
2017-2018年中国科学院自动化研究所考博试题 模式识别_第3页
第3页 / 共6页
点击查看更多>>
资源描述
中国科学院自动化研究所2017年招收攻读博士学位研究生入学统一考试试卷科目名称:模式识别考生须知:1. 本试卷满分为100分,全部考试时间总计180分钟。2, 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。1- (12分)对一个c类分类问题,设各类先验概率为P(知,i=l,2,,c,类条件概率密 度为P(x|妇,1=1,2,., c.其中,x表示特征向量。设将第j类模式判定为第】类的损失 为扃。请写出最小错误率贝叶斯决策和最小风险贝叶斯决策的决策规则。2. (12分)关于概率密度函数估计:(1)设一维特征空问中的窗函数为gu) = X,”它们分别属于两个类别,其类 别标签分别为yi,於,.,yne+l, -1写出线性不可分情形下的支持向量机学习模型。4. (10分)现有四个来自于两个类别的二维空问中的样本,其中第一类的两个样本为(3,2和(2, 2) 1第二类的两个样本为(1,0) 丁和(2, 0)L这里,上标T表示向量转置。若采用规范化增广样本表示形式,并假设初始的权向量a=(l,0,0)T,其中向量a的第三维对应于样本的齐次坐标。同时,假定梯度更新步长q固定为L试利用批处理感知器算法 求解线性判别函数g(y)=ary的权向量a (注1:“规范化增广样本表示”是指对齐次坐标表示的样木进行规范化处理:注2:批处理感知器算法是指在权重向量迭代修正的过程中考虑所有错分样本)。5. (14分)关于特征提取:(1)请简述主成分分析方法的原理;(6分)(2)请简述Fisher线性判别分析(Linear Discnminaiit Analysis, LDA)的主要思想,并给出 两类分类问题的LDA学习模型(即最优化模型)。(8分)(未完待续)6. (20分)在一个模式识别问题中,有下列8个样本,每个样本为一个二维特征向量:(-4,1), (2, 1). (-4, -1), (-2, -1), (4, 1). (2, 1). (4, -1), (2, -1),其中,括号内的第一个数据表示该样本点的第一个特征,括号内的第二个数据表示该样本点的第二个特征。(1) 现在考虑对这8个样本进行聚类。采用C均值聚类算法,并假定聚类中心的个数为2. 两个初始聚类点分别为(-5,0)和(5,0)。根据上述初始条件,请写出C均值聚类算法的计算步骤,并给出最后的聚类中心;(10分)(2) 对上述8个样本,假设前4个样本属于第一类,后4个样本属于第二类,现在要求 只使用一个特征达到这样的分类目的。请给出一种特征选择方法,并给出计算过程和结B (10分)7. (12分)设有n个d维空间的训练样本,这些样本-共来自于c个类别。假定要设计一个多层前向神经网络,将该网络训练之后可用于对新样本进行分类。请描述你所设计的网络结构,给出训练该网络的主要计算步骤:从网络结构和网络训练的角度指出哪些因素会对分类性能造成影响。S.(10分)请从监督学习(学习过程中利用样本的类别标签)和无监督学习(学习过程 中不利用样本的类别标签)的角度,对如下方法进行归类:Parzen窗概率密度估计方法、K-近邻分类器、感知器准则方法、主成分分析方法、决策树方法、支持向量机方法、C均值聚类方法、IS0DATA方法、罗杰斯特回归方法、分级聚类方法、核主成分分析方 法、LLE方法、Adaboost方法、自组织映射方法、Isoniap方法、Fisher判别分析方法、谱聚类方法、Recurrent Neural Network方法、受限玻尔滋曼机方法、卷积神经网络方法。中国科学院自动化研究所2018年招收攻读博士学位研nT究生入学统一考试试卷科目名称:模式识别考生须知:1. 本试卷满分为100分,全部考试时间总计180分钟。2. 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。5. (20分).在一个模式识别问题中,有下列8个样本,每个样本为一个二维特征向量:(-4,1) 1,(-2, 1) T, (-4,-1) T, (-2,-1) (4,1), (2,1), (4,-1) T, (2,-1) T.其中,括号内的第一个数据表示该样本点的第一个特征,括号内的第二个数据表示该样本点的第二个特征,上标T表示向量转置。(1)、如果不知道这8个样本的类别标签,清采用K-L变换,计算其特征值和特征向量。(10 分)(2)、对上述8个样本,假设前4个样本属于第一类,后4个样本属于第二类,现在要求只使用一个特征达到这样的分类目的。请采用_L必判据对特征进行选择,给出|Sw计算过程和结果。(10分)6. (16分).己知正类样本点XI= (1, E,电=(,0) T. X3= (3, 3)气负类样本点X4= (4, 3) T,x5= (4,4) T,x6= (5,3) To请完成如下任务:(1)、写出线性支持向星机需要求解的原问题和对偶问题(不要求进行求解);(10分)(2)、当软间隔惩罚参数C取值很大时,定性地画出所得到的分类决策面,并解释原因;(提示:先将6个样本点在答题纸上画出,然后画出分类决策面)(3分)(3)、当软间隔惩罚参数C取值很小时,定性地画出所得到的分类决策面,并解释原因。(提示:先将6个样本点在答题纸上画出,然后画出分类决策面)(3分)7. (12分).针对多层前馈神经网络,请回答如下问题:(1)、结合三层网络分别给出有关“隐含层至输出层”、“输入层至隐含层”的权重更新公式;(4分)、给出采用误差反向传播算法(即BP算法)训练一个多层前馈神经网的计算步骡;(4分)(3)、在采用BP算法对网络进行训练时,在训练过程中口J能产生麻痹现象。解释为什么会出现这种现象。(4分)8. (10分).关于深度学习,请回答如下问题:(1)、请对“深度学习”下一个定义;(4分)(2)、请列举出三种不同的深层神经网络模型(给出其名称即可),并指出它们分别适用于何种模式识别任务。(6分)1. ( 10分).对于c类分类问题,假定各类条件概率密度函数均为多元正态分布p(x|藉)N皿工),i=L2,c,其中,“产表示数据的特征向量,囚和分别为第1类的均值向量和协方差矩阵,e代表第】个类别。在最小错误率贝叶斯决策的框架下,请完成如下任务:(IX写出一种判别函数;(6分)(2)、指出在什么情况下可以获得线性判别函数,并给出具体的推导过程。(4分)2. (10分).现有一维空间中的四个样本点-2, 0, 4, 8,请完成如下任务:(1)、假定窗口函数为V7二。5的高斯函数,写出Parzen窗概率密度估计函数p (x) ;(5分)(2)、写出概率密度函数p (x)的最近邻C1-NN)估计,画出概率密度函数曲线图。5分)3. (12分).C均值聚类可视为是基于“误差平方和最小准则”的聚类方法,误差平方和定义为:j二iz,七二1 仅-叫 r, 4*=i=lxeD,鸟 xeD,其中,c是聚类个数,D,表示第1个聚类,m,表示属于第1个聚类的所有样本的均值,11.表示属于第1个聚类的样本个数,L表示第i个聚类的误差平方和,J是总的误差平方和。(1)、写出一种C均值聚类算法的计算步骤;(7分)(2)、在某次迭代时,假定原来属于。个聚类中的样本被分配至D)个聚类,试证明这种分,11 llx-nijll1234配会导致J增加为:j=Jj+ 0 (5分)巧+14. (10分).关于AdaBoost方法。假定有n个d维空间中的训练样本(xx2,., xn C R,进一步假定这些样本属于两个不同的类别。请完成如下任务:(1)、基于这些样本,请筒述采用AdaBoost方法学习一个两类分类器的计算步骤;(6分)(2)、请解释为什么AdaBoost经常可以在训练误差为零时继续训练还可以带来测试误差继续下降。(4分)(未完待续)
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!