资源描述
精品文档2欢在下载2010年春硕士研究生 机器学习 试题下列各题每个大题 10分,共8道大题,卷面总分 80分注意:在给出算法时,非标准(自己设计的)部分应给出说明。特别是自己设置的参数及变 量的意义要说明。1.下面是一个例子集。其中,三个正例,一个反例。“P”为正例、N为反例。这些例子是关于汽车的。例子有 4个属性,分别是“产地”、“生产商”、“颜色”、“年代”。产地生产商颜色年代|类别JapanHondaBlue1980PJapanHondaBlue1990PUSAChryslerRed1980NJapanHondaRed1980P其中:“产地”的值域为(Japan,USA)、“生产商”的值域为(Honda, Chrysler)、颜色的 值域为(Blue,Red)、“年代”的值域为(1980,1990)。这里规定“假设”的形式为4个属性值约束的合取;每个约束可以为:一个特定值(比如Japan、Blue等)、?(表示接受任意值)和(表示拒绝所有值)。例如,下面假设:(Japan, ?, Red, ?)表示日本生产的、红色的汽车。1)根据上述提供的训练样例和假设表示,手动执行候选消除算法。特别是要写出处理 了每一个训练样例后变型空间的特殊和一般边界;2)列出最后形成的变型空间中的所有假设。2 .写出ID3算法。(要求:除标准ID3算法外,要加入“未知属性值”和“过适合”两种情 况的处理)。3 .给出一个求最小属性子集的算法。4.给定训练例子集如下表。依据给定的训练例子,使用朴素贝叶斯分类器进行分类。给定类别未知例子高度=矮,头发=红,眼睛=兰,计算这个例子的类别。(计算类别时要 先列出式子,然后再代入具体的数)。例子号高度头发眼睛类别1矮淡黄兰+2高淡黄兰+3高红兰+4高淡黄褐一5矮里 八、兰一6高里 八、兰一7高里 八、褐一8矮红褐一5.给定线性函数 ?(x)W0W1X1wnxn及误差定义 E 1(f(x) ?(X)22x D其中,Xi是例子x的第i个属性值,f(x)是目标函数,D是训练例子集合。请给出一个算法, 这个算法能求出一组 Wi值,使得线性函数 ?(x)逼近目标函数f(x)(本题要求写出算法的 步骤,算法步骤的详细程度要符合书中算法的标准)。6.给定例子集(如下表),要求:1)用平面图直观画出例子的分布;2)给出一种规则好坏的评判标准;3)写出概念聚类算法。例子X1X2X3X4e10A01e20B00e30C12e41A02e51C11e62A10e72B01e82B127.简述题1)简述“机器发现”的三个定律;2) KBANN EBNN FOCL是分析学习和归纳学习结合的三个算法。简述这三个算法与单纯的 归纳学习方法相比,分别有什么区别或优点。8.关于模式定理1)分析“选择步”对群体遗传的影响:令 m(s,t)是群体中模式s在时间t (或第t代)的 实例数量,f(h)是个体h的适应度,f(t)是时间t (或第t代)群体中所有个体的平均适应度,n为群体中个体的总数量,U:s,t)是时间t (或第t代)群体中模式s的实例的平均适应度。在“选择步”中,每个个体被选中的概率为Pr(h) (Pr(h)的计算见公式(1),如果共进行了 n次独立选择,请给出在第(t+1)代(即下一代)的群体中,模式 s 的实例存在的期望数量 Em(s,t+1)(要求给出分析过程)。Pr(h)(1)i1f(hi)2)分析“变异步”对群体遗传的影响:令 m(s,t)是群体中模式s在时间t (或第t代)的 实例数量。设在模式 s中有R(s)个确定位,变异操作以概率Pm选择一位并改变这位上的值。如果只考虑变异步对群体遗传的影响,请给出在第(t+1)代(即下一代)的群体中,模式s的实例存在的期望数量Em(s,t+1)(要求给出分析过程)。
展开阅读全文