资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章,决策量化方法准备知识,商业电子表格制模(Excel),概率与统计简介,基础运筹学,数据挖掘技术,概率与概率分布,(1)数权归纳:更易理解、直观、总体状态与趋势,比较结果,应用于量化方法。,(2),平均数 mean =,中位数,众 数,变动幅度:最大数值最小数值,绝对商差均值:,标准差=方差,i=1,n,ABSx,i,-,x,i,n,=,i=1,n,n,x,i,-,2,n,i=1,n,误差平均均值 =,数据-原始数值,数据-有用形式,信息,处理,数据解释,概率与概率分布,(3)概率:,事件A发生概率P(A),独立事件概率:P(A,B)=P(A)+P(B),(A、B独立事件)P(A,B)=P(A)P(B),条件概率(贝叶斯定律):P(A/B)=,P(A)=0,P(A)=1,0P(A)1,P(B/A)P(A),P(B),概率与概率分布,实例:,购买的二手车,也许会好,也许会不好。如果买的车好,70%的会耗油量较低,,20%的会有中等的耗油量。如果买的车不好,50的会耗油量较高,30%的会有中等,耗油量。对一辆二手车的实验表明该车耗油量较低。如果成交的二手车有60%是好,的,那么,这辆车属于好的概率为多少?,概率与概率分布,概率与概率分布,概率与概率分布,概率树:,P(HOC)=0.26,P(MOC)=0.24,P(LOC)=0.50,P(GB/HOC)=0.23,P(BB/HOC)=0.77,P(GB/MOC)=0.5,P(BB/MOC)=0.5,P(GB/LOC)=0.84,P(BB/LOC)=0.16,P=0.06,P=0.20,P=0.12,P=0.12,P=0.42,P=0.08,概率分布,二项分布:,特征:每次实验有两种可能的结果,可以称之为成功和失败;两种结果是互斥的;成功和失败的概率都是一个固定的常数,分别为P和q=1-P;连续实验的结果之间是独立的。,P(n,次实验中有r次成功)=C,r,n,p,r,q,n-r,=p,r,q,n-r,均值=np,方差=,2,=n.p.q,标准差=(n.p.q),1/2,n!,r!(n-r)!,柏松分布(pocsson distribution),柏松分布的特征:,试验次数n较大(大于20);,成功的概率P较小。,P(r,次成功)=,其中e=2.7183,=平均成功次数=n.p,均值=n.p,方差=,2,=n.p,标准差=(n.p),1/2,*只用到成功的概率,e,-,r,r!,正态分布,特征:,连续的,是关于均值对称的,均值、中位数及众数三者相等,曲线下总面积为1,f(x),观察值x,正态分布,f(x)=e,-(x-,)2,/2,2,=,e,-,其中x-变量值,-均值,-标准差,=3.14159 e=2.7183,Z=商开均值的标准差个数,P(x,1,x x,2,)=,z1=,z2=,1,2,1,2,Z,2,2,1-P(x,x,2,),x1,P(x,x,1,)-P(xx,2,),x1,X,1,-,X,2,-,x,1,x,2,X-,概率分布实例,一个中型超市日销售500品脱牛奶,标准差为50品脱。,(a),如果在一天的开门时,该超市有600品脱的牛奶存货,这一天牛奶脱销的概率有多少?,(b)一天中牛奶需求在450到600品脱之间的概率有多大?,(c)如果要使脱销概率为0.05,该超市应该准备多少品脱的牛奶存货?,(d)如果要使脱销概率为0.01,应准备多少品脱的牛奶存货?,0.0228,0.1587,0.8185,f(x),x,450 500 600,统计抽样与检验方法,系统可靠性分析,可靠性:1-(1-R),2,可靠性:R,2,R,R,R,R,统计抽样与检验方法,抽样:,目的是通过收集式考察少数几个观察值(样本),而不是全部可能的观察值(总体),得出可靠的数据。,抽样分布:,由随机样本得出的分布。,中心极限定理(central limit theorem):,无论原来总体的分布如何,总体中抽样取大量的随机样本,样本的均值符合正态分布。,假设总体:个数N,均值,,标准差;,样本:个数n,均值X,标准差S;,则:X=,S=/n,1/2,-(抽样标准误差),统计抽样与检验方法,置信区间:,总体均值在某一范围内的可信水平。,总体均值的95%置信区间为:(X-1.96 S,X+1.96,S),统计抽样与检验方法,案例:全面质量管理,传统上,有大量的抽样方法应用于质量控制。近年来,许多组织改变了他们对质量的认识。他们不再设定一个残次品水平,出不再认为达到了这样一个水平就说明组织运转良好。相反,他们代之以“零残次品”为目标,其实施方法是全面质量管理(Total Quality Management,TQM),这要求整个组织一起努力,系统改进产品质量。,爱德华,戴明(Edward Deming),是开创了全面质量管理工作的专家之一,他将自己的实践经验总结为以下14条。,1 将产品质量作为一贯性的目的。,2 杜绝即使是客户允许的差错、延误、残次和误差。,3 停止对于成批检验的依赖,从生产开始的第一步就树立严格的质量意识。,4 停止依据采购价格实施奖励的作法-筛选供应商,坚持切实有效的质量检测。,5 开发成本、质量、生产率和服务的持续改进项目。,6 对全体职员进行正规培训。,7 监督工作的焦点在于帮助职员把工作做得更好。,8 通过倡导双向沟通,消除各种惧怕。,9 打破部门间的障碍,提倡通过跨部门的工作小组解决问题。,10 减少以至消除那些并不指明改进和实现目标方法的数字目标、标语和口号。,11 减少以至消除会影响质量的武断的定额。,12 消除有碍于职员工作自豪的各种障碍。,13 实现终身教育、培训和自我改进的正规的有活力的项目。,14 引导职员为实现上述各条而努力工作。,有许多应用TQM后获得成功的实例。例如,在广岛的日本钢铁厂(Japan Steel Works),实施TQM后,在人员数量减少20%的情况下,产量增长50%,同时,残次品费用由占销售额的1.57%下降到0.4%。美国福特公司实施TQM后,减少了保修期内实际修理次数45%,根据用户调查,故障减少了50%。惠普公司实施TQM后,劳动生产率提高了40%,同时,在集成电路环节减少质量差错89%,在焊接环节减少质量差错98%,在最后组装环节减少质量差错93%。,统计抽样与检验方法,假设检验:,对总体的某种认识是否得到样本数据的支持。,检验的步骤:,定义一个关于实际情况的简明、准确的表述(假设)。,从总体中取出一个样本。,检验这个样本,看一看它是支持假设,还是证明假设不大可能。,如果证明假设情况是不大可能的,拒绝这一假设,否则,接受这一假设。,实例:,一种佐料装在包装盒中,名义重量为400克。实际重量与这一名义重量可能略有出入,呈正态分布,标准差为20克。通过在生产线上定期抽取样本的方法确保重量均值为400克。一个作为样本抽出的盒子中佐料重量为446克。这能说明现在佐料填装过量了吗?,统计抽样与检验方法,假设检验的误差(增大样本,减少误差),原假设实际上是,对的 错的,不拒绝 正确的决策 第二类错误,拒 绝 第一类错误 正确的决策,决 策,统计抽样与检验方法,实例:,据说,某行业从业人员平均工资为每周300英镑,标准差为60英镑。有人认为这一数据已经过时了,为检验实际情况究竟如何,一个36份工资的随机样本从该行业中抽取出来。研究确定如果样本工资均值小于270英镑或大于330英镑,就拒绝原假设。犯一类错误的概率有多大?,统计抽样与检验方法,显著水平:,是根据观察值证明样本是取自某一假设总体,的最低可接受概率。(5%),0.95,5%,0.025(,拒绝),(,拒绝)0.025,接受假设,统计抽样与检验方法,假设检验的步骤:,表述原假设和备选假设。,确定拟采用的显著性水平。,计算待检验变量的可接受范围。,取得待检验变量的样本值。,决定是否拒绝原假设。,说明结论。,统计抽样与检验方法,实例:,某地区公布的人均收入为15,000英镑。一个45人的样本的平均收入是14,300英镑,标准差为2000英镑。按照5%的显著性水平检验公布的数字。按1%的显著性水平检验结果又如何?,统计抽样与检验方法,(a),双边检验 (b)单边检验,f(x),x,f(x),0.025,0.025,-1.96,-,-1.96,-,0.05,x,-1.64,-,统计抽样与检验方法,实例:,一个邮递公司对某客户按平均每份邮件1.75公斤,标准差为0.5公斤的情况确定每份邮件的收费水平。邮费现在很高,而有人提出该客户邮件重量均值不止1.75公斤。随机抽取该客户100份邮件的样本,平均重量为1.86公斤。这是否说明重量均值确实已超过1.75公斤?,f(x),x,1.75 1.83 1.86,1%,5%,5%显著性,1%显著性,2.33,1.64,基础运筹学(OR Software),线性规划 运输问题 存 贮 论,整数规划 指派问题 决策分析,0-1 规划 非线性规划 对 策 论,动态规划 目标规划 排 队 论,预 测 模 拟 排 序 论,基础运筹学(OR Software),运筹学软件,1)Excel 2000 (Optimization option);,2)Lindo or Lingo package;,3)Cplex;,4)CUTE,LANCLOT for research;,5)ERP;,6)教学软件;,7)其他。,数据挖掘技术(Data-mining),数据挖掘:,构造和使用数据仓库的过程。,数据仓库,达到不同层次用户,可需的最详细的有,用数据、信息,(1)使公司取得更大的市场,(2)更好的形象,(3)更强的竞争力等,数据挖掘技术,过程,数据挖掘技术(Data-mining),数据挖掘过程,业务数据,提取、滤液、清除、聚集,统计学、心理学、叠加数据,数据库装入程序,数据仓库,RDBMS,数据提取用于数据挖掘,数据挖掘技术(Data-mining),数据挖掘中的数据及信息流,数据提取用于数据挖掘,结合规则,生成简要表,其它数据挖掘,供业务决策的信息,数据挖掘技术(Data-mining),数据挖掘的有关技术,(1)统计分析系统(SAS,SPSS),(2)DSS,EIS,ES,(3)多维电子表格及数据库,(4)神经网络,(5)数据可视化,数据挖掘技术(Data-mining),数据挖掘的应用,商品销售,制造,金融服务/信用卡,远程通信,数据库,
展开阅读全文