资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,4,数据的数字特征,Datas characteristic,4 数据的数字特征,复习回顾,利用统计图表可以显示样本数据的特征,统计图,条形统计图,折线统计图,扇形统计图,茎叶图,复习回顾利用统计图表可以显示样本数据的特征统计图条形统计图折,数据的特征除了利用统计图表外,还可以利用一些统计量(多个数据“加工”为一个数值)来表述,使这个数值能反映这组数据的某些重要的整体特征。前面我们在表示数据的集中趋势和离散程度时,我们利用平均数、中位数,众数、极差、方差等来表示。,数据的特征除了利用统计图表外,还可以利用一些统,就是一组数据的,平均,,设有,n,个数据,,x,1,x,2,x,n,这组数据的平均数为:,特别地,如果上面,n,个数据中不同数据,x,1,,,x,2,,,,,x,n,的个数分别为,k,1,,,k,2,,,,,k,n,,那么它们的平均数为,常用的特征数,一、复习:,1,、平均数:,就是一组数据的平均,设有n个数据,x1,x2,就是一组数据按照,从小到大,或,从大到小,的顺序进行排列时,处于,中间位置,的数,(,或中间两数的平均数,),称为这组数据的中位数,奇数,个数时,中间那,1,个,偶数,个数时,中间那两个的平均数,就是一组数据中出现次数最多的数,2,、中位数:,3,、众数:,平均数、中位数或众数,反映数据的,集中趋势,就是一组数据按照从小到大或从大到小的顺序进行排,就是一组数据中最大数与最小数之间的差,就是一组数据中所有数与平均数的,差的平方和,的,平均数,设有,n,个数据,x,1,,,x,2,,,,,x,n,,,这组数据的方差为:,4,、极差:,5,、方差:,极差,和,方差,反映数据的,离散程度,就是一组数据中最大数与最小数之间的差 就是一,(1),分别计算该公司员工月工资的平均数、中位数和众数。,(2),公司经理会选取上面哪个来代表该公司员工的月工资情况,税务官呢?工会领导呢?,分析:,1.,根据平均数、中位数的计算公式,可以算出平均数为:,1373,元,中位数为:,800,元,众数为:,700,元,2.,不同身份的人代表不同阶层人的利益,对公司领导平均数好,对税务官中位数比较好,对工会领导众数即使他的选择,例,1,某公司员工的月工资情况如表:,(1)分别计算该公司员工月工资的平均数、中位数和众数。分析:,如果你应聘该公司,你怎样看待公司员工的收入情况?,平均数,是将,所有,的数据都考虑进去得到的度量,它是反映数据,集中趋势,最常用的统计量;,中位数,将观测数据,分成,相同数目的,两部分,,其中一部分都比这个数小而另一部分都比这个数大,对于非对称的数据集,中位数更实际地描述了数据的中心;当变量是,分类,变量时,,众数,往往经常被使用,如果你应聘该公司,你怎样看待公司员工的收入情况?平均数是将所,例,2,、在上一节中,从甲乙两个城市随机抽取的,16,台自动售货机的销售额可以用茎叶图表示如下,8 6 5,8 8 4 0 0,7 5 2,0 0,3 1,8,0,1,2,3,4,5,0 2 8,0 2 3 3 7,1 2 4 4 8,2 3 8,甲 乙,1,甲乙两组数据的中位数众数极差分别是多少?,2,你能从上图中分别比较甲乙两组数据的平均数和方差的大小吗?,甲的中位数:,20,众数:,10 18 30,极差:,53,乙的中位数:,29,众数:,23 34,极差:,38,甲的平均数:,22.8,方差:,210.9,乙的平均数:,28.6,方差:,115.2,例2、在上一节中,从甲乙两个城市随机抽取的16台自动售,例,3,、甲乙两台机床同时生产直径为,40mm,的零件,为了检验产品的质量,从两台机床生产的产品中个抽取,10,件进行测量,结果如下:,你能选择适当的数分别表示这两组数据吗?,例3、甲乙两台机床同时生产直径为40mm的零件,为了检验产,方法,1(,极差,),甲:,40.2-39.8,0.4,乙:,40.1-39.9,0.2,方法,2(,方差,),甲:,0.026(m,),乙,0.006(m,),它们的平均数都是,40,,因此仅用平均水平还难以准确地刻画一组数据,方法1(极差)方法2(方差)0.026(m)乙0.00,方法,3,甲,乙,方法3甲乙,方法,4,甲,乙,方法4甲乙,用不同的方式刻画数据离散程度,其理想的形式满足一下三条:,1,应充分利用数据,以便提供更确却的信息,2,仅用一个数据来刻画数据的离散程度,3,对于不同的数据,当离散程度大时,,该数亦大,用不同的方式刻画数据离散程度,其理想的形式满足一下三条:1,问题这么多方式都可以表达,那么什么方式表达最好呢?,方法,1(,即极差,),因为极差对极值过于敏感,显然不满足第一条原则。,方法,4,、满足理想形式的三条原则,它也是刻画数据离散程度的一种方法。但运算量大。,方法,2,(即方差)满足理想形式的三条原则,它是刻画数据离散程度的一种方法,但是它的单位是原观测数据的单位的平方。,所以在实际中,人们更多使用的是,标准差,方法,3,(即绝对差)满足理想形式的三条原则,它也是刻画数据离散程度的一种方法。,问题这么多方式都可以表达,那么什么方式表达最好呢?方法1(即,二、标准差,1,、方差的正的平方根,2,、公式:,3,、优点:,(,1,)、从数学上来说,二次函数的性质比绝对值函数要好;,(,2,)、单位一致;,(,3,)、比较方便运算。,二、标准差1、方差的正的平方根 2、公式:3、优点:(1,问题,3,分别计算上题中的甲乙车床的标准差?,根据标准差计算公式,甲:,s,0.16,(,mm,),乙:,s,0.077(mm),因为甲的标准差比乙大,因此乙更稳定,问题3 分别计算上题中的甲乙车床的标准差?根据标准差计算公式,注意:,对数据数字特征内容的评价,应当更多地关注对其本身意义的理解和在新情境中的应用,而不是记忆和使用的熟练程度因此,在分析数据的过程中,要理解数据的平均值和标准差在此处的意义,,,再对估计结果作出客观的评判,注意:对数据数字特征内容的评价,应当更多地关注,小结:,1.,众数、中位数、平均数的概念,2.,三种数字特征的优缺点,3.,极差、方差、标准差的概念,4.,如何利用标准差刻画数据的离散程度,?,小结:1.众数、中位数、平均数的概念,1,、,练习,:,P,3,1-,练习,2,、,作业,:,P,3,1,习题,14,第,1,题,1、练习:P31-练习2、作业:P31习题14,
展开阅读全文