抽样与随机数发生器

上传人:san****019 文档编号:20663684 上传时间:2021-04-11 格式:PPT 页数:28 大小:700.01KB
返回 下载 相关 举报
抽样与随机数发生器_第1页
第1页 / 共28页
抽样与随机数发生器_第2页
第2页 / 共28页
抽样与随机数发生器_第3页
第3页 / 共28页
点击查看更多>>
资源描述
EXCEL 2003 统计应用 随机数是服从一定分布规律的,但数与数之间又是完全独 立的数列。随机数最重要的特性是:它所产生的后面的那 个数与前面的那个数毫无关系。产生随机数有多种不同的 方法,这些方法被称为随机数发生器。真正的随机数是使 用 物理现象 产生的:比如掷钱币、 骰子 、转轮、使用 电子 元件 的 噪音 、 核裂变 等等。这样的随机数发生器叫做物理 性随机数发生器,它们的缺点是技术要求比较高。在实际 应用中往往使用 伪随机数 就足够了。这些 数列 是“似乎” 随机的数,实际上它们是通过一个固定的、可以重复的计 算方法产生的。它们并不真正地随机,因为它们实际上是 可以计算出来的,但是它们具有类似于随机数的统计特征。 第三章 抽样与随机数发生器 EXCEL 2003 统计应用 由于调查的只是一个样本,而不是整个总体,因此抽样误差必然 存在。在实际调查中,由于总体均值是未知的,因此不可能知道 抽样误差的大小,但可以对其进行概率说明。 选择合适的抽样方法是控制这类误差的一个重要的方法。也就是 说,能否找出准确显现总体样本特征的抽样结果,很大程度上是 取决于抽样方法选择的合理性。 抽样方法主要有随机抽样法和非随机抽样法,而非随机抽样法又 包括按周期抽样法、主观抽样法等等,本章将介绍随机抽样法和 按周期抽样法这两种方法。 抽样 抽样方法的实现 EXCEL 2003 统计应用 对于给定样本, EXCEL2003的加载项“数据分析”提供了抽样 的基本功能。 依次选择“数据” |“数据分析”命令,弹出如图 2.1所示的“数 据分析”对话框,选择“抽样”选项,单击“确定”按钮,弹出 如图 2.2所示的“抽样”命令对话框。 抽样 抽样方法的实现 EXCEL 2003 统计应用 下面详细介绍图 2.2中“抽样”命令对话框中各项参数的含义: 1“输入”选项组: 该选项组的功能是设定样本来源的相关信息。 ( 1)“输入区域”的空格中要求填写样本来源即总体在 EXCEL 中的区域位置,可以直接输入,也可以单击 按钮,再选定 总体的区域。 ( 2)“标志”的勾选框表示总体是否存在标志,用以区分不同 的抽样结果。在某些情况下,需要用到多个抽样数据组,此时需 要用样本中的某些数据对每个抽样数据组进行标志,或者说命名, 以方便进一步应用。一般而言,数据标志存在于数据区域的首行 或首列,换言之,如果输入区域的第一行或第一列中包含标志, 就勾选此框,否则不选。 抽样 抽样方法的实现 EXCEL 2003 统计应用 2“抽样方法”选项组: 该选项组的功能是选择抽样方法,有“周期”和“随机”两个选项, 分别代表按周期抽样法和随机抽样法两种方法,详细介绍分别见 2.1.2和 2.1.3。 3“输出选项”选项组: 该选项组的功能是设定抽样结果的生成位置,有三个选项。 ( 1)若选择“输出区域”选项,并且在其后的空格中直接输入,或者 单击 按钮再选定区域,则抽样结果会与总体数据出现在同一个工作 表中。 ( 2)若选择“新工作表组”选项,并且在其后的空格中输入新建的工 作表名称,则抽样结果会出现在新建的工作表中。 ( 3)若选择“新工作簿”选项,则抽样结果会出现在新的工作簿中。 而后,单击确定,便可得到抽样结果。 抽样 抽样方法的实现 EXCEL 2003 统计应用 有时总体数据本身呈现一定的周期循环特征,如铁路的月客流量, 每年的暑假和春节前后都会出现波峰,再如月降水量,我国大部 分地区夏季 78月出现高峰,冬季 12月出现谷底。此时,随机抽 样法会破坏样本的周期性,导致总体样本信息缺失,也就无法准 确分析总体样本的特征。而周期抽样法是按照周期值来选择抽样 单位的固定间隔,然后按照这个固定间隔来抽取样本,使得选取 的抽样单位也具有了周期区间的性质,因此保留了总体样本的周 期性,是一种非常适合于周期循环性总体样本的抽样方法。 抽样 按周期抽样 EXCEL 2003 统计应用 下面我们通过实验 2-1来介绍使用 EXCEL2003对已知总体样本采用 按周期抽样法进行抽样的操作。 实验 2-1:图 2.3是 1990年 1月至 2008年 12月全国的月发电量数据, 单位是亿千瓦小时。要求:采用 按周期抽样法从中抽取样本。 一般来说,由于节假日原因,每 年的 1月或 2月,即春节前后发电 量达到最低,而在 1012月发电量 达到高峰,因此,月发电量有着 明显的周期循环性质,所以我们 应当采用按周期抽样法来抽取样 本。 抽样 按周期抽样 EXCEL 2003 统计应用 具体步骤如下: ( 1)依次选择“工具 ”|“数据分析”命令,弹出 “数据分析”对话框,选择“抽样”选项,单击“确 定”按钮,弹出如图 2.2所示的“抽样”命令对话框。 ( 2)在“输入区域”空格内填写数据区域 “ $B$2:$B$229”(或者直接选取);此例中输入区 域的第一行和第一列并无标记,因此空选“标志”勾 选框;在“抽样方法”一栏中,选择“周期”选项, “周期”代表总体数据的循环周期,由于是发电量的 月度数据,以一年为周期,即周期是 12,所以“间隔” 空格填“ 12”;“输出选项”有三种选择,可以根据 实际需要进行相应选择,我们不妨选择“新工作表组” 选项,并在“输出区域”的空格中填写输出的区域位 置,这个位置也可以自由挑选,我们不妨设 “ sheet4”,得到如图 2.4所示的抽样结果。 抽样 按周期抽样 EXCEL 2003 统计应用 随机抽样是最为常用的抽样方法。它从一个容量为 N的有限总体 中抽取得到一个容量为 n的简单随机样本,并且每一个容量为 n的 可能样本,都有相同的概率被抽中。 用简单随机抽样进行抽样调查,首先应建立一个抽样框,即抽样 总体中所有个体的名册;然后根据随机数表进行抽样。使用随机 数表,可以保证抽样总体中的每个个体都有相同的概率被抽中。 由于随机抽样不受主观因素影响,抽样的平均误差最小,能够更 好地反映总体的特征。 抽样 随机抽样 EXCEL 2003 统计应用 下面我们通过实验 2-2来 介绍使用 EXCEL2003对 已知总体样本采用按周 期抽样法进行抽样的操 作。 实验 2-2:图 2.5是 2003年 我国内地 266个地级市 (部分地区没有数据, 故没有列出)的国内生 产总值增长率,单位是 %,要求:采用随机抽 取法从中抽取 50个样本。 抽样 随机抽样 EXCEL 2003 统计应用 具体步骤如下: ( 1)依次选择“工具” |“数据分析”命令,弹出 “数据分析”对话框,选择“抽样”选项,单击 “确定”按钮,弹出如图 2.2所示的“抽样”命令对 话框。 ( 2)在“输入区域”空格内填写数据区域 “ $B$2:$B$267”(或者直接选取);此例中输入 区域的第一行和第一列并无标记,因此空选“标志” 勾选框;在“抽样方法”一栏中,选择“随机”选 项,“样本数”代表抽取样本的容量,此处要求抽 取 50个样本,所以“样本数”空格填“ 50”;“输 出选项”有三种选择,可以根据实际需要进行相应 选择,我们不妨选择“新工作表组”选项,并在 “输出区域”的空格中填写输出的区域位置,这个 位置也可以自由挑选,我们不妨设“ sheet4”,得 到如图 2.6所示的抽样结果。 抽样 随机抽样 EXCEL 2003 统计应用 EXCEL2003的加载项“数据分析”中的“随机数发生器”提供 了随机数产生的功能。 依次选择“工具” |“数据分析”命令,弹出如图 2.1所示的“数 据分析”对话框,选择“随机数发生器”选项,单击“确定”按 钮,弹出如图 2.2所示的“随机数发生器”命令对话框。 随机数发生器 随机数发生器的实现 EXCEL 2003 统计应用 下面详细介绍图 2.7中“随机数发生器”命令对话框中各项参数的含义: 1“变量个数”选项组: 该选项组的功能是设定随机数列的列数,亦即随机数列的宽度,其大 小由实际需要决定。 2“随机数个数”选项组: 该选项组的功能是设定每一列随机数的个数,亦即随机数列的长度, 其大小一般由研究对象的要求决定。 3“分布”选项组: 该选项组的功能是选择生成随机数所服从的概率分布。有“均匀”、 “正态”、“伯努利”、“二项式”、“泊松”、“模式”和“离散” 七个选项,分别代表均匀分布随机数、正态分布随机数、伯努利分布 随机数、二项分布随机数、模式分布随机数和离散分布随机数,由于 模式分布随机数和离散分布随机数应用较少,所以本章主要介绍前五 种分布随机数,详细介绍分别见 2.2.22.2.6。 随机数发生器 随机数发生器的实现 EXCEL 2003 统计应用 4“参数”选项组: 该选项组的功能是设定在选定随机数分布类型之后的相关参数,详细介绍 分别见 2.2.22.2.6。 5“随机数基数”选项组: 该选项组的功能是用来构造随机数的可选数值,可在以后重新使用该数值 来生成相同的随机数。如果题目没有特别要求,一般不做设置。 6“输出选项”选项组: 该选项组的功能是设定随机数生成结果的生成位置,有三个选项。 ( 1)若选择“输出区域”选项,并且在其后的空格中直接输入,或者单击 按钮再选定区域,则随机数生成结果会与总体数据出现在同一个工作表中。 ( 2)若选择“新工作表组”选项,并且在其后的空格中输入新建的工作表 名称,则随机数生成结果会出现在新建的工作表中。 ( 3)若选择“新工作簿”选项,则随机数生成结果会出现在新的工作簿中。 而后,单击“确定”按钮,便可得到随机数生成结果。 随机数发生器 随机数发生器的实现 EXCEL 2003 统计应用 均匀分布是一种非常简单的概率分布,它是指随机事件在一个区 间内取任何值的概率都相等。 用数学语言表达为:若 ,即 服从参数为 和 的均匀分布,那么: EXCEL2003的“随机数发生器”命令可以帮助我们完成均匀分 布随机数的生成。 随机数发生器 均匀分布随机数 1 () 0 a x bP X x ba 其 它 EXCEL 2003 统计应用 具体步骤如下: ( 1)在图 2.7中“分布”选项组的下拉菜单中选择“均匀”选项; 如图 2.8,“参数”一栏中,第一个空是均匀分布区间的起点,第 二个空是均匀分布区间的终点,即依次输入“ ”和“ ”。例如 生成 0,1区间的均匀分布随机数,这两个空就分别输入“ 0”和 “ 1”。 ( 2)其他参数设置见 2.2.1。 而后,单击“确定”按钮,便可得到均匀分布随机数生成结果。 随机数发生器 均匀分布随机数 EXCEL 2003 统计应用 正态分布是最普遍的概率分布,它是指随机事件呈两端对称收敛 的特点。 用数学语言表达为:若 ,即 服从参数为 和 的 正态分布,那么: 我们可以利用 EXCEL2003的“随机数发生器”命令实现正态分 布随机数的生成。 随机数发生器 正态分布随机数 ( , )XN 2 2 () 21() 2 x P X x e EXCEL 2003 统计应用 具体步骤如下: ( 1)在图 2.7中“分布”选项组的下拉菜单中选择“正态”选项; 如图 2.9,“参数”一栏中,第一个空是正态分布的平均值,第二 个空是正态分布的标准偏差,即依次输入“ ”和“ ”。例如生 成服从 N(0,1)的正态分布随机数,这两个空就分别输入“ 0”和 “ 1”。 ( 2)其他参数设置见 2.2.1。 而后,单击“确定”按钮,便可得到正态分布随机数生成结果。 随机数发生器 正态分布随机数 EXCEL 2003 统计应用 伯努利分布是较简单的分布,也叫两点分布,它是指某一次随机 事件只具有两种互斥的结果。当伯努利试验成功,令伯努利随机 变量为 1。若伯努利试验失败,令伯努利随机变量为 0。 用数学语言表达为:若 服从参数为 的伯努利分布,那么: EXCEL2003的“随机数发生器”命令可以生成伯努利分布随机数。 随机数发生器 伯努利分布随机数 1() 10pxP X x px 1() 10 pxP X x px EXCEL 2003 统计应用 具体步骤如下: ( 1)在图 2.7中“分布”选项组的下拉菜单中选择“伯努利”选项; 如图 2.10,“参数”一栏中,“ p(A)”后的空是伯努利分布的概 率值,即输入“ ”。例如生成服从概率参数为 0.3的伯努利分布 随机数,这个空就输入“ 0.3”。 ( 2)其他参数设置见 2.2.1。 而后,单击“确定”按钮,便可得到伯努利分布随机数生成结果。 随机数发生器 伯努利分布随机数 EXCEL 2003 统计应用 二项分布是常用分布之一,它是指随机事件只具有两种互斥的结 果,并且这种事件是多次的。 用数学语言表达为:若 ,即 服从参数为 和 的二项分布,那么: , 其中 二项分布随机数的生成可以通过 EXCEL2003的“随机数发生器” 命令来实现。 随机数发生器 二项分布随机数 ( ) (1 )x n xnP X x p px 0 ,1, .,xn !( ) !n nx x n x EXCEL 2003 统计应用 具体步骤如下: ( 1)在图 2.7中“分布”选项组 的下拉菜单中选择“二项式”选 项;如图 2.11,“参数”一栏中, “ p(A)”后的空是二项分布的概 率值,“试验次数”后的空是二 项分布的试验次数,即依次输入 “ ”和“ ”。例如生成服从概 率参数为 0.2和试验次数为 20的 二项分布随机数,这两个空就依 次输入“ 0.2”和“ 20”。 ( 2)其他参数设置见 2.2.1。 而后,单击“确定”按钮,便可 得到二项分布随机数生成结果。 随机数发生器 二项分布随机数 EXCEL 2003 统计应用 泊松分布更多地专用于研究单位时间、单位人群、单位空间内, 某罕见事件发生次数的概率。 用数学语言表达为:若 ,即 服从参数为 的泊松分布,那么: EXCEL2003提供了“随机数发生器”命令,这个命令可以用来 生成泊松分布随机数。 随机数发生器 泊松分布随机数 () ! xeP X x x 0 ,1, 2 , .x EXCEL 2003 统计应用 具体步骤如下: ( 1)在图 2.7中“分布”选项组 的下拉菜单中选择“泊松”选项; 如图 2.12,“参数”一栏中, “ (L)”后的空是泊松分布的参 数值,即输入“ ”。例如生成 服从泊松分布 P(6)的随机数,这 个空就输入“ 6”。 ( 2)其他参数设置见 2.2.1。 而后,单击“确定”按钮,便可 得到泊松分布随机数生成结果。 随机数发生器 泊松分布随机数 EXCEL 2003 统计应用 在 EXCEL2003中,“ RAND”命令是指“返回大于等于 0及小于 1 的均匀分布随机实数”,指的是这个命令可以生成区间 0,1)内任 意一个数,并且这种数在区间 0,1)内取各值的概率相等,即 0,1) 区间的随机实数。 “ RAND”的格式公式为: RAND()*(b-a)+a 生成 a与 b之间的随机实数。 下面我们通过实验 2-3来介绍利用“ RAND”来生成某个区间随机 实数的操作步骤。 随机数产生的函数实现 生成某个区间的随机实数 EXCEL 2003 统计应用 实验 2-3:生成一列( 15个)随机实数,使 得这列随机整数都落在区间 0.5,10)内。 具体步骤如下: ( 1)新建一个 EXCEL,在单元格 A2A15 中依次输入 a1a15,表示随机整数列。 ( 2)在单元格 B2中输入“ =RAND()*(10- 0.5)+0.5”,按下“ ENTER”键。然后选中 单元格 B2,并按住鼠标左键向下拖拽至 B16, 得到如图 2.13所示的结果。由于这是随机整 数命令,所以每次生成的数可能都不一样, 所以图 2.13仅为参考。 图 2.13所示结果即为区间 0.5,10)内的随机实 数,可以看到,所有的数都大于等于 0.5, 小于 10。 随机数产生的函数实现 生成某个区间的随机实数 EXCEL 2003 统计应用 在 EXCEL2003中,“ RANDBETWEEN”命令是指“返回位于指定 的两个数之间的一个随机整数”,指的是这个命令可以生成区间 a,b 内任意一个整数,并且这种整数在区间 a,b内取各整值的概率相等, 即 a,b区间的随机整数。 “ RANDBETWEEN”的格式公式为: RANDBETWEEN (a,b) 生成 a与 b之间的随机整数,若 a(或 b)为整数时,结果可能也会出现 a(或 b)。 下面我们通过实验 2-4来介绍利用“ RAND”来生成某个区间随机整数 的操作步骤。 随机数产生的函数实现 生成某个区间的随机整数 EXCEL 2003 统计应用 实验 2-4:生成一列( 15个)随机整数,使 得这列随机整数都落在区间 0.5,10内。 具体步骤如下: ( 1)新建一个 EXCEL,在单元格 A2A15 中依次输入 a1a15,表示随机数列。 ( 2)在单元格 B2中输入 “ =RANDBETWEEN (0.5, 10)”,按下 “ ENTER”键。然后选中单元格 B2,并按 住鼠标左键向下拖拽至 B16,得到如图 2.14 所示的结果。由于这是随机整数命令,所 以每次生成的整数可能都不一样,所以图 2.14仅为参考。 图 2.14所示结果即为区间 0.5,10内的随机整 数,可以看到,所有的数都大于 0.5,小于 等于 10。 随机数产生的函数实现 生成某个区间的随机整数
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!