概率论浙大内部课件.ppt

上传人:xt****7 文档编号:6218805 上传时间:2020-02-19 格式:PPT 页数:285 大小:8MB
返回 下载 相关 举报
概率论浙大内部课件.ppt_第1页
第1页 / 共285页
概率论浙大内部课件.ppt_第2页
第2页 / 共285页
概率论浙大内部课件.ppt_第3页
第3页 / 共285页
点击查看更多>>
资源描述
2020 2 19 1 概率论与数理统计 2 概率论与数理统计是研究随机现象数量规律的一门学科 3 概率统计 是高等院校理工类的重要课程之一 在考研数学中的比重大约占22 左右 概率论与数理统计是数学的一个有特色且又十分活跃的分支 一方面 它有别开生面的研究课题 有自己独特的概念和方法 内容丰富 结果深刻 另一方面 它与其他学科又有紧密的联系 是近代数学的重要组成部分 由于它近年来突飞猛进的发展与应用的广泛性 目前已发展成为一门独立的一级学科 4 概率论学科历史 概率 指一种不确定的情况出现可能性的大小 起源于中世纪以来的欧洲流行的用骰子赌博 分赌本问题 甲 乙二人赌博 各出赌注30元 共60元 每局甲 乙胜的机会均等 都是1 2 约定 谁先胜满3局则他赢得全部赌注60元 现已赌完3局 甲2胜1负 而因故中断赌情 问这60元赌注该如何分给2人 才算公平 帕斯卡和费尔马建立了概率论的一个基本概念 数学期望 惠更斯1657年将自己的研究成果写成了专著 论掷骰子游戏中的计算 在他们之后 对概率论这一学科做出贡献的是瑞士数学家族 贝努利家族的几位成员 雅可布 贝努利在前人研究的基础上 证明了被称为 大数定律 的一个定理 这是研究等可能性事件的古典概率论中的极其重要的结果 5 随着18 19世纪科学的发展 人们注意到某些生物 物理和社会现象与机会游戏相似 从而由机会游戏起源的概率论被应用到这些领域中 同时也大大推动了概率论本身的发展 法国数学家拉普拉斯将古典概率论向近代概率论进行推进 他首先明确给出了概率的古典定义 并在概率论中引入了更有力的数学分析工具 将概率论推向一个新的发展阶段 他还证明了 煤莫弗 拉普拉斯定理 拉普拉斯于1812年出版了他的著作 分析的概率理论 这是一部继往开来的作品 这时候人们最想知道的就是概率论是否会有更大的应用价值 是否能有更大的发展成为严谨的学科概率论在20世纪再度迅速地发展起来 则是由于科学技术发展的迫切需要而产生的 1906年 俄国数学家马尔科夫提出了所谓 马尔科夫链 的数学模型 1934年 前苏联数学家辛钦又提出一种在时间中均匀进行着的平稳过程理论 6 20世纪初完成的勒贝格测度与积分理论及随后发展的抽象测度和积分理论 为概率公理体系的建立奠定了基础 在这种背景下柯尔莫哥洛夫1933年在他的 概率论基础 一书中首次给出了概率的测度论式定义和一套严密的公理体系 他的公理化方法成为现代概率论的基础 使概率论成为严谨的数学分支 7 数理统计学科历史 统计学起源于收集数据的活动 现今各国都设有统计局或相当的机构 当然 单是收集 记录数据这种活动本身并不能等同于统计学这门科学的建立 需要对收集来的数据进行排比 整理 用精炼和醒目的形式表达 在这个基础上对所研究的事物进行定量或定性估计 描述和解释 并预测其在未来可能的发展状况 例如根据人口普查或抽样调查的资料对我国人口状况进行描述 根据适当的抽样调查结果 对受教育年限与收入的关系 对某种生活习惯与嗜好 如吸烟 与健康的关系作定量的评估 根据以往一般时间某项或某些经济指标的变化情况 预测其在未来一般时间的走向等 做这些事情的理论与方法 才能构成一门学问 数理统计学的内容 8 一种受到某些著名学者支持的观点认为 英国学者葛朗特在1662年发表的著作 关于死亡公报的自然和政治观察 标志着这门学科的诞生 数理统计学的另一个重要源头来自天文和测地学中的误差分析问题 人们希望通过多次量测获取更多的数据 以便得到对量测对象的精度更高的估计值 量测误差有随机性 适合于用概率论即统计的方法处理 远至伽利略就做过这方面的工作 他对测量误差的性态作了一般性的描述 法国大数学家拉普拉斯曾对这个问题进行了长时间的研究 现今概率论中著名的 拉普拉斯分布 即是他在这研究中的一个产物 这方面最著名且影响深远的研究成果有二 一是法国数学家兼天文家勒让德19世纪初 1805 与德国大学者高斯发明的 最小二乘法 另外一个重要成果是高斯1809年在研究行星绕日运动时提出用正态分布刻画测量误差的分布 正态分布也常称为高斯分布 9 正态分布在数理统计学中占有极重要的地位 现今仍在常用的许多统计方法 就是建立在 所研究的量具有或近似地具有正态分布 这个假定的基础上 而经验和理论 概率论中所谓 中心极限定理 都表明这个假定的现实性 现实世界许多现象看来是杂乱无章的 如不同的人有不同的身高 体重 大批生产的产品 其质量指标各有差异 看来毫无规则 但它们在总体上服从正态分布 这一点 显示在纷乱中有一种秩序存在 提出正态分布的高斯 一生在多个领域里面有不少重大的贡献 但在德国10马克的有高斯图像的钞票上 单只画出了正态曲线 以此可以看出人们对他这一贡献评价之高 10 20世纪以前数理统计学发展的一个重要成果 是19世纪后期由英国遗传学家兼统计学家高尔顿发起 并经现代统计学的奠基人之一K 皮尔逊和其他一些英国学者所发展的统计相关与回归理论 所谓统计相关 是指一种非决定性的关系如人的身高X与体重Y 存在一种大致的关系 表现在X大 小 时 Y也倾向于大 小 但非决定性的 由X并不能决定Y 现实生活中和各种科技领域中 这种例子很多 如受教育年限与收入的关系 经济发展水平与人口增长速度的关系等 都是属于这种性质 统计相关的理论把这种关系的程度加以量化 而统计回归则是把有统计相关的变量 如上文的身高X和体重Y的关系的形式作近似的估计 称为回归方程 现实世界中的现象往往涉及众多变量 它们之间有错综复杂的关系 且许多属于非决定性质 相关回归理论的发明 提供了一种通过实际观察去对这种关系进行定量研究的工具 有着重大的认识和实用意义 11 这门学科的理论框架在20世纪上半叶得以完成 狭义一点说可界定在1921 1938年 起主要作用的是几位大师级的人物 特别是英国的费歇尔 K 皮尔逊 发展统计假设检验理论的奈曼与E 皮尔逊和提出统计决策函数理论的瓦尔德等 我国已故著名统计学家许宝 1910 1970 在这项工作中也卓有建树 自二战结束迄今 数理统计学有了迅猛的发展 主要有以下三方面的原因 一是数理统计学理论框架的建立以及概率论和数学工具的进展 为统计理论的发展打开了门径和提供了手段 许多理论和方法得到了完善与深入 并不断提出新的研究课题 二是实用上的需要 不断提出了复杂的问题与模型 吸引了学者们的研究兴趣 三是电子计算机的发明与普及应用 一方面提供了必要的计算工具 统计方法的实施往往涉及大量数据的处理与运算 用人力无法在合理的时间内完成 所以在早年 一些统计方法人们虽然知道 但很少付诸实用 就因为是人力所难及 计算机的出现解决了这个问题 同时 计算机对促进统计理论研究也有助益 统计模拟是其表现之一 12 概率论与数理统计的应用 概率论与以它作为基础的数理统计学科一起 在自然科学 社会科学 工程技术 军事科学及工农业生产等诸多领域中都起着不可或缺的作用 直观地说 卫星上天 导弹巡航 飞机制造 宇宙飞船遨游太空等都有概率论的一份功劳 及时准确的天气预报 海洋探险 考古研究等更离不开概率论与数理统计 电子技术发展 影视文化的进步 人口普查及教育等同概率论与数理统计也是密不可分的 根据概率论中用投针试验估计 值的思想产生的蒙特卡罗方法 是一种建立在概率论与数理统计基础上的计算方法 借助于电子计算机这一工具 使这种方法在核物理 表面物理 电子学 生物学 高分子化学等学科的研究中起着重要的作用 13 怎样学 概率论与数理统计 学习过程中要抓住对概念的引入和背景的理解 要紧扣它的实际背景 理解统计方法的直观含义 对于引入概念的内涵和相互间的联系和差异要仔细推敲 在解题过程中不要为解题而解题 而应理解题目所涉及的概念及解题的目的 而要把精力放在理解不同题型涉及的概念及解题的思路上去 14 概率论 15 关键词 样本空间随机事件频率和概率条件概率事件的独立性 第一章概率论的基本概念 16 1随机试验 确定性现象 结果确定不确定性现象 结果不确定 确定 不确定 不确定 自然界与社会生活中的两类现象 例 向上抛出的物体会掉落到地上 明天天气状况 买了彩票会中奖 17 概率统计中研究的对象 随机现象的数量规律 对随机现象的观察 记录 试验统称为随机试验 它具有以下特性 可以在相同条件下重复进行事先知道可能出现的结果进行试验前并不知道哪个试验结果会发生 例 抛一枚硬币 观察试验结果 对某路公交车某停靠站登记下车人数 对某批电子产品测试其输入电压 对听课人数进行一次登记 18 2样本空间 随机事件 一 样本空间定义 随机试验E的所有结果构成的集合称为E的样本空间 记为S e 称S中的元素e为基本事件或样本点 S 0 1 2 S 正面 反面 S x y T0 y x T1 S x a x b 记录一城市一日中发生交通事故次数 例 一枚硬币抛一次 记录某地一昼夜最高温度x 最低温度y 记录一批产品的寿命x 19 二 随机事件一般我们称S的子集A为E的随机事件A 当且仅当A所包含的一个样本点发生称事件A发生 S 0 1 2 记A 至少有10人候车 10 11 12 S A为随机事件 A可能发生 也可能不发生 例 观察89路公交车浙大站候车人数 如果将S亦视作事件 则每次试验S总是发生 故又称S为必然事件 为方便起见 记 为不可能事件 不包含任何样本点 20 三 事件的关系及运算事件的关系 包含 相等 例 记A 明天天晴 B 明天无雨 记A 至少有10人候车 B 至少有5人候车 一枚硬币抛两次 A 第一次是正面 B 至少有一次正面 21 事件的运算 A与B的和事件 记为 A与B的积事件 记为 当AB 时 称事件A与B不相容的 或互斥的 22 和 交 关系式 例 设A 甲来听课 B 乙来听课 则 甲 乙至少有一人来 甲 乙都来 甲 乙都不来 甲 乙至少有一人不来 23 3频率与概率 一 频率定义 记其中 A发生的次数 频数 n 总试验次数 称为A在这n次试验中发生的频率 例 中国国家足球队 冲击亚洲 共进行了n次 其中成功了一次 则在这n次试验中 冲击亚洲 这事件发生的频率为某人一共听了17次 概率统计 课 其中有15次迟到 记A 听课迟到 则 频率反映了事件A发生的频繁程度 表1 例 抛硬币出现的正面的频率 25 表2 26 频率的性质 且随n的增大渐趋稳定 记稳定值为p 27 二 概率定义1 的稳定值p定义为A的概率 记为P A p定义2 将概率视为测度 且满足 称P A 为事件A的概率 28 性质 29 4等可能概型 古典概型 定义 若试验E满足 S中样本点有限 有限性 出现每一样本点的概率相等 等可能性 称这种试验为等可能概型 或古典概型 30 例1 一袋中有8个球 编号为1 8 其中1 3号为红球 4 8号为黄球 设摸到每一球的可能性相等 从中随机摸一球 记A 摸到红球 求P A 解 S 1 2 8 A 1 2 3 31 例2 从上例的袋中不放回的摸两球 记A 恰是一红一黄 求P A 解 注 当L m或L 0时 记 例3 有N件产品 其中D件是次品 从中不放回的取n件 记Ak 恰有k件次品 求P Ak 解 32 例4 将n个不同的球 投入N个不同的盒中 n N 设每一球落入各盒的概率相同 且各盒可放的球数不限 记A 恰有n个盒子各有一球 求P A 解 即当n 2时 共有N2个样本点 一般地 n个球放入N个盒子中 总样本点数为Nn 使A发生的样本点数 可解析为一个64人的班上 至少有两人在同一天过生日的概率为99 7 若取n 64 N 365 33 例5 一单位有5个员工 一星期共七天 老板让每位员工独立地挑一天休息 求不出现至少有2人在同一天休息的概率 解 将5为员工看成5个不同的球 7天看成7个不同的盒子 记A 无2人在同一天休息 则由上例知 34 例6 抽签问题 一袋中有a个红球 b个白球 记a b n 设每次摸到各球的概率相等 每次从袋中摸一球 不放回地摸n次 设 第k次摸到红球 k 1 2 n 求解1 号球为红球 将n个人也编号为1 2 n 与k无关 可设想将n个球进行编号 其中 视的任一排列为一个样本点 每点出现的概率相等 35 解3 将第k次摸到的球号作为一样本点 原来这不是等可能概型 总样本点数为 每点出现的概率相等 而其中有个样本点使发生 红色 解2 视哪几次摸到红球为一样本点 解4 记第k次摸到的球的颜色为一样本点 S 红色 白色 36 解 假设接待站的接待时间没有规定 而各来访者在一周的任一天中去接待站是等可能的 那么 12次接待来访者都是在周二 周四的概率为212 712 0 0000003 例7 某接待站在某一周曾接待12次来访 已知所有这12次接待都是在周二和周四进行的 问是否可以推断接待时间是有规定的 人们在长期的实践中总结得到 概率很小的事件在一次试验中实际上几乎是不发生的 称之为实际推断原理 现在概率很小的事件在一次试验中竟然发生了 因此有理由怀疑假设的正确性 从而推断接待站不是每天都接待来访者 即认为其接待时间是有规定的 5条件概率 例 有一批产品 其合格率为90 合格品中有95 为优质品 从中任取一件 记A 取到一件合格品 B 取到一件优质品 则P A 90 而P B 85 5 记 P B A 95 P A 0 90是将整批产品记作1时A的测度P B A 0 95是将合格品记作1时B的测度由P B A 的意义 其实可将P A 记为P A S 而这里的S常常省略而已 P A 也可视为条件概率分析 38 一 条件概率定义 由上面讨论知 P B A 应具有概率的所有性质 例如 二 乘法公式当下面的条件概率都有意义时 39 例 某厂生产的产品能直接出厂的概率为70 余下的30 的产品要调试后再定 已知调试后有80 的产品可以出厂 20 的产品要报废 求该厂产品的报废率 利用乘法公式 解 设A 生产的产品要报废 B 生产的产品要调试 已知P B 0 3 P A B 0 2 40 例 某行业进行专业劳动技能考核 一个月安排一次 每人最多参加3次 某人第一次参加能通过的概率为60 如果第一次未通过就去参加第二次 这时能通过的概率为80 如果第二次再未通过 则去参加第三次 此时能通过的概率为90 求这人能通过考核的概率 解 设Ai 这人第i次通过考核 i 1 2 3A 这人通过考核 亦可 41 例 从52张牌中任取2张 采用 1 放回抽样 2 不放回抽样 求恰是 一红一黑 的概率 利用乘法公式 与不相容 1 若为放回抽样 2 若为不放回抽样 解 设Ai 第i次取到红牌 i 1 2B 取2张恰是一红一黑 42 三 全概率公式与Bayes公式 定义 设S为试验E的样本空间 B1 B2 Bn为E的一组事件 若 则称B1 B2 Bn为S的一个划分 或称为一组完备事件组 即 B1 B2 Bn至少有一发生是必然的 两两同时发生又是不可能的 43 定理 设试验E的样本空间为S A为E的事件 B1 B2 Bn为S的一个划分 P Bi 0 i 1 2 n 则称 为全概率公式 证明 定理 接上定理条件 称此式为Bayes公式 44 全概率公式可由以下框图表示 设P Bj pj P A Bj qj j 1 2 n易知 S P1 P2 Pn B2 q2 q1 qn 45 例 一单位有甲 乙两人 已知甲近期出差的概率为80 若甲出差 则乙出差的概率为20 若甲不出差 则乙出差的概率为90 1 求近期乙出差的概率 2 若已知乙近期出差在外 求甲出差的概率 Bayes公式 全概率公式 解 设A 甲出差 B 乙出差 46 例 根据以往的临床记录 某种诊断癌症的试验具有5 的假阳性及5 的假阴性 若设A 试验反应是阳性 C 被诊断患有癌症 则有 已知某一群体P C 0 005 问这种方法能否用于普查 若P C 较大 不妨设P C 0 8推出P C A 0 987说明这种试验方法可在医院用 解 考察P C A 的值 若用于普查 100个阳性病人中被诊断患有癌症的大约有8 7个 所以不宜用于普查 47 6独立性 例 有10件产品 其中8件为正品 2件为次品 从中取2次 每次取1件 设Ai 第i次取到正品 i 1 2 不放回抽样时 放回抽样时 即放回抽样时 A1的发生对A2的发生概率不影响同样 A2的发生对A1的发生概率不影响 定义 设A B为两随机事件 若P B A P B 即P AB P A P B 即P A B P A 时 称A B相互独立 48 注意 49 例 甲 乙两人同时向一目标射击 甲击中率为0 8 乙击中率为0 7 求目标被击中的概率 解 设A 甲击中 B 乙击中 C 目标被击中 甲 乙同时射击 其结果互不影响 A B相互独立 50 例 有4个独立元件构成的系统 如图 设每个元件能正常运行的概率为p 求系统正常运行的概率 注意 这里系统的概念与电路中的系统概念不同 51 52 总结 53 复习思考题1 1 事件A不发生 则A 对吗 试举例证明之 2 两事件A和B为互不相容 即AB 则A和B互逆 对吗 反之成立吗 试举例说明之 4 甲 乙两人同时猜一谜 设A 甲猜中 B 乙猜中 则A B 甲 乙两人至少有1人猜中 若P A 0 7 P B 0 8 则 P A B 0 7 0 8 1 5 对吗 5 满足什么条件的试验问题称为古典概型问题 54 7 如何理解样本点是两两互不相容的 8 设A和B为两随机事件 试举例说明P AB P B A 表示不同的意义 10 什么条件下称两事件A和B相互独立 什么条件下称n个事件A1 A2 An相互独立 11 设A和B为两事件 且P A 0 P B 0 问A和B相互独立 A和B互不相容能否同时成立 试举例说明之 12 设A和B为两事件 且P A a P B b 问 1 当A和B独立时 P A B 为何值 2 当A和B互不相容时 P A B 为何值 55 13 当满足什么条件时称事件组A1 A2 An为样为本空间的一个划分 14 设A B C为三随机事件 当A B 且P A 0 P B 0时 P C A P C B 有意义吗 试举例说明 15 设A B C为三随机事件 且P C 0 问P A B C P A C P B C P AB C 是否成立 若成立 与概率的加法公式比较之 56 第二章随机变量及其分布 关键词 随机变量概率分布函数离散型随机变量连续型随机变量随机变量的函数 57 1随机变量 常见的两类试验结果 X f e 为S上的单值函数 X为实数 中心问题 将试验结果数量化 定义 随试验结果而变的量X为随机变量 常见的两类随机变量 58 2离散型随机变量及其分布 定义 取值可数的随机变量为离散量离散量的概率分布 分布律 概率分布 59 例 某人骑自行车从学校到火车站 一路上要经过3个独立的交通灯 设各灯工作独立 且设各灯为红灯的概率为p 0 p 1 以X表示首次停车时所通过的交通灯数 求X的概率分布律 解 设Ai 第i个灯为红灯 则P Ai p i 1 2 3且A1 A2 A3相互独立 60 例 从生产线上随机抽产品进行检测 设产品的次品率为p 0 p 1 若查到一只次品就得停机检修 设停机时已检测到X只产品 试写出X的概率分布律 解 设Ai 第i次抽到正品 i 1 2 则A1 A2 相互独立 亦称X为服从参数p的几何分布 61 三个主要的离散型随机变量0 1 p 分布二项分布 样本空间中只有两个样本点 即每次试验结果互不影响 在相同条件下重复进行 p q 1 n重贝努利试验 设试验E只有两个可能的结果 p A p 0 p 1 将E独立地重复进行n次 则称这一串重复的独立试验为n重贝努利试验 62 例 1 独立重复地抛n次硬币 每次只有两个可能的结果 正面 反面 如果是不放回抽样呢 2 将一颗骰子抛n次 设A 得到1点 则每次试验只有两个结果 3 从52张牌中有放回地取n次 设A 取到红牌 则每次只有两个结果 63 设A在n重贝努利试验中发生X次 则并称X服从参数为p的二项分布 记 推导 设Ai 第i次A发生 先设n 3 64 例 设有80台同类型设备 各台工作是相互独立的 发生故障的概率都是0 01 且一台设备的故障能有一个人处理 考虑两种配备维修工人的方法 其一是由4个人维护 每人负责20台 其二是由3个人共同维护80台 试比较这两种方法在设备发生故障时不能及时维修的概率的大小 65 66 例 某人骑了自行车从学校到火车站 一路上要经过3个独立的交通灯 设各灯工作独立 且设各灯为红灯的概率为p 0 p 1 以Y表示一路上遇到红灯的次数 1 求Y的概率分布律 2 求恰好遇到2次红灯的概率 解 这是三重贝努利试验 67 例 某人独立射击n次 设每次命中率为p 0 p 1 设命中X次 1 求X的概率分布律 2 求至少有一次命中的概率 解 这是n重贝努利试验 同时可知 上式的意义为 若p较小 p 0 只要n充分大 至少有一次命中的概率很大 即 小概率事件 在大量试验中 至少有一次发生 几乎是必然的 68 例 有一大批产品 其验收方案如下 先作第一次检验 从中任取10件 经检验无次品接受这批产品 次品数大于2拒收 否则作第二次检验 从中任取5件 仅当5件中无次品便接受这批产品 设产品的次品率为p 求这批产品能被接受的概率L p L P P A 解 设X为第一次抽得的次品数 Y为第2次抽得的次品数 则X b 10 p Y b 5 p 且 X i 与 Y j 独立 A 接受该批 69 泊松分布 Poisson分布 若随机变量X的概率分布律为称X服从参数为 的泊松分布 记 例 设某汽车停靠站候车人数 1 求至少有两人候车的概率 2 已知至少有两人候车 求恰有两人候车的概率 解 70 71 3随机变量的分布函数 72 例 解 73 4连续型随机变量及其概率密度 定义 对于随机变量X的分布函数若存在非负的函数使对于任意实数有 其中称为X的概率密度函数 简称概率密度 则称X为连续型随机变量 74 与物理学中的质量线密度的定义相类似 75 例 设X的概率密度为 1 求常数c的值 2 写出X的概率分布函数 3 要使求k的值 解 76 几个重要的连续量均匀分布定义 X具有概率密度称X在区间 a b 上服从均匀分布 记为X U a b 77 例 在区间 1 2 上随机取一数X 试写出X的概率密度 并求的值 若在该区间上随机取10个数 求10个数中恰有两个数大于0的概率 解 X在区间 1 2 上均匀分布 设10个数中有Y个数大于0 则 78 指数分布定义 设X的概率密度为其中 0为常数 则称X服从参数为 的指数分布 记为 X具有如下的无记忆性 79 80 正态分布 定义 设X的概率密度为其中为常数 称X服从参数为的正态分布 Gauss分布 记为可以验算 81 称 为位置参数 决定对称轴位置 为尺度参数 决定曲线分散性 82 X的取值呈中间多 两头少 对称的特性 当固定 时 越大 曲线的峰越低 落在 附近的概率越小 取值就越分散 是反映X的取值分散性的一个指标 在自然现象和社会现象中 大量随机变量服从或近似服从正态分布 83 84 例 85 例 一批钢材 线材 长度 1 若 100 2 求这批钢材长度小于97 8cm的概率 2 若 100 要使这批钢材的长度至少有90 落在区间 97 103 内 问 至多取何值 86 例 设某地区男子身高 1 从该地区随机找一男子测身高 求他的身高大于175cm的概率 2 若从中随机找5个男子测身高 问至少有一人身高大于175cm的概率是多少 恰有一人身高大于175cm的概率为多少 87 5随机变量的函数分布问题 已知随机变量X的概率分布 且已知Y g X 求Y的概率分布 例如 若要测量一个圆的面积 总是测量其半径 半径的测量值可看作随机变量X 若则Y服从什么分布 例 已知X具有概率分布且设Y X2 求Y的概率分布 解 Y的所有可能取值为0 1 即找出 Y 0 的等价事件 X 0 Y 1 的等价事件 X 1 或 X 1 88 例 设随机变量X具有概率密度求Y X2的概率密度 解 分别记X Y的分布函数为 Y在区间 0 16 上均匀分布 89 一般 若已知X的概率分布 Y g X 求Y的概率分布的过程为 关键是找出等价事件 90 例 设Y 2X Z X2 求Y Z的概率分布 解 Y的可能取值为 2 0 2Z的可能取值为0 1 Y 2 的等价事件为 X 1 Z 1 的等价事件为 X 1 X 1 故得 91 例 92 93 94 例 解 例 解 95 96 复习思考题2 1 什么量被称为随机变量 它与样本空间的关系如何 2 满足什么条件的试验称为 n重贝努里试验 3 事件A在一次试验中发生的概率为p 0 p 1 若在n次独立重复的试验中 A发生的总次数为X 则X服从什么分布 并请导出 4 什么条件下使用泊松近似公式等式较为合适 5 什么样的随机变量称为连续型的 6 若事件A为不可能事件 则P A 0 反之成立吗 又若A为必然事件 则P A 1 反之成立吗 7 若连续型随机变量X在某一区间上的概率密度为0 则X落在该区间的概率为0 对吗 8 若随机变量X在区间 a b 上均匀分布 则X落入 a b 的任意一子区间 a1 b1 上的概率为 b1 a1 b a 对吗 9 若X N 2 则X的概率密度函数f x 在x 处值最大 因此X落在 附近的概率最大 对吗 97 概率论 98 第三章多维随机变量及其分布 关键词 二维随机变量分布函数分布律概率密度边缘分布函数边缘分布律边缘概率密度条件分布函数条件分布律条件概率密度随机变量的独立性Z X Y的概率密度M max X Y 的概率密度N min X Y 的概率密度 99 1二维随机变量 问题的提出例1 研究某一地区学龄儿童的发育情况 仅研究身高H的分布或仅研究体重W的分布是不够的 需要同时考察每个儿童的身高和体重值 研究身高和体重之间的关系 这就要引入定义在同一样本空间的两个随机变量 例2 研究某种型号炮弹的弹着点分布 每枚炮弹的弹着点位置需要由横坐标和纵坐标来确定 而它们是定义在同一样本空间的两个随机变量 100 定义 设E是一个随机试验 样本空间S e 设X X e 和Y Y e 是定义在S上的随机变量 由它们构成的向量 X Y 叫做二维随机向量或二维随机变量 定义 设 X Y 是二维随机变量对于任意实数x y 二元函数称为二维随机变量 X Y 的分布函数 101 分布函数的性质 102 103 二维离散型随机变量 定义 若二维随机变量 X Y 全部可能取到的不同值是有限对或可列无限对 则称 X Y 是离散型随机变量 离散型随机变量的联合概率分布 为二维离散型随机变量 X Y 的联合概率分布 可以用如右表格表示 104 分布律的性质 例1 设随机变量X在1 2 3 4四个整数中等可能地取一个值 另一个随机变量Y在1 X中等可能地取一整数值 试求 X Y 的联合概率分布 解 X i Y j 的取值情况为 i 1 2 3 4 j取不大于i的正整数 即 X Y 的联合概率分布为 105 106 二维连续型随机变量 107 108 例3 设二维随机变量 X Y 具有概率密度 109 110 例4 设二维随机变量 X Y 具有概率密度 1 求常数k 2 求概率解 111 2边缘分布 二维随机变量 X Y 作为整体 有分布函数其中X和Y都是随机变量 它们的分布函数记为 称为边缘分布函数 事实上 112 对于离散型随机变量 X Y 分布律为 X Y的边缘分布律为 注意 113 对于连续型随机变量 X Y 概率密度为 事实上 同理 X Y的边缘概率密度为 114 115 例2 X Y 的联合分布律为求 1 a b的值 2 X Y的边缘分布律 3 2 解 1 由分布律性质知a b 0 6 1即a b 0 4 116 例3 设G是平面上的有界区域 其面积为A 若二维随机变量 X Y 具有概率密度则称 X Y 在G上服从均匀分布 现设 X Y 在有界区域上均匀分布 其概率密度为求边缘概率密度解 117 118 119 3条件分布 由条件概率公式可得 当i取遍所有可能的值 就得到了条件分布律 120 定义 设 X Y 是二维离散型随机变量 对于固定的yj 同样 对于固定的xi 121 例1 盒子里装有3只黑球 4只红球 3只白球 在其中任取2球 以X表示取到黑球的数目 Y表示取到红球的只数 求 1 X Y的联合分布律 2 X 1时Y的条件分布律 3 Y 0时X的条件分布律 解 X Y的联合分布律为 122 故在X 1的条件下 Y的分布律为 同理P Y 0 1 5 故在Y 0的条件下 X的分布律为 123 例2 一射手进行射击 击中目标的概率为射击直中目标两次为止 设以X表示首次击中目标所进行的射击次数 以Y表示总共进行的射击次数 试求X和Y的联合分布律和条件分布律 解 124 125 例3 设参加考研的学生 正常发挥的概率为a 超常发挥的概率为b 发挥失常的概率为c a b c 1 设某班有10人参加考研 发挥正常的人数为X 发挥超常的人数为Y 求 1 X Y 的联合分布律 2 P X Y 1 3 在Y 3的条件下 X的分布律 解 1 X Y的联合分布律为 126 127 定义 条件分布函数 128 定义 条件概率密度 129 也就是 由 事实上 130 条件概率密度的直观意义 131 例4 设二维随机变量 X Y 在区域内均匀分布 求条件概率密度 二维均匀分布的条件分布仍为均匀分布 解 根据题意 X Y 的概率密度为 Y的边缘概率密度为 于是给定y 1 y 1 X的条件概率密度为 132 133 4相互独立的随机变量 134 例1 1例2中X和Y是否相互独立 即 X Y 具有概率密度 请问 连续型随机变量X Y相互独立 其密度函数有何特征 计算得 X和Y的边缘概率密度分别为 135 136 137 138 139 140 一般n维随机变量的一些概念和结果 141 142 边缘分布如 143 相互独立 144 定理1 定理2 145 5两个随机变量的函数的分布 146 147 148 149 例3 设X和Y是相互独立的标准正态随机变量 求的概率密度 解 由卷积公式 一般 设X Y相互独立 150 例4 X Y相互独立 同时服从 0 1 上的均匀分布 求的概率密度 解 根据卷积公式 易知仅当 参考图得 151 例5 设X Y相互独立 服从相同的指数分布 概率密度为 求的概率密度 解 根据卷积公式 152 一般的 可以证明 若X Y相互独立 且分别服从参数为X Y的概率密度分别为证明 这是例3的推广 由卷积公式 由此可知 153 154 推广到n个相互独立的随机变量的情况设X1 X2 Xn是n个相互独立的随机变量 它们的分布函数分别为 则 155 156 例7 设系统L由两个相互独立的子系统L1 L2联结而成 联结的方式分别为 1 串联 2 并联 3 备用 当系统L1损坏时 系统L2开始工作 如图 设L1 L2的寿命分别为X Y 已知它们的概率密度分别为 试分别就以上三种联结方式写出L的寿命Z的概率密度 157 串联的情况由于当L1 L2中由一个损坏时 系统L就停止工作 所以L的寿命为Z min X Y 而X Y的分布函数分别为 故Z的分布函数为 于是Z的概率密度为 即Z仍服从指数分布 158 并联的情况由于当且仅当L1 L2都损坏时 系统L才停止工作 所以这时L的寿命为Z max X Y Z的分布函数为 于是Z的概率密度为 159 备用的情况由于这时当系统L1损坏时 系统L2才开始工作 因此整个系统L的寿命Z是L1 L2寿命之和 即Z X Y 因此 160 复习思考题3 1 设 X Y 为二维向量 则P x1 X x2 y1 Y y2 F x2 y2 F x1 y1 对吗 2 设 X Y 为二维连续量 则P X Y 1 0 对吗 3 X Y 为二维连续型向量 f x y 为 X Y 的联合概率密度 fX x 和fY y 分别为关于X和Y的边缘概率密度 若有一点 x0 y0 使f x0 y0 fX x0 fY y0 则X和Y不独立 对吗 161 关键词 数学期望方差协方差相关系数 第四章随机变量的数字特征 162 问题的提出 在一些实际问题中 我们需要了解随机变量的分布函数外 更关心的是随机变量的某些特征 例 在评定某地区粮食产量的水平时 最关心的是平均产量 在检查一批棉花的质量时 既需要注意纤维的平均长度 又需要注意纤维长度与平均长度的偏离程度 考察杭州市区居民的家庭收入情况 我们既知家庭的年平均收入 又要研究贫富之间的差异程度 163 定义 定义 数学期望简称期望 又称均值 1数学期望 164 例1 165 例2 有2个相互独立工作的电子装置 它们的寿命服从同一指数分布 其概率密度为 若将这2个电子装置串联联接组成整机 求整机寿命N 以小时计 的数学期望 解 问题 将2个电子装置并联联接组成整机 整机寿命的期望又是多少 只要求出一般指数分布的期望 即E X1 就可得到E N 166 例3 设一台机器一天内发生故障的概率为0 2 机器发生故障时全天停工 若一周5个工作日里无故障 可获利10万元 发生一次故障获利5万元 发生2次故障获利0元 发生3次或以上故障亏损2万元 求一周内期望利润是多少 解 设X表示一周5天内机器发生故障天数 设Y表示一周内所获利润 则 167 例4 168 例5 169 170 171 例6 172 例7 设随机变量 X Y 的概率密度为 173 174 数学期望的特性 这一性质可以推广到任意有限个随机变量线性组合的情况 175 证明 下面仅对连续型随机变量给予证明 176 例9 一民航送客车载有20位旅客自机场出发 旅客有10个车站可以下车 如到达一个车站没有旅客下车就不停车 以X表示停车的次数 求 设每位旅客在各个车站下车是等可能的 并设各旅客是否下车相互独立 本题是将X分解成数个随机变量之和 然后利用随机变量和的数学期望等于随机变量数学期望之和来求数学期望 这种处理方法具有一定的普遍意义 解 引入随机变量 177 例10 178 2方差 设有一批灯泡寿命为 一半约950小时 另一半约1050小时 平均寿命为1000小时 另一批灯泡寿命为 一半约1300小时 另一半约700小时 平均寿命为1000小时 问题 哪批灯泡的质量更好 单从平均寿命这一指标无法判断 进一步考察灯泡寿命X与均值1000小时的偏离程度 方差 正是体现这种意义的数学特征 179 定义 180 对于离散型随机变量X 对于连续型随机变量X 此外 利用数学期望的性质 可得方差的计算公式 181 例1 设随机变量X具有数学期望 182 例2 设随机变量X具有0 1分布 其分布律为 解 183 例3 解 184 例4 解 X的概率密度为 185 例5 设随机变量X服从指数分布 其概率密度为 即对指数分布而言 方差是均值的平方 而均值恰为参数 186 方差的性质 187 证明 188 例6 例7 解 191 例8 设活塞的直径 以cm计 汽缸的直径X Y相互独立 任取一只活塞 任取一只汽缸 求活塞能装入汽缸的概率 192 表1几种常见分布的均值与方差 数学期望方差 分布率或密度函数 分布 193 3协方差及相关系数 对于二维随机变量 X Y 除了讨论X与Y的数学期望和方差外 还需讨论描述X与Y之间相互关系的数字特征 这就是本节的内容 定义 194 协方差的性质 195 相关系数的性质 续 196 197 198 例1 设X Y服从同一分布 其分布律为 X 101P1 41 21 4已知 判断X和Y是否不相关 是否不独立 199 200 续 201 续 202 203 例3 设X Y相互独立服从同一分布 方差存在 记U X Y V X Y 则随机变量U与V是否一定不相关 是否一定独立 204 4矩 协方差矩阵 205 利用协方差矩阵 可由二维正态变量的概率密度推广 得到n维正态变量的概率密度 208 n维正态变量具有以下四条重要性质 209 复习思考题4 1 叙述E X 和D X 的定义 210 4 试述计算随机变量X的函数g X 的数学期望E g X 的两种方法 5 设X N 2 用如下两种方法求E X2 1 E X2 D X E X 2 2 2 2 E X2 E X X E X E X 2 两种结果不一样 哪一种错 为什么 6 设X和Y为两随机变量 且已知D X 6 D Y 7 则D X Y D X D Y 6 7 1 0 这与任意一个随机变量的方差都不小于零相矛盾 为什么 211 7 考虑100包水泥的总重量Y用以下两种方式表示 1 设第i袋水泥的重量为Xi i 1 2 100 由题意知 Xi N 50 2 52 Y Xi 则Y N 100 50 100 2 52 2 设一包水泥的重量为X 由题意知X N 50 2 52 若将100包水泥的总重量看成是1包水泥的100倍 即Y 100X Y是X的线性函数 则 E Y 100E X 100 50 D Y 1002D X 1002 2 52Y N 100 50 1002 2 52 这两种方法得到的总重量的分布不一样 因为方差不同 后者方差是前者的100倍 试问哪一种正确 8 试问D X Y D X D Y 2cov X Y 对吗 212 数理统计 213 第五章大数定律和中心极限定理 关键词 契比雪夫不等式大数定律中心极限定理 214 1大数定律 背景本章的大数定律 对第一章中提出的 频率稳定性 给出理论上的论证为了证明大数定理 先介绍一个重要不等式 215 216 例1 在n重贝努里试验中 若已知每次试验事件A出现的概率为0 75 试利用契比雪夫不等式估计n 使A出现的频率在0 74至0 76之间的概率不小于0 90 217 随机变量序列依概率收敛的定义 218 219 大数定律的重要意义 贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性 正因为这种稳定性 概率的概念才有客观意义 贝努里大数定律还提供了通过试验来确定事件概率的方法 既然频率nA n与概率p有较大偏差的可能性很小 我们便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计 这种方法即是在第7章将要介绍的参数估计法 参数估计的重要理论基础之一就是大数定理 220 2中心极限定理 背景 有许多随机变量 它们是由大量的相互独立的随机变量的综合影响所形成的 而其中每个个别的因素作用都很小 这种随机变量往往服从或近似服从正态分布 或者说它的极限分布是正态分布 中心极限定理正是从数学上论证了这一现象 它在长达两个世纪的时期内曾是概率论研究的中心课题 221 222 223 例2 设某种电器元件的寿命服从均值为100小时的指数分布 现随机取得16只 设它们的寿命是相互独立的 求这16只元件的寿命的总和大于1920小时的概率 224 例3 某保险公司的老年人寿保险有1万人参加 每人每年交200元 若老人在该年内死亡 公司付给受益人1万元 设老年人死亡率为0 017 试求保险公司在一年内这项保险亏本的概率 225 例4 设某工厂有400台同类机器 各台机器发生故障的概率都是0 02 各台机器工作是相互独立的 试求机器出故障的台数不小于2的概率 226 第六章数理统计的基本概念 关键词 总体个体样本统计量 227 引言 数理统计学是一门关于数据收集 整理 分析和推断的科学 在概率论中已经知道 由于大量的随机试验中各种结果的出现必然呈现它的规律性 因而从理论上讲只要对随机现象进行足够多次观察 各种结果的规律性一定能清楚地呈现 但是实际上所允许的观察永远是有限的 甚至是少量的 例如 若规定灯泡寿命低于1000小时者为次品 如何确定次品率 由于灯泡寿命试验是破坏性试验 不可能把整批灯泡逐一检测 只能抽取一部分灯泡作为样本进行检验 以样本的信息来推断总体的信息 这是数理统计学研究的问题之一 228 1总体和样本 总体 研究对象的全体 如一批灯泡 个体 组成总体的每个元素 如某个灯泡 抽样 从总体X中抽取有限个个体对总体进行观察的取值过程 随机样本 随机抽取的n个个体的集合 X1 X2 Xn n为样本容量简单随机样本 满足以下两个条件的随机样本 X1 X2 Xn 称为简单随机样本 1 每个Xi与X同分布2 X1 X2 Xn是相互独立的随机变量 说明 后面提到的样本均指简单随机样本 由概率论知 若总体X具有概率密度f x 则样本 X1 X2 Xn 具有联合密度函数 229 统计量 样本的不含任何未知参数的函数 常用统计量 设 X1 X2 Xn 为取自总体X的样本 230 随机变量独立性的两个定理 231 2常用的分布 232 233 234 235 236 237 238 正态总体样本均值和方差的分布 239 240 242 复习思考题6 1 什么叫总体 什么叫简单随机样本 总体X的样本X1 X2 Xn有哪两个主要性质 2 什么是统计量 什么是统计量的值 3 样本均值和样本方差如何计算 4 N 0 1 分布 t分布 2分布和F分布的双侧 下侧 上侧分位点是如何定义的 怎样利用附表查这些分位点的值 5 对一个正态总体的三个常用统计量及其分布是什么 6 对两个正态总体的三个常用统计量及其分布是什么 243 第七章参数估计 关键词 矩估计法极大似然估计法置信区间置信度 244 245 1参数的点估计 246 247 248 249 极大似然估计法 极大似然估计的原理介绍考察以下例子 假设在一个罐中放着许多白球和黑球 并假定已经知道两种球的数目之比是1 3 但不知道哪种颜色的球多 如果用返回抽样方法从罐中任取n个球 则其中黑球的个数为x的概率为 若取n 3 如何通过x来估计p值先计算抽样的可能结果x在这两种p值之下的概率 250 251 252 253 254 255 256 257 表1例2 例4 例5中两种估计方法所得结果 258 2估计量的评选标准 从表1看到 对总体的未知参数可用不同方法求得不同的估计量 如何评价好坏 通常用三条标准检验 无偏性 有效性 相合性无偏性 259 260 261 纠偏方法 262 有效性 263 264 相合性 265 266 3区间估计 267 268 单侧置信区间 269 正态总体均值方差的区间估计 270 271 272 273 274 区间短精度高 区间长精度低 275 276 277 278 279 280 例12 两台机床生产同一个型号的滚珠 从甲机床生产的滚珠中抽取8个 从乙机床生产的滚珠中抽取9个 测得这些滚珠得直径 毫米 如下 甲机床15 014 815 215 414 915 115 214 8乙机床15 215 014 815 114 614 815 114 515 0 281 282 说明 置信区间包含两方面含义1 置信水平2 区间长度置信水平越高 区间越大 但区间精确度差置信区间越小 精确度高 但置信水平差 正态总体均值 方差的置信区间与单侧置信限 复习思考题7 1 总体未知参数矩估计的思想方法是什么 试写出0 1分布 二项分布b m p 泊松分布 均匀分布U a b 正态分布N 2 中有关参数的矩估计式2 极大似然估计的主要步骤是什么 3 未知参数的估计量与估计值有什么区别 5 估计量的三个基本评价标准是什么 你能理解它们的含义吗 6 求参数置信区间的一般方法是什么 对正态总体 试从有关的统计量自行导出几类参数的置信区间 7 置信度的含义是什么 置信度 区间长度和样本容量的关系怎样 285 复习思考题8 1 假设检验的基本思想是什么 其中使用了一条什么原理 2 检验的显著性水平 的意义是什么 3 比较双边 左边和右边检验的拒绝域 4 使用U检验法可以进行哪些假设检验 5 使用t检验法可以进行哪些假设检验 6 使用 2检验法可以进行哪些假设检验 7 使用F检验法可以进行哪些假设检验 8 正态总体期望与方差的区间估计和假设检验两者之间有什么相似之处 9 成对数据差的t检验适用于哪些特殊场合 10 分布拟合的 2检验的基本步骤是什么
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!