概率论与数理统计

资源描述

基本公式就是一些定律和性质公式，已经很熟悉的公式跳过，相对陌生的重点记忆一下，会用就行了。目测比较陌生的也就是德摩根率的两个公式和任意n个事件的并集概率公式。条件概率那一节主要是理解记忆全概率公式和贝叶斯公式，课后相关习题会做就达到要求了。独立事件这一部分记得它的条件就够了，第二、三、四章都是讲随机变量的相关计算，首先注意分清离散型随机变量和连续性随机变量的相关表示方法和称谓。比如f(x)和P(X=xi)，相同含义，离散型叫做概率分布律，而连续性称谓概率密度函数，类似的还有许多。掌握两类函数中各自的基本函数。离散型：0-1分布（xB(1,p)），二项分布（xB(n,p)），几何分布，泊松分布（x()这个比较陌生，重点看看）；连续性：均匀分布（xU（a，b），正态分布（xN(，2)），指数分布（这个也相对陌生，重点看看）。熟记这些基本分布的表达式、均值和方差。掌握表征随机变量的一些量，诸如概率密度函数（概率分布律），概率分布函数（第二章）；联合分布律，联合概率分布函数，边缘分布律（边缘概率密度），边缘分布函数（第三章）；均值，方差，协方差，相关系数（第四章）等，注意各自表征的含义，区别一维和二维，特别留意均值和方差的相关性质。理想的效果：会灵活地实现边缘概率密度、边缘分布函数和联合概率密度、联合分布函数之间转换计算，计算方差、均值、协方差、相关系数，掌握切皮雪夫不等式和中心极限定理的应用，另外还有涉及条件分布，和的分布，max，min，Y=g(x)等分布的计算，其实都有现成公式来辅助计算。概率论所学的知识也就是上面这些，数理统计部分学得很少，我归纳了一下，掌握一下这些就行： 1. 样本统计量。均值、方差、K阶原点矩和中心矩。 2. 卡方分布，t分布，F分布 3. 样本矩估计法，极大似然估计法。正如书名概率统计所述，本书分为两大部分，概率论（1,2,3,4,5,章）和数理统计（7,8章）。不考的就不详细说了我们先要弄清楚概率论和数理统计的关系。概率论呢，就是个理论性的东西，研究事件的可能性的东西，而数理统计呢，是有实际用处的，对现实的一些问题先去调查取得数据，然后进行分析，也会用到概率论的知识。我认为，两者就类似于世界观和方法论之间的关系（由于我是文盲，有错的话请联系我）一、概率论部分我去图书馆找了一下浙大版的，发现这本书的排版和浙大版是有些区别的。我们是按离散和随机来分的，浙大是按一维和二维来分的，但区别不大。下面我们来看一下，我们这版的出书人的思路。首先，出书思路，就很直观的三点：【1】概率论的研究对象是随机变量，而【2】分布是随机变量的核心，【3】概率论很重要的两大理论是大数定律和中心极限定律。没了。先唠叨一句概率论的一些基础概念吧（举个例子，13班有37个男生，7个女生，随机试验是“抽个人出来，看它的性别，”随机事件是“这货是女生”，假设男生，记X=0，女生,X=1，那么X就是随机变量，P（X=ai）=pi, i=1,2这个就是分布，分布的意思就是随机变量具体是个什么情况）前五章就讲这些，接下来稍微细点讲：（第一章随机事件与概率）讲了概率论的基础知识在第一章中，主要就是为了搞清两个很基础的东西“事件”“概率”事件的概念上文也说了，接下来是事件的关系或者说是运算。主要就是和、积、差、互不相容、对立等，其中最重要的是两个公式：差A-B=AB（很好理解，我喜欢的女生中除掉你喜欢女生部分就是我喜欢而你不喜欢的女生）还一个是德摩根法则AB=AB（人人显示不了上划线，所以大家将就着看吧）然后是概率（起源、举例、性质、其他四个方面）起源是频率，举例是指古典概率，几何概率和二项概率，然后就是比较简单的性质，条件概率，其中条件概率中的特殊现象可以得出独立性，最后是全概率公式和贝叶斯公式（这两个公式做过一道题就可以理解，不难）（第二（三）章离散（连续）型随机变量及其分布）讲了概率论的研究对象，随机变量，和随机变量的核心，分布第二章和第三章大同小异，就是随机变量的类型不同而已，一个是不连续，一个是联系。可能是中国有对称的传统的缘故，所以把不联系美名为离散。这两章看下我列的一个表就清楚了，就两个内容，随机变量和分布（看图请，点击我）为什么人人不能插入图片了，真坑！（第四章）由于从分布中，我们不能直观地看出我们想要的东西（譬如班级成绩怎样分布知道了，但我们关心的是平均分是多少，好坏差距大不大）所以之后讲了随机变量的数字特征第四章主要是计算麻烦，另外还有协方差，相关系数，矩和协方差矩阵比较抽象。学过高中都会知道什么是期望方差，就不解释了。主要就是把定义记住还有随机变量的平方的期望什么的记住就好了。下面我们先说说什么是协方差吧。先举个例子，假设我是一个男孩，首先我的学习成绩肯定是存在方差的，其次我对“你”的感情亲疏也是存在方差的，那么我喜欢你的程度对我学习成绩有多大影响呢？这就是协方差哈研究的意义了。协方差为正且越大，表示我越喜欢你可能我就会越努力，所以我成绩会越好（正相关），若是为0，那就意味着我的处理能力很强，你和成绩完全没关系，若是为负，且越来越负，那么越喜欢你，我成绩就会越差（负相关）。而相关系数和协方差一样的，就是将协方差标准化了（数学上的标准化说白了就是各种变为1）。所以相关系数的范围是-1,1矩的话在我理解就是类似于“平均”的意思，矩分为原点矩和中心距，原点矩就是和原点（各种0）比较，中心距就是和自己的中心比较。比如一阶的原点矩就是期望，拿个物体来说就是重心的意思。而高阶的话就比较抽象了，就是幂函数的“平均”，而中心矩呢就是先减去只记得中心，其他和原点矩没什么区别。方差（二阶）和协方差（二阶混合）都是中心距的特例，挺好玩的。协方差矩阵呢，我看书上好像没有写出最初的式子，就给出一个结果所以不好理解。n维随机向量 X=(X1,X2,Xn)T（T表示转置），那么协方差矩阵呢，顾名思义啊就是协方差哈的矩阵=EX-E(X)X-E(X)T ，然后就是书上的那个式子，帮助理解，不用记住我写的东西。然后这章就没东西了最后就是两大理论（第五章随机变量序列的极限）大数定律呢，就是随机变量的序列（序列是指X1，X2。，不是单单的一个X）的平均值在啥子情况下收敛到期望值。这个在下文数理统计的证明比较有用中心极限定理就是大量的和的分布在啥子情况下接近于正态分布（话说每次上次肖岚说到正态时，我都会想歪）有时候我们不会用这两个理论就是不知道这是干啥的，多读书多看报多睡觉就好了。（PS：说到这儿，我想补充一句，我写这篇文章主要是讲一下这本书的内容，而不是怎样去考试，毕竟我自己都不会考，实话。只是建议和我一样上课没怎么听的孩子，在期末大家复习前看一下此文，免得盲目复习，复习了白复习这两种情况，不然一直不知道在讲什么，所以会导致一直在复习第一章的情况。）二、数理统计这部分书上只要求一半，第七章的基本概念和第八章的参数估计，第九章的检验假设（和参数估计同等级的，也是一种推测的方法）和第十章两种分析（貌似是讲怎样处理数据的，我也没仔细看，所以就不和前几章一样装做很懂的样子，我发现我好会装啊，其实我前几章也不懂，哈哈）不要求相比于概率论，数理统计要求的内容比较少，只要掌握基本概念和参数估计就好了。先举个例子。譬如我想知道在周一到周五哪天晚上去图书馆才能尽可能遇见你，所以首先呢，我在本学期前五周先安排了我的一个兄弟蹲守侧门，我呢蹲守正门，开始记录你来图书馆是星期几晚上（也就是抽样），然后呢我就开始分析这些数据，最后我可以推测在接下来的十几周，我应该在周四晚上去图书馆才能尽可能遇见你。诶，这就是数理统计要干的事。下面是正文：第七章基本概念这章有3个内容。第一个就是总体样本观测值的定义，第二是统计量，第三是分位数。【1】其实高中也学过，不过大学只是把它定量化了。其实这章有些人看不懂，主要是看大写X，Xi和小写xi看晕了。所以我们要明确总体X，样本X1，X2，Xn，而观测值是x1,x2,xn。从总体中抽出样本的过程就是抽样，也就是上文的蹲点。而观测值呢就是我蹲点后的记录。（这里要明确的是，样本也是个随机变量，因为我蹲点了，你来不来肯定不知道啊，只有等我观测了一晚上记录说“今晚你没来”，这样我才知道，而这就是观测值）PS：大写的X和中文的“量”（譬如估计量）都是指随机变量是不确定的。小写的x和“值”（譬如估计值）都是数值，是个数。【2】明确了定义，我们就来看下怎样去高校地表示和利用这些数据，也就是统计量。常见的统计量有样本均值，样本方差，样本K阶矩和最大最小次序统计量。（要注意的是，和概率论不同的是，这里是样本的统计量）这些比较简单，难得是统计量的分布。（三大分布x2分布，t分布，F分布）主要掌握他们的定义，概率密度的图像，性质（书上很多东西都不要求的，只要记住定义图像和性质就行，譬如开方分布的期望是自由度之类的）。尤其是图形要记住，之后的区间估计会用到。这章中的考题也无非就是统计量的分布和统计量的数值特征。由于现实中最常见的分布是正态分布，所以之后书本上讨论了正态总体的抽样分布，这里很枯燥，一大推不认娘的公式，有人肯定看不大懂，没关系，学到区间估计就懂了（由于内容重复，我在下文区间估计时一起讲）【3】分位数，这个比较直观实用，附录很多表就是这个。我们的教课书上采用的左侧分位数，就是阴影在左边的。具体的定义比较简单，记住横坐标和阴影的对应关系就好了。总结下这章的重点，1）三大分布的定义和性质2）正态总体三个抽样分布（下文区间估计一起讲）3）三个图像在区间估计时的运用，譬如求下文1-的置信区间等。然后这章就没了第八章参数估计参数估计就是上文我分析推测你最可能哪天晚上去图书馆自习的方法之一，还一个方法就是假设检验。整章就两个内容，点估计和区间估计。一、点估计点估计和区间估计都是参数估计，就是用样本数据估计总体参数，顾名思义，区别在于点估计结果是个点，区间估计是个区间。因而两者的评价标准也不一样。点估计分为矩估计和最大似然估计。矩估计书上定义很烦，说白了就是用大数定律推出总体矩可以等于样本矩。矩估计计算比较简单，一般一个参数的话就用E（X），两个参数就用E（X）和E（X2）解下方程。最大似然估计真是坑爹啊，当初看定义愣是没看懂，智商捉鸡。具体定义大家自己看吧，通俗地讲就是通过一种方式将最可能情况挑出来（当然最可能不一定指一定是它）。虽然定义坑，但是计算步骤是最明朗的，就三步，1）找出似然函数L()。注意，计算时都只考虑正的情况。2）取对数3）解偏导等于0的方程（组），最后得到的是估计值，上面加个才是估计量。之后就将了估计量的性质（书上说是评选标准，一个意思）无偏性，就是说估计量的期望等于位置参数。没有偏差的意思。有效性，在无偏性的基础上，若是估计量的方差小，那么有效性好。一致性，或者说是相合性，就是数量无穷时，估计量趋向于未知参数（其实这个性质和切比雪夫是一个道理）二、现在讲区间估计了。之前也说过了，我们就是算在某个区间内，概率为1-。这个看起来比较易理解。主要是研究正态总体参数的区间估计，分三类：（公式不好打，所以打开书本164或189页）已知2，估计，用正态那个公式，然后用正态的图像可以解出置信区间。未知2，估计，用t分布那个公式，然后用t的图像可以解出置信区间。估计2，用开方那个公式，然后用开方的图像可以解出置信区间。解置信区间需要用到分位数，很直观。

展开阅读全文

概率论与数理统计

最新文档