第十章药学统计学

上传人:cel****460 文档编号:243546457 上传时间:2024-09-25 格式:PPT 页数:47 大小:348.50KB
返回 下载 相关 举报
第十章药学统计学_第1页
第1页 / 共47页
第十章药学统计学_第2页
第2页 / 共47页
第十章药学统计学_第3页
第3页 / 共47页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第十章药学统计学,统计学(statistics):研究数据的收集、描述、分析、综合和解释,以获得新信息、作出新推断的学科。,包括:,(1)制定调查方案和设计科学实验,(2)描述实验数据,(3)进行假设检验,(4)获知变量间的定量关系,概 述,第一节 几个基本统计学概念,频率:,概率:,一、必然事件与随机事件,必然事件:某条件实现后一定发生或一定不发生的事件,随机事件:一定条件下,不一定发生的事件,二、频率与概率,1. 总体与样本的关系,样本参数用英文字母表示,总体参数用希腊字母表示,总 体,样 本,取样,观测,数 据,推 断,三、总体与样本,2. 取样的随机性,随机性包括:,总体中个体的抽取必须是相互独立的;,总体中所有个体被抽取的机会相等。,满足以上两个要求的取样,称为简单随机取样(SRS,simple random sampling),这样抽取的样本称为简单随机样本。,四、观测值的特征集中位置与离散程度,量度集中位置的统计量,(,1,)均值,样本均值,总体均值,E,(,X,),取值,概率,X,i,P,i,均值的重要性质:,观测值与均值之差(偏差)之和,偏差的平方和 最小,(2)众数,频数最大的观测值叫众数,常用于表示离散型随机变量的集中位置。,(3)中位数,把变量的观测值按大小顺序排列,排在当中的一个观测值叫中位数。,(1)极差 (最大值和最小值之差),RX,max,X,min,(2)平均(绝对)偏差,2. 量度数据离散程度的统计量,(3)方差,式中n1在统计学中叫自由度(degree of freedom),常用希腊字母,表示,五、两个典型的概率分布,1. 二项分布是典型的离散型概率分布,(1)特点:,二项分布是一种每次试验只有两种可能结果而不受以前实验影响的分布。在样本容量相对于总体很小时,取样试验后,返回不返回,对下一次试验的结果无影响。,(2)二项分布的均值、方差、标准差,均值np 方差npq,标准差,(3)二项分布的实际意义,一些只有两个结果的互斥事件都与二项分布有关,在药学方面,可用于分析从制剂批抽出n个个体中不合格个体数的概率。,2. 正态分布是一种连续型概率分布,各种分布都以它为中心在一定条件下相互转化。,设连续性随机变量X的概率密度为,则称X服从参数为,、 ,(-,+ ,,0)的正态分布,记为XN( , ,),(1)特点:,极大值在,; 以X为对称轴;,X轴是渐进线;拐点在X。,(2)标准正态分布,一般的正态分布取决于均值,和标准差,计算概率时,,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表,任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布,x,m,s,一般正态分布,=1,Z,标准正态分布, ,(3)标准正态分布表的使用,将一个一般的转换为标准正态分布,计算概率时,,查标准正态概率分布表,对于负的 x ,可由, (-x) x得到,对于标准正态分布,即XN(0,1),有,P (a X b) b a,P (|X| a) 2 a 1,对于一般正态分布,即XN( , ),有,六、均值的分布和中心极限定理,均值的分布,如一个随机变量,X,呈总体均值为,、,总体方差为,2,的正态分布,则其容量为,n,的样本均值 也呈正态分布,其总体均值仍为,,,但总体方差为,2 /n,,,即,X,2. 中心极限定理,设从均值为,,方差为,2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,一个任意分布的总体,X,当样本容量足够大时(,n,30) ,样本均值的抽样分布逐渐趋于正态分布,第二节 取样,按与调查目的有关的某个主要性标志将总体单位划分为若干层(也称类、组或子总体),然后从多层中按随机原则分别抽取一定数目的单位构成样本。,一、随机取样与随机数表,简单随机抽样是最基本的抽样组织方式。是对总体单位不进行任何划分或排队,完全随机地直接从总体中抽取样本单位,使每个总体单位都有完全均等的机会被抽中。,二、分层取样,在大规模生产中,表明供应方产品质量特征的随机变量应不超出某规定范围。,三、系统取样,常用于质量控制,每第n个个体选取一个,但最初选取的个体是随机的。,四、验收取样,第三节 数据制图,与统计方法有关的图解:, 以传递信息为目的的图解:,如直方图、条形图, 在坐标中描述变量之间关系的图解,一、引言,在许多研究数据中,响应Y的对数而不是Y本身与独立变量X呈线性关系,这样就要进行半对数标绘,即变量X的坐标是自然数而响应(函数)Y的是它的对数logY。,二、描述频数的图解,直方图、条形图、扇形图,三、描述变量关系的标绘图,第四节 统计估计和假设检验,统计方法,描述统计,推断统计,统计估计,假设检验,样本统计量均值 和方差S2分别是其总体均值,和总体方差2的最佳估计。,置信区间(confidence interval):是我们相信统计量如总体均数所在的区间,由总体的性质、参数的样本估计值和想达到的置信度决定。,以样本均值为对称中心的双侧置信区间:,P置信区间,X,一、统计估计,1. 用t分布确定置信区间,P置信区间,2. 几个不同置信区间的构造,(1),未知,需要由样本估计,(2)已知,直接代入公式,(3)比率的置信区间,一、统计估计,二、假设检验,1. 引言,(1)概念,事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立,(2)类型,参数假设检验,非,参数假设检验,(3)特点,采用逻辑上的反证法,依据统计上的小概率原理,零假设(null hypothesis):,关于两个总体在某一参数如均值上一致(实际上差异为零)的假设H0。,如 H0:,12,备择假设(alternative hypothesis):如果舍弃H0则接受Ha,Ha也可用H1表示。,如Ha:12,例:表 观测单一总体均值的实验示例,同类药物的治愈率,新药的治愈率,值得临床研究重视得血压降低标准值,临床前研究中n只大鼠血压降低均值,药典片剂通则关于崩解时限的规定,药片片剂平均崩解时限,标示量,药片片剂的平均含量,假设值或标准值,样本均值,对此例中每一类问题的假设检验,可提出三个假设检验:,H0:,=0,Ha: 0, H0:=0,Ha:0,2. 检验假设的步骤,(1)提出检验统计量T并进行实验,(2)提出零假设H0和备择假设Ha,(3)规定显著性水平,显著性水平:即根据统计检验的结果舍弃零假设H0(存在显著差异)而实际上不存在的概率。,(4)计算检验统计量T并进行显著性检验,3. 几种具体的假设检验,(1),已知的单样本双侧均值检验,(2)已知的单样本单侧均值检验,(3)未知的单样本双侧均值检验,先求t值,再计算置信区间,进行t检验,(4)独立样本方差S12和S22的比较:F检验,1. 什么是回归分析:,从一组样本数据出发,确定变量之间的数学关系式,对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著,利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度,第五节 回归分析,2. 回归模型的类型,一个自变量,两个及两个以上自变量,回归模型,多元回归,一元回归,线性回归,非线性回归,线性回归,非线性回归,3. 回归模型,(1)回答“变量之间是什么样的关系?”,(2)方程中运用,1个数字的因变量(响应变量)被预测的变量,1个或多个数字的或分类的自变量 (解释变量)用于预测的变量,(3)主要用于预测和估计,概念要点,(,1,)当只涉及一个自变量时称为一元回归,若因变量,y,与自变量,x,之间为线性关系时称为一元线性回归,(,2,)对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系,(,3,)描述因变量,y,如何依赖于自变量,x,的方程称为回归模型,5. 简单线性回归方程的形式如下,Y =,0+,1 x,方程的图示是一条直线,因此也称为直线回归方程,0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值,1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值,6. 最小二乘法,回归直线是对若干个数据对(X,Y)绘制的,但由于遵守正态分布的实验误差,数据对中两个以上的点,不能恰好在一条直线上,即恰好通过所有数据点的直线是找不到的,只能找到一条离所有点都近的直线,所用的客观方法叫最小二乘法(method of least squares)。,7. 最小二乘线,(1)定义,给定n个数据对(X,Y),找到一条规定X,Y关系的直线,使所有数据对(X,Y)与拟规定的直线在Y轴方向的距离平方和最小用数学语言表示就是 最小,这样的一条直线就是描述X,Y间关系的最佳直线,称为最小二乘线。,(2)图示,x,y,(,x,n,y,n,),(,x,1,y,1,),(,x,2,y,2,),(,x,i,y,i,),e,i,=,y,i,-,y,i,(3),和 的计算公式,二、回归分析在药物研究中的应用,例:把6个浓度按两倍递增的纯青霉素溶液(132U/ml)置于进行生物测定的杯碟中。下表给出每一浓度以mm表示的抑菌圈直径,在这个长度的测量中发生较大的误差。如果对青霉素溶液的浓度C取以2为底的对数(笔,binit),则抑菌圈的直径与青霉素溶液的浓度成线性关系。试求Y在X上的回归直线方程。,24.77,23.13,21.35,19.52,17.78,15.87,Y抑菌圈直径/mm,5,4,3,2,1,0,Xlog,2,C,32,16,8,4,2,1,C/ml,表 青霉素溶液浓度的对数变换,解 进行Y在X上的回归计算,X15 n6 Y,2.50 ,X255 XY337.24 Y2,于是Y在X上的回归直线方程是,X,第六节 实验设计,1. 基本原理,(1)对照:齐同可比,(2)重复:获得总体标准差的估计值,用大容量样本重复多次获得的均值,能把因素在实验中的效应估计得更精密。,(3)随机:有助于把可能存在得外部因素效应平均化而减免。,一、实验设计的基本原理,2. 步骤, 确认并陈述问题, 选择因素和水平, 选择响应变量, 选择实验设计, 进行实验, 分析数据, 做结论并提建议,二、方差分析,(analysis of variance,ANOVA),方差分析能确定引起生产和实验结果有差异的诸因素各自的单独作用和彼此的交互作用。,变差的大小通常用变差平方和(简称平方和)表示,平方和的加和性:总平方和等于各因素平方和与误差平方和之和,即,SStotSSASSBSSe,三、实验设计的分类,1. 两类基本的实验设计,等级分类,交叉分类,2. 两类不同性质的因素,固定的,随机的,3. 配置完整和不完整,第七节 几个现代统计方法,1. 概述,蒙特卡洛方法根据模拟抽样的结果估算求解问题解X的近似值。这样的近似值通常是以一个数学期望等于X的统计量的样本均值给出。,2. 分类,SS,SS,SM,MS,SMS,3. 一个例子制剂含量均匀度计量型检查法的制定,一、蒙特卡洛方法随机现象的统计模拟,二、模拟识别(pattern recognition),1.概述,模式识别不需要数学模型,只需要找到互不相同的数据间的关系,可处理代表模式而维数大于三的数据。,2.一般步骤和分类,(1)步骤:数据即观测值的收集、表示和预处理;,特征提取和选择;,分类、决策,(2)分类:非参数法;参数(贝叶斯)法,3.中药质量的化学模式识别,谢谢大家!,结 语,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 药学课件


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!