生物统计学概述

上传人:1395****376 文档编号:240712967 上传时间:2024-05-02 格式:PPT 页数:118 大小:6.17MB
返回 下载 相关 举报
生物统计学概述_第1页
第1页 / 共118页
生物统计学概述_第2页
第2页 / 共118页
生物统计学概述_第3页
第3页 / 共118页
点击查看更多>>
资源描述
生物统计学概述生物统计学概述提纲学科简介生物统计学(基础篇)临床试验中的生物统计学生物统计学(高级篇)2一学科历史简介3概率论起源起源于赌博的一门学科1400 栖栖凤枝稍尚枝稍尚软弱弱化龙形状状已依稀稀1700 江山山代有人才才出各领风骚数百百年1900忽如一夜春风来千树万树梨花开徐传胜.概率论简史.数学通报.2004,10:36-38.陈希儒.数理统计学简史.4概率论起源两个赌徒相约若干局,谁先赢了3局则赢.若一人赢2局,另一人赢1局,赌博中止,问赌本应怎么分?1494,Pacioli:按2:1进行分配1654,Pascal&Fermat:按3:1进行分配1657,Huygens:赌本分配的数学期望5概率论起源概率的基本概念的确立基本定理的推导1713,Bernoulli:Bernoulli定理1733 De Moivre,1809 GaussPascal:正态分布1866,切比雪夫:大数定理、中心极限定理6概率论起源到19世纪,无论是概率论的实际应用还是其自身发展,都强烈地要求对概率论的逻辑基础作出更加严格的考察。1900年希尔伯特提出建立概率公理系统1926,1933科尔莫戈罗夫:概率论基础1938,Levy:随机过程与布朗运动7概率论与统计学总体样本概率论统计学8欲研究江苏省已婚女性宫颈癌患病率情况已知江苏省宫颈癌患病率为80/10万,现抽取100万人口的样本,估计其患病率为(74/10万,85/10万)抽取的样本100万人口总体患病率总体患病率样本患病率9NP引理/置信区间统计学应用于临床试验统计学应用于医学研究Jackknife/medianregBoxplot方差分析、试验设计描述统计=推断统计GaltonK PearsonM GreenwoodAB.HillRA Fisher生物/医学统计学先驱用于生命遗传研究指纹的唯一性线性相关、2分布创办Biometrika.J NeymanPearson,Fisher,Neyman之间的纠葛,请参见数理统计简史Tukey中国的生物/医学统计学先驱 郭祖超郭祖超 我国医学统计学的开拓者医学统计学家,军队卫生统计学家,医学教育家。于20世纪40年代最早在我国系统地介绍医学统计方法。代表作医用数理统计方法(1948,1963,1988)陆守曾陈 峰魏永越11现代生物统计学是一个应用性学科,为生物、医学研究服务严谨性+易释性医 学 研 究临 床 试 验全基因组研究时 空 传染病地理信息系统数理统计机器学习数据挖掘信息科学信息科学现代生物统计12二生物统计学(基础篇)基本概念假设检验参数估计试验设计13基本概念数据类型数值变量(连续性变量)。如:身高、年龄无序分类变量(离散变量)如:血型有序分类变量(离散变量)如:尿糖等级(-/1+/2+/)数据类型转换数值变量等级变量分类变量14基本概念数值变量的分布正态分布124132140148156164010203040人数图 某市120名12岁男童身高(cm)的频数分布15数值变量的分布偏态分布图102名黑色数瘤患者的生存时间频数分布1510152025303540生存时间(月)403020100人数均数中位数:右偏均数总体方差得到t分布标准化变换得到标准正态分布33t分布理论基础:均数的抽样分布-2.064 0 2.064v24区间估计:95%可信区间的含义-2 -1 0 1 2 按这种方法构建的可信区间,理论上平均每100次,有95次可以估计到总体参数。随机现象模拟软件常见试验设计单组设计完全随机设计配对设计交叉设计ABBABA8 2 3 7 5 4 6 18BA3337研究设计基本原则对照(control)随机(randomization)重复(replication)q对照的作用q对照的形式q对照组设置的要求q随机化的作用q随机的含义q分层随机、分段随机q重复的作用q重复的次数对照组作用黄金搭档的销售人员为了证明其具有增高效果,设计试验如下:在3个城市选取10-14岁儿童100名,试验开始前各测量并记录身高。免费提供黄金搭档12个月后再次测量身高。最后发现,100名儿童平均较1年前增高5cm,遂说明黄金搭档增高效果非凡!抵消非研究因素,衬托处理因素的作用。随机(random)客观性(1)抽样随机 每一个符合条件的实验对象参加实验的机会相同,即总体中每个个体有相同的机会被抽到样本中来;(2)分组随机 每个实验对象分配到不同处理组的机会相同;(3)实验顺序随机 每个实验对象接受处理先后的机会相同。重复(repeated)结果的可靠性结果的真实性样本量估计不同的设计、不同的资料类型、不同的检验方法,对应于不同的样本量估计公式!200个以上,且日益增多!掌握其构造原理可以“一劳永逸”!42样本量估计原理界值界值C C/21-01拒绝H0不拒绝H0示例某医生调查了14例老年慢性支气管炎患者,其24h尿中类固醇排出量同时调查了11例正常人,其24h尿液中类固醇排出量假设检验 P0.05问:如果扩大样本量继续试验,需要多少样本?4445三临床试验中的统计学46临床试验的特点伦理性主观性费用昂贵研究对象的同质性差、依从性差临床试验分期化学物筛查细胞与动物试验 I 期临床试验 II期临床试验III期临床试验IV期临床试验新药研发(基本流程)试验方案知情同意书临床试验监视与督促质量控制收集数据研究报告申请上市新药发展计划批准上市数据管理统计分析SDA批准EC批准研究基地研究人员制定和修订试验方案设计病例报告表协助质量监控数据管理负责制定统计分析计划完成临床试验资料的统计分析提供试验结果的统计学分析报告和解释协助主要研究者完成临床试验的总结报告新药评审时上会答辩统计学者的具体工作临床试验设计优效性设计期望证明A药优于B药(1)A药效果B药(2)A药效果比B药好,且要超过XX以上XX表示从临床意义角度考虑而确定的一个界值如A药比B药降血压效果好2mmHg如A药比B药降血压效果好10mmHg对照的选择安慰剂阳性对照51临床试验设计非劣效设计期望证明A比B药差的不多,差距在某一范围内中药的最爱!52临床试验设计等效性设计期望证明A=B或A比B差的不能超过一定得范围,A也不能比B好的超过一定的范围!Pharmaceutical equivalenceBioequivalenceTherapeutic equivalence仿制药的最爱!53临床试验设计自适应设计目的:维护受试者利益、考虑申办商利益早期终止试验,以便进行更大的试验早期淘汰效果差的试验组II/III一体化受试者更换组别允许重新估计样本含量,以检验效能随机化避免人为因素导致的偏倚有效保证混杂因素在组间的均衡性满足经典统计模型的基本要求区组随机动态随机(最小化随机)保证重要的混杂因素在组间的均衡性自适应随机保证更多的受试者进入疗效较好的组别中心化随机55自适应随机分组胜者优先原则(play-the-winner rule)Friedmans Urn Model分配到试验组分配到对照组如果该病例有效,则加入如果该病例无效,则加入如果该病例有效,则加入如果该病例无效,则加入“机会均等”分配原则AZT试验组:239名ADIS病患者孕妇其中20名婴儿HIV病毒阳性;安慰剂对照组:238名ADIS病患者孕妇其中60名婴儿HIV病毒阳性。共有80名婴儿受难!“胜者优先”分配原则AZT试验组 360 名患者安慰剂对照组 117 名患者共有60名婴儿受难!减少20名!自适应随机中待解决的问题初始球设置及每次加球数响应延迟罐子种球的构成的极限情况最优分组多阶段最优分组样本量调整如何设盲如何进行药物编号如何分配药物59临床试验的规范化及信息化核查报告分析报告60临床试验中的规范化61核查报告分析报告临床试验中的信息化(一)中心化随机分组及在线系统实现(二)在线数据采集及管理中的关键技术(四)统计报告输出的RTF编码技术(三)自动化盲态核查规范与思路62临床试验中的信息平台展望WEB ServerSAS ServerData Server63四生物统计学(高级篇)64因素分析探讨某一医学事件的影响因素儿童身高的影响因素分析(线性回归)某一药物治疗效果的影响因素分析(Logistic回归)无锡地区糖尿病患病率的影响因素分析(Poisson回归)胃癌晚期患者术后生存时间的影响因素分析(Cox回归)南京市高中生高考成绩影响因素分析(多水平)对于生物统计学来说,其重点在于:(1)各模型的应用条件(2)多因素但建模策略Applied Logistic Regression65建模策略单变量分析单变量分析部分多因素分析部分多因素分析多因素筛选多因素筛选Stepwise/Best subsetsStepwise/Best subsets变量尺度变量尺度交互作用交互作用66复杂抽样及分析模型1897年挪威统计学家A.N.Kiaer在国际统计学会(ISI)上提出“用代表性抽样代替全面调查”的建议复杂样本的特性:多水平分层效应群内聚集性不等概率性67二阶段分层整群抽样4 42 2 2 23 3 3 31 1 1 17 7 7 76 6 6 68 85 5 5 513131212121211119 9 9 91010苏南苏南苏中苏中苏北苏北误差估计始终是研究的热点!泰勒线性估计法 BRR(balanced repeated replication)Jackknife法 Bootstrap法 ML(maximum likelihood estimation)PML(pseudo-maximum likelihood estimation)MPML(multilevel-PML estimation)基基于于设设计计多水多水平平模型模型地理信息系统中的统计学Geographically Weighted Regression(GWR)某个因素在某个因素在A 地区的影响力为地区的影响力为a1,在,在B 地区的影地区的影响力为响力为a2,a1 a2,即该因素的影响力随空间位,即该因素的影响力随空间位置不同而异;置不同而异;这种同一因素在不同地区间影响力的差异通常称这种同一因素在不同地区间影响力的差异通常称为空间非平稳性为空间非平稳性(Spatial Nonstationarity)。70分析模型地理加权回归(GWR)模型对一般线性回归模型(OLR)进行扩展,允许回归系数随空间位置i的变化而不同:(2)(yi;xi1,xi2,xik)为在地理位置(ui,vi)处的因变量y 和自变量观测值 k(ui,vi)为观测点(ui,vi)处的未知参数,它是(ui,vi)的未知函数。i 为独立同分布的随机误差,通常假定其服从N(0,2)。71GWR 模模型型中中的的参参数数在在每每个个回回归归点点(空空间间中中的的某某个个部部分分区区域域)是是不不同同的的,就就不不能能用用最最小小二二乘乘方方法法(OLS)估估计计参参数数,而而采采用用加加权权最最小小二二乘乘法法(WLS)方法。方法。回归点回归点i的参数估计向量表示如下:的参数估计向量表示如下:权重矩阵:1.专业角度;2.核函数727374传染病研究中的统计学传染病的发病预测江苏省19802000年伤寒副伤寒发病人数乘积季节模型预测结果 75全基因组研究中的生物统计学高维数据1,000个样本,1,000,000个SNP位点较之前几年,试验检测费用已大幅下降,但仍然较高高维灾难数据管理的挑战(横向-纵向)试验设计方法的挑战(多阶段设计)经费有限的情况下,考虑更多的位点位点数目有限的情况下,使得费用最低统计分析方法的挑战降维策略算法设计的挑战76药物不良反应预警中的统计学随着药品不良反应自愿报告系统(spontaneous reporting system,SRS)日益规范,SRS数据库容量迅速膨胀,基于海量数据的SRS信号监测技术越来越收到人们的重视,数据挖掘技术已逐步运用到药物警戒领域1。数据特点:仅有分子,没有分母,无法计算发生率77频数法报告比数比法(reporting odds ratio,ROR)报告率比例法(proportional reporting ratio,PRR)序贯检验(SPRT)贝叶斯法贝叶斯置信传播神经网络(BCPNN)经验贝叶斯伽玛泊松缩减(MGPS)综合法78年、季度2341234123412341112131415161718191101111PRR信号值MCU功能性宫内节育器致“宫内节育器异位”的预警信号趋势图(PRR法)200620072008200979计算统计(ComputationalStat)JacknifeBootstrapPermutationMonte Carlo Statistical Simulation80Thanks!Welcomediscussiontofindpointsincommonforcooperation!81新药临床试验中的统计学规范研究导师:陈峰教授于浩教授学生:魏永越临床试验中的统计学核查报告分析报告83核查报告分析报告研究内容(一)中心化随机分组及在线系统实现(二)在线数据采集及管理中的关键技术(四)统计报告输出的RTF编码技术(三)盲态核查规范与思路84(一)中心化随机分组及在线系统实现报告人:赵杨核查报告分析报告85研究背景l从管理角度l研究中心较多,各中心入组速度差别较大l试验晚期中心间药物调配l从方法角度l区组随机分组可以保证某些重要的分层因素在组间的均衡性,但仍然有出现不均衡的机会l能考虑分层因素的随机方法在传统随机分组模式下,操作流程复杂,手工操作的可行性低86中心化随机分组受试者等待入组随机分组中心或分组系统发送相关信息采用既定的方法进行随机分组告知随机分组结果患者随机编号01001药物编号28中心化区组随机最小随机分层随机87设计框架由于各中心竞争入组,事先无法确定各中心的样本量。因此,药物分配存在一定的困难。如何在盲法及多中心竞争入组的需求下实现各中心药物预分配,是中心化随机实施过程中的一个难点。88研究者随机分组的业务流程89随机分组流程示例1号中心有受试者等待入组随机分组系统90分层因素随机序列已入组病例数性别:男ABAB,BBAA,BABA4性别:女BBAA,ABAB,AABB1随机分组流程示例1号中心有受试者等待入组随机分组系统随机分组进入进入B组组药物编号组别 研究中心是否已用1A102B113A104B105B106A107B20 120A70随机选药药物编号组别 研究中心是否已用1A102B113A104B105B116A107B20 120A70分层因素随机表药物随机表随机编号01001药物编号 5将分组结果告知研究者药物分配单位可以是研究中心,或多个研究中心组成的大区。通过系统中的药物管理平台,可以实现药物预分配、补充分配及药物回收。91临床研究随机分组系统界面不同用户登陆后,所见菜单项目会有所不同92核查报告分析报告(二)在线数据采集及管理中的关键技术报告人:赵杨93传统数据流程修正错误修正错误数据需要经过多个环节,一般是项目结束后开始数据录入,间隔时间较久,数据回顾较为困难申办方检查实验进度,稽查研究质量较为不便如何快速获得准确的临床试验数据,是提高新药临床研究效率及结果可靠性的关键94基于网络的电子化数据流程WAPWEB监查员统计学家申办厂商管理机构数据采集模块核查模块数据查询交换模块项目管理员项目管理模块数据安全模块3R:实时采集数据实时核查数据实时导出数据95数据采集模块每个数据都会经过有效值校验及逻辑检查须双份录入的研究项目,须实时双份比对规范化合并用药名称与WHO药物词典数据库或MIMS对接规范化不良事件名称与MedDRA或WHOART数据库对接多途径数据采集基于WEB进行数据上传基于WAP智能手机进行初步数据采集,然后上网确认96核查模块管理员可根据研究方案,商定研究项目所需逻辑核查条目,并将其逐条配置入系统中监查员可对数据进行实时核查,对有疑问的数据,向研究者发送系统内疑问消息及Email提示,亦可生成疑问表供下载锁库前,必须检查每条疑问都有回复或修正97数据交换模块数据导入以既定的格式填写试验数据后上传数据导出导出试验数据及数据定义信息(ASCII/SAS/ODM XML/)生成PDF格式的CRF文档导出项目配置信息生成项目信息文件夹供提交管理部门当前项目研究数据项目数据文件夹项目配置信息及试验数据SFDA数据中心数据定义:yy/mm/dd98WANLAN数据安全安全性数字签名口令多重加密网络加密传输(SSL协议)稳定性数据切割及分布式存储数据服务器位于局域网内99100核查报告分析报告(三)盲态核查规范与思路报告人:魏永越101盲态逻辑核查设计思路CRFHOPIDWeightHeightSBPDBP逻辑核查列表逻辑核查核查报告疑问表系统将繁琐的核查程序封装在“黑匣子”中102初始系统配置参数逻辑核查生成报表REC文件备用模板盲态逻辑核查设计框架STEP1:1.初始化程序2.导出变量集3.生成模板STEP3:1.动态解析配置文件2.累加检查结果到数据集STEP4:1.生成逻辑核查报告2.导出每位受试者疑问表STEP2:1.配置逻辑核查表达式2.配置各中心参考值范围初始系统配置参数逻辑核查生成报表103STEP1.1系统初始化(格式化文件夹)%InitPrjDirAndCfgTemplate;数据文件模版文件初始系统104STEP1.2系统初始化(生成配置文件)105STEP2配置项目参数(逻辑表达式)OID1NameBirthReferenceTargetBirthMessage年龄必须在18-70岁之间Description年龄必须符合纳入标准CheckExpressionnot(18 Age badacce5业务宏段落:%AddParagraph();%AddParagraphText();表格:%AddTable();%AddRow();%AddCell();%AddCellText();文档:%AddDoc();%AddEmptyPar;%AddSection;文档组装宏%GetParagraphRTFCode();%GetTableCellRTFCode();%GetTableRowRTFCode();%GetTableRTFCode();%GetHeaderRTFCode();%GetFooterRTFCode();114核查报告疑问表115统计学规范与程序116致谢 感感谢金谢金丕丕焕焕教授、教授、夏夏结来教授结来教授 感感谢导师陈峰教授、于浩教授谢导师陈峰教授、于浩教授 感感谢谢团团队队117结束语结束语谢谢大家聆听!谢谢大家聆听!118
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!