《基本统计分析》PPT课件.ppt

上传人:tia****nde 文档编号:11504940 上传时间:2020-04-26 格式:PPT 页数:51 大小:280.50KB
返回 下载 相关 举报
《基本统计分析》PPT课件.ppt_第1页
第1页 / 共51页
《基本统计分析》PPT课件.ppt_第2页
第2页 / 共51页
《基本统计分析》PPT课件.ppt_第3页
第3页 / 共51页
点击查看更多>>
资源描述
第四章SPSS的基本统计分析,SPSS的基本统计分析,频数分析-对应表格法,计算描述统计量-对应数值法,探索性描述分析-结合,交叉分组下的频数分析,多选项分析,统计图-对应图形法,频数分析,目的粗略把握变量的总体分布状况。例:对某个问题的总体看法,如新业务的使用愿望、教学效果等对某事物的客观描述,如通话的漫游类型、大客户的行业分布采用的方法制作频数分布表:包括计算频数、累计频数、百分比、累计百分比绘制统计图形:条形图(品质数据)、饼图、直方图(数量数据),频数分析,基本操作步骤(1)菜单选项:Analyze-DescriptiveStatistics-Frequencies(2)选择几个待分析的变量到variables框.(3)chart选项,选择所需要的图形例:班级男女生频数分布表、成绩分布表,频数分析,应用举例移动通话的漫游类型分析特点:定类数据使用频数、百分比、总数(不可缺少的)不使用频数表中给出的累计频数和累计百分比移动通话时间分析、移动客户话费分析特点:定序数据、数量数据除使用频数、百分比、总数外,还可以充分使用累计频数和累计百分比,频数分析,数据中存在缺失值使用有效百分比(分母为有效样本数)例:学生成绩得优率、得良率Frequencies-Format频数分布表输出按变量值、频数升序、降序输出,频数分析,频数分析中的其他分析计算中位数、分位数:适用于定序、定距数据数据按升序排序后,找到若干个分位点上的变量值quartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU)cutpointsfornequalgroups:n等份percentile:自定义百分位点计算众数:适用于定类数据(但必须是数值型),频数分析,频数分析中的其他分析分位数的应用从一个侧面比较两组样本数据的集中趋势例:(QL=50,QU=80)和(QL=70,QU=75)的比较在排除极端值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度例:(QL=50,QU=80)和(QL=70,QU=75)的比较分位数、中位数、众数的应用举例不同类型的移动客户月话费比较(数据拆分)利用分位数(不显示频数分布表),比较男女生成绩集中程度,计算描述统计量,目的精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭程度。基本方法计算基本描述统计量,计算描述统计量,描述集中趋势的统计量均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。适用于定距数据。特点:利用了全部数据,易受极端值的影响。描述离散程度的统计量标准差(standarddeviation-StdDev):表示某变量的所有变量值离散趋势的统计量。SPSS中计算的是样本标准差。方差(variance):标准差的平方。SPSS中计算的是样本方差。极差(range):最大值(minimum)-最小值(minimum),计算描述统计量,描述对称程度的统计量偏度(skewness):描述某变量所有变量值分布形态的偏斜程度和方向的统计量.偏度为0表示对称;大于0表示正偏差大(右偏),众数比均值小,极值大于均值;小于0表示负偏差大(左偏)。,计算描述统计量,描述陡峭程度的统计量峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。峭度为0表示与正态分布峭度相同。大于0表示比正态分布陡,尖峰。小于0表示比正态分布缓;平峰。,计算描述统计量,其他统计量均值标准误差(S.Emeans)中心极限定理认为:样本均值N(u,2/n)反映样本均值与总体真值间的平均离散程度样本数越大,样本均值的离散程度越小,对真值的估计越准确,计算描述统计量,基本操作步骤(1)菜单选项:Analyze-DescriptiveStatistics-Descripive(2)选择将参加计算的数值型变量名到Variables框。仅适用于数值型变量分析比较男生和女生的学习成绩比较集中趋势比较离散趋势比较偏斜程度比较陡峭程度实现方式:数据拆分,其他功能数据标准化处理新变量的均值为0,标准差为1;小于0表示在平均水平下,大于0反之.正态分布的数据标准化后呈标准正态分布(68%,95%,99%)savestandardizedvaluesasvariables选项将变量作标准化后,结果存入名为“Z+原变量名”的新变量中.数据标准化处理应用举例快速找到移动话费出众的客户网通集团企业效益评价,计算描述统计量,探索性描述分析,目的:在未知数据分布特点情况下,通过计算详尽描述统计量,辅助全面的统计图,认识数据分布。基本操作步骤(1)菜单选项:analyze-descriptivestatistics-Explore(2)选择将参加计算的数值型变量名到Dependentlist框(3)进行分组描述分析时,将分组变量选入Factlist框描述统计量:M统计量:集中趋势的估计值,不受极端值影响。用于判断有无异常值。,探索性描述分析,相关图形箱线图茎叶图直方图正态分布图:检验变量是否符合正态分布方差齐性检验:各组离散程度是否相同H0:方差相等举例:两班学生成绩分布情况,离散程度是否相同。,购买流行服装,交叉分组下的频数分析,针对定类数据和定序数据的频数分析(用于定类定序数据分析有customtablelogisticloglinear)目的:通过了解不同变量在不同水平下的数据分布情况,判断水平对变量是否有影响例:女生的学习成绩比男生好吗?(两变量)不同专业的女生学习成绩都比男生好吗?(三变量)分析的主要步骤产生交叉列联表分析列联表中变量间的关系,产生交叉列联表,什么是列联表多个变量在不同取值下的数据分布频数表,列变量,行变量,工商管理,控制变量,频数,产生交叉列联表,基本操作步骤(1)菜单选项:analyze-descriptivestatistics-crosstabs(2)选择一个变量作为行变量到row框.(3)选择一个变量作为列变量到column框.(4)可选一个或多个变量作为控制变量到layer框.(5)是否显示各分组的条图(displayclusteredbarcharts),产生交叉列联表,定距数据可做适当分组后再产生列联表仅利用频数,信息利用不充分进一步计算cells选项:选择在频数分析表中输出各种百分比.row:行百分比(Rowpct);column:列百分比(Colpct);total:总百分比(Totpct);,分析列联表中变量间的关系,目的:通过列联表分析,检验行列变量之间是否独立。方法:卡方检验:对品质数据的相关性进行度量(这里两变量均为定类数据或定序数据),分析列联表中变量间的关系,卡方检验基本步骤(1)H0:行列变量之间无关联或相互独立(2)构造卡方统计量统计量服从(r-1)*(c-1)个自由度的卡方分布count:观察(实际)频数expectedcount:期望频数(期望频数反映的是H0成立情况下的数据分布特征),分析列联表中变量间的关系,卡方检验基本步骤(3)计算卡方统计量的值,并得到该统计量值的概率P值(4)决策。概率P与显著性水平比较,小于等于则拒绝H0,否则不能拒绝实现步骤statistics选项cells选项,卡方检验的要求:一般要求列联表中期望频数小于5的格子数不超过20%,否则会夸大卡方值,容易得出拒绝结论,可以采用精确检验。N=40,T=5,Pearson卡方检验,若P,改用确切概率法检验NDefineVariableSets从原变量中选取被分解的变量(数值型)到variablesinsets框指定被分解的变量是按多选项二分法(dichotomies)分解还是按多选项分类法(categories)分解的.为变量集命名。系统自动在名字前加字符$.,多选项分析,多选项频数分析菜单选项:analyze-multipleresponse-frequencies选择待分析的多选项变量集到tablesfor框。缺失数据处理:只要有一个变量含有缺失值就将该个案剔除excludecaseslistwisewithindichotomies:只用于二分变量多项选择的分析。excludecaseslistwisewithincategories:只用于分类变量多项选择的分析。,多选项分析,多选项交叉分析下的频数分析菜单选项:analyze-multipleresponse-crosstabs选择行变量并定义取值范围选择列变量并定义取值范围选择控制变量并定义取值范围其他选项常用分析指标:应答人数百分比(percentofcases):选择该项的人占总人数的比例(较大)应答次数百分比(percentofresponses):选择该项的次数占总应答次数的比例(较小),多选项分析,多选项分析实例在某次市场调查中收集了北京、上海和广州三个城市的受访者对几种常见饮料的喜好情况,可选的饮料有茶、牛奶、咖啡、果汁、矿泉水。(数据是从原始数据库中抽出的一小部分资料),作以下分析:采用二分法组织数据受访人群中最受欢迎的饮料是哪种?男、女喜爱的饮料有无差异?三个城市的人群对饮料的喜好有无差异?不同学历的消费者休闲方式有无差异?,统计图形的种类及用途,1、用于显示频数分布:(Line和Area也能作,但不很适合)Bar(不仅仅用于)Pie:Histogram:Boxplot:ErrorBar:显示总体分布2、用于判断数据分布P-P图Q-Q图,统计图形的种类及用途,3、用于时间序列LineAreaBar:High-low:类似K线图4、用于观察数量变量之间关系scatter,电信增值业务市场前景(以法国为例),统计图形的种类及用途,5、用于数据分析Pareto分析重要因素Control分析数据变异统计图形在SPSS中分为一般统计图和交互式统计图,条形图,其他汇总方式的条图:各科成绩的均值、各省份移动收入比例复式条图和堆积条图:两班男女生成绩均值,统计图的编辑,双击图形进入编辑状态图形的转换:条图、线图、面积图和饼图之间可互相转换散点图和直方图之间可互相转换2、图形的设置:适用于复式和堆积图,统计图的编辑,3、图形坐标设置ScaleAxis:条图、线图、面积图中的纵轴,散点图、直方图中的纵轴和横轴Categeries:条图、线图、面积图中的横轴4、图形格式设置Fomat-注:需选中相应的元素,散点图,1、简单散点图:用于观察两变量之间关系收入增长率与业务渗透率、GDP之间关系2、矩阵散点图:用于观察多变量之间的两两关系nXn矩阵:3、重叠散点图:用于观察多变量与某一变量之间的关系4、三维散点图:用于观察三变量在三维空间中的关系,Options拟合回归线:线性、二次曲线、三次曲线、加权回归平滑预测区间显示某些散点标签,散点图的编辑,P-P图和Q-Q图,P-P图将某变量的累积概率与指定理论分布累积概率相对比,观察某样本数据是否符合指定分布Q-Q图将某变量的分位数与指定理论分布分位数相对比,观察某样本数据是否符合指定分布结果与P-P图基本相同,交互式统计图,特点:拖放式操作存储数据,编辑时可改变更多图形种类:两维图形三维图形(三个坐标轴)三维效果图形(两个坐标轴)变量类别:加入内置变量,交互式条图,Graph-Intergraph-BarAssignVaribles选择图形种类、各种变量BarchartOptions直条形状、标签、基线值ErrorBars:Y轴为scale变量均值时,标出置信区间TitlesOptions分类变量排序、坐标数值范围、图形模版、坐标轴长度,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!