数据分析课程设计 NBA球员技术统计分析报告

上传人:m**** 文档编号:160974564 上传时间:2022-10-12 格式:DOCX 页数:20 大小:226.60KB
返回 下载 相关 举报
数据分析课程设计 NBA球员技术统计分析报告_第1页
第1页 / 共20页
数据分析课程设计 NBA球员技术统计分析报告_第2页
第2页 / 共20页
数据分析课程设计 NBA球员技术统计分析报告_第3页
第3页 / 共20页
点击查看更多>>
资源描述
百度文库-让每个人平等地提升自我成绩评定表学生姓名严震班级学号14专业信息与计算课程设计题目NBA球员技科学术统计分析报告评语组长签字:成绩日期20 年 月曰课程设计任务书学院理学院专业信息与计算科学学生姓名严震班级学号14课程设计题目NBA球员技术统计分析报告实践教学要求与任务:设计要求(技术参数):1、熟练掌握SPSS软件的操作方法;根据所选题目及调研所得数据,运用数据分析知识,建立适当的数学模型; 运用SPSS软件,对模型进行求解,对结果进行分析并得出结论 掌握利用数据分析理论知识解决实际问题的一般步骤。2、3、4、设计任务:1、查阅相关资料,找到NBA球员技术的相关指标,获得相关数据;2、利用数据分析的理论,建立线性回归模型,以及对其进行主成分分析;3、利用SPSS软件求解,并给出正确的结论。工作计划与进度安排:第一天一一第二天 第三天一一第四天 第五天一一第六天 第七天一一第九天 第十天学习使用SPSS软件并选题 查阅资料建立数学模型上机求解并完成论文答辩指导教师:专业负责人:学院教学副院长:201年 月201 年 月曰201 年 月曰数据分析析的主要应用有两方面,一是寻求基本结构,简化观测系统,将具有错综 复杂关系的对象(变量或样品)综合为少数几个因子(不可观测的,相互独立的随机变 量),以再现因子与原变量之间的内在联系;二是用于分类,对p个变量或n个样品进行 分类。聚类分析一般有两种类型,即按样品聚类或按变量(指标)聚类,其基本思想是 通过定义样品或变量间“接近程度”的度量,将“相近”的样品或变量归为一类。本文 利用利用数据分析中的因子分析和聚类分析对多个变量数据进行了分析。就是分析和处 理数据的理论与方法,数据分析中提出了广泛的多元数据分析的统计方法,包括线性回 归分析、方差分析、因子分析、主成分分析、典型相关分析、判别分析、聚类分析等。关键词:SPSS软件;聚类分析;因子分析;线性规划1数据分析的任务和目的0问题的背景0任务和目的02 数据的搜集与整理2数据的来源2数据的处理2定义视图23 利用SPSS软件对结果进行分析4总结13参考文献141数据分析的任务和目的问题的背景一年一度的nba赛季让全世界的篮球迷为之疯狂,nba赛事之所以如此 受欢迎,最主要的原因在于nba球员高超的球技。球队中灵魂人物的个人发挥 能够直接影响其球队的成败。因而对他们的技术统计与分析是一件十分重要的事 情。众所周知,科比-布莱恩特和阿伦-艾弗森是深受大家喜爱的两位球员,两位 球员在赛季的发挥也在一定程度上影响着两队的战绩。因此,通过两位球员在以 往的赛季中的发挥及表现,可以大概的预测两人的得分及表现,为nba相关的 商业活动和广大球迷提供数据上的参考。任务和目的1、频数分析(对两人平均每场上场时间进行频数分析)2、基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比 较)3、单样本t检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均 值是否为)4、两独立样本t检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较)5、单样本非参数假设检验(检验科比-布莱恩特平均每场进攻次数与首发 的关系基本是否为 1: 1: 10: 10: 10: 10: 10: 10: 10: 10: 2)6、单样本非参数假设检验(检验科比一布莱恩特和阿伦一艾弗森平均每场盖帽 次数总体的分布是否为正态分布)7、单样本非参数假设检验(检验科比-布莱恩特在某段时间内平均每场得分 是否持续正常)8、单因素方差分析(用单因素方差分析,分别分析科比-布莱恩特和阿伦-艾 弗森平均每场防守次数对平均每场得分有无显著影响)9、相关分析(研究平均每场三分球命中率与平均每场得分之间是否具有较强的线性关系)10、偏相关分析(以平均每场失误次数为控制变量,研究平均每场罚球命中 率与平均每场得分的偏相关关系)11、线性回归分析(用逐步筛选法找科比-布莱恩特的平均每场得分的线性 回归方程)12、曲线回归分析(用曲线回归分析法分析科比-布莱恩特的平均每场得分)2数据的搜集与整理数据的来源NBA球员科比-布莱恩特和阿伦-艾弗森11个赛季技术统计表下载自NBA 中文官方网站,具有可信度。数据的处理定义视图数据视图:3 利用 SPSS 软件对结果进行分析(1)频数分析(对两人平均每场上场时间进行频数分析) 数据文件中增加一个变量scsj。NBA球员*分组后上场时间CrosstabulationCount分组后上场时间Total12NBA阿伦-艾弗森11011球员科比-布莱恩特7411Total81422输出1Chi-Square TestsValuedfAsymp. Sig. (2-sided)Exact Sig.(2-sided)Exact Sig. (1-sided)Pears on Chi-Square7.071b1.008Contin uity Correctio na4.9111.027Likelihood Ratio7.7191.005Fishers Exact Test.024.012N of Valid Cases22a. Computed only for a 2x2 tableb. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 4.00.输出2分析:从输出1中看出,阿伦-艾弗森平均每场上场时间在10-40 (分钟)的频数为1, 在40-50 (分钟)的频数为10;科比-布莱恩特平均每场上场时间在10-40 (分 钟)的频数为7,在40-50 (分钟)的频数为4;两人平均每场上场时间在10-40(分钟)的频数为8,在40-50 (分钟)的频数为14。从输出2中看出,交叉分组下的频数分析卡方检验结果的相伴概率为,小于显著性水平,故拒绝原假设,认为两人的平均每场上场时间存在显著性差异。(2)基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比较) 实现按NBA球员拆分,输出结果放在同一张表中。Descriptive StatisticsNMinimumMea nStd.Skew nessNBA求员StatisticStatisticStatisticStd. Erroi戰vtatonStatisticStd. Erroi科t比布莱恩特平均每场投篮命中率11.4170.449364.005401.0179124-.580.661平均每场三分球命中卫負11.2500.324636.012164.0403442-.503.661平均每场罚球命中率11.7940.831909.005513.0182836-.736.661Valid N (listwise)11阿伦艾弗森平均每场投篮命中率11.3870.419636.006128.0203237.666.661平均每场三分球命中卫負11.2340.300909.009339.0309724-.706.661平均每场罚球命中率11.7020.778818.016848.0558799.248.661Valid N (listwise)11输出3 分析:从输出3中看出,科比-布莱恩特的平均每场投篮命中率、平均每场三分球命 中率和平均每场罚球命中率的均值均比阿伦-艾弗森高,但标准差有高有底, 说明在投篮方面科比-布莱恩特比阿伦-艾弗森发挥出色,但稳定程度高低不定。 均值的统计误差均小于(比较小),说明数据没有不均衡现象,说明两人的发挥 都比较稳定。(3)单样本t检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均 值是否为)实现按NBA球员拆分,输出结果放在同一张表中。One-Sample TestNBA求员Test Value = 2.7tdfSig. (2-tailed)Mea n Differe nee95% CcIntervcDiffe)n fide nee il of the renceLowerUpper阿伦-艾弗森平均每场犯规次数-4.79910.001-.6818-.9984-.3652科比-布来恩特平均每场犯规次数.29710.773.0473-.3079.4025输出4分析:从输出4中得,阿伦-艾弗森单样本假设的相伴概率为,小于显著性水平,故 拒绝原假设,认为阿伦-艾弗森平均每场犯规次数的均值与有显著性差异;科比- 布莱恩特单样本假设的相伴概率为,大于显著性水平,故接受原假设,认为科比 -布莱恩特平均每场犯规次数的均值与无显著性差异。(4)两独立样本t检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较)Independent Samples TestLeveiseTest for Equity of Varia ncest-test for EyurfliMea nsFSig.tdfSig.(2eajMea n Dffere ncStd. Err( eferenc95% Con fider In terval of th or Dfere neee LowerUpper平均每场犯规次数uvbria nces as Equvferia nces no assumed;ume0l19.8933.413.41r 20r 19.74.0030.003.729.729:.2135.21355 .28365 .28323 1.17456 1.1749输出5分析:从输出5中看出,两独立样本F检验结果的相伴概率为,小于显著性水平,故 拒绝原假设,认为阿伦-艾弗森与科比-布莱恩特平均每场犯规次数的方差有显著 性差异;两独立样本t检验结果的相伴概率为,小于显著性水平,故拒绝原假设, 认为阿伦-艾弗森与科比-布莱恩特平均每场犯规次数的均值有显著性差异。(5)单样本非参数假设检验(检验科比-布莱恩特平均每场进攻次数与首发的关系基本是否为 1: 1: 10: 10: 10: 10: 10: 10: 10: 10: 2)赛季Observed NExpected NResidual11.1.9211.2-.2311.2-.2411.2-.2511.2-.2611.2-.2711.2-.2811.2-.2911.2-.21011.2-.2111.2.8Total11输出6Test Statistics赛季Chi-Squarea9.291df10Asymp. Sig.505a. 11 cells (100.0%) have expected freque ncies lesstha n 5. The minimum expected cell freque ncy is .1.分析:从输出7中看出,非参数假设检验卡方分布的相伴概率为,大于显著性水平, 故接受假设,认为样本来自的总体分布与理论分布无显著差异,即科比-布莱恩 特与首发的关系基本是为I: I: 10: 10: 10: 10: 10: 10: 10: 10: 2。(6)单样本非参数假设检验(检验科比-布莱恩特和阿伦-艾弗森平均每场盖帽次 数总体的分布是否为正态分布)实现按NBA球员拆分,输出结果放在同一张表中。One-Sam ple Kolmogorov-Smirnov TestNBA球员平均每场 盖帽次数科比-布来恩特N11Normal ParametersMea n.5855Std. Deviati on.27145Most ExtremeAbsolute.159Differe ncesPositive.159Negative-.149Kolmogorov-Smir nov Z.526Asymp. Sig. (2-tailed).945阿伦-艾弗森N11Normal ParametersMea n.1773Std. Deviati on.09111Most ExtremeAbsolute.212Differe ncesPositive.212Negative-.143Kolmogorov-Smir nov Z.702Asymp. Sig. (2-tailed).709a. Test distributen is Normal.b. Calculated from data.输出8分析:从输出8看出,科比-布莱恩特的平均每场盖帽次数非参数检验结果的相伴概率 为,大于显著性水平,故接受原假设,认为科比-布莱恩特的平均每场盖帽次数 服从正态分布;阿伦-艾弗森的平均每场盖帽次数非参数检验结果的相伴概率为, 大于显著性水平,故接受原假设,认为科比-布莱恩特的平均每场盖帽次数服从 正态分布。(7)单样本非参数假设检验(检验科比-布莱恩特在某段时间内平均每场得分是 否持续正常)Runs Test平均每 场得分Test Valuea24.1Cases = Test Value6Total Cases11Number of Runs4Z-1.254Asymp. Sig. (2-tailed).210a. Median输出9分析:从输出9看出,随机性检验结果的相伴概率为,大于显著性水平,故接受 假设,认为科比-布莱恩特平均每场得分是随机的。(8)单因素方差分析(用单因素方差分析,分别分析科比-布莱恩特和阿伦-艾弗 森平均每场防守次数对平均每场得分有无显著影响)ANOVA平均每场得分NBA球员Sum of SquaresdfMean SquareFSig.科比-布莱恩特Between Groups415.6144103.9034.280.056Within Groups145.673624.279Total561.28710阿伦-艾弗森Between Groups11.128111.128.873.374Within Groups114.668912.741Total125.79610输出10 分析:从输出10中看出,科比-布莱恩特单因素方差分析结果的相伴概率为,大于显 著性水平,故接受假设,认为科比-布莱恩特的平均每场防守次数对平均每场得 分无显著影响;阿伦-艾弗森单因素方差分析结果的相伴概率为,大于显著性水 平,故接受假设,认为科比-布莱恩特的平均每场防守次数对平均每场得分无显 著影响。9)相关分析(研究平均每场三分球命中率与平均每场得分之间是否具有较强的线性关系)4030口口口 口口 口20 平均每场得分100 ”.22.24.26.28.30.32.34.36.38.40平均每场三分球命中率输出11Correlat ions平均每 场得分平均每场三 分球命中率平均每场得分Pears on Correlati on1-.218Sig. (2-tailed).329N2222平均每场三分球命中率Pears on Correlati on-.2181Sig. (2-tailed).329.N2222输出12分析:从输出11中看出,平均每场三分球命中率与平均每场得分之间不具有较 强的线性关系;从输出12中看出,相关分析的相伴概率为,大于显著性水平,故 接受原假设,认为平均每场三分球命中率与平均每场得分之间不具有较强的线性 关系。两种方法得到结果一致。10) 偏相关分析(以平均每场失误次数为控制变量,研究平均每场罚球命中 率与平均每场得分的偏相关关系)P A R T I A L C O R R E L A T I O N C O E F F I C I E N T SControlling for.V15V17V9V17.3626(0)(19)P=.P=.106V9.3626(19)(0)P=.106P=.(Coefficient / .) / 2-tailed Significance). is printed if a coefficient cannot be computed 输出13分析:从输出13中看出,偏相关分析结果的相伴概率为,大于显著性水平,故接受 假设,认为以平均每场失误次数为控制变量,平均每场罚球命中率与平均每场得 分的偏相关关系不显著。(11)线性回归分析(用逐步筛选法找科比-布莱恩特的平均每场得分的线性回 归方程)Variables Entered/Removed aModelVariables En teredVariables RemovedMethod1平均每场 上场时间-Stepwise (Criteria: Probability -of-F-to-e n ter = .100).a. Dependent Variable:平均每场得分输出14Model SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.901a.813.7923.4196a. Predictors: (Constant),平均每场上场时间输出15ANOVAbModelSum of SquaresdfMean SquareFSig.1Regressi on456.0471456.04739.000.000 aResidual105.240911.693Total561.28710a. Predictors: (Constant),平均每场上场时间b. Dependent Variable:平均每场得分输出16CoefficientsaModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSia.BStd. ErrorBeta1(Co nsta nt)-6.6124.955-1.334.215平均每场上场时间.839.134.9016.245.000a. Dependent Variable:平均每场得分输出17Excluded Variables bModelReta IntSig.Partial CorrelationCollinearity StatisticsTolerance1赛季.267 a1.395.200.442.515平均每场投篮命中率-.267 a-1.376.206-.438.504平均每场三分球命中率.255 a1.880.097.554.885平均每场罚球命中率.132a.725.489.248.668平均每场进攻次数-.162 a-.930.380-.312.701平均每场防守次数-.066 a-.140.892-.049.106平均每场助攻次数-.066 a-.169.870-.060.154平均每场抢断次数.301a1.216.259.395.324平均每场盖帽次数-.200 a-1.365.209-.435.886平均每场失误次数-.031a-.103.921-.036.256平均每场犯规次数-.433 a-1.626.143-.498.248a. Predictors in the Model: (Constant),平均每场上场时间b. Dependent Variable:平均每场得分输出18分析:从输出14中看出,本次多元分析回归分析采用的是逐步筛选法,且回归系数显著性F检验的相伴概率值小于的自变量引入了回归方程,大于的自变量剔除了回归方程。自变量进入回归方程的次序是:平均每场上场时间。从输出18中看出,科比-布莱恩特的平均每场得分的最终线性回归方程为 平均每场得分=*平均每场上场时间+。(12)曲线回归分析(用曲线回归分析法分析科比-布莱恩特的平均每场得分)MODEL: MOD 1.Independent: V7DependentMthRsq .F SigfV17LIN.2509.117V17QUA.7708.0039 V17CUB.7718.003Notes:9 Tolerance limits reached;输出19ObservedLinearQuadaticCube分析:从输出19中看出,线性模型的相伴概率为,大于显著性水平,故接受原假设, 认为线性模型的方程不显著;二次曲线与三次曲线的相伴概率均为,小于显著性 水平,故拒绝原假设,认为线性模型的方程显著;且三次的曲线拟合度最高,因 此选定三次曲线模型。具体模型是:平均每场得分=+ *平均每场投篮命中率-16414*平均每场投篮命中率人3经过这次的大作业的锻炼,是我对这学期所学到的数据分析方法和对SPSS 的操作有了更加深刻的理解和认识,在课设的过程中不断有问题出现,又不断地 查资料或请教老师同学的情况下,终于对SPSS有了进一步的了解。这份作业以 深受大家喜爱的N球星的技术分析为例,探讨了如何用统计软件SPSS对原始 数据进行科学的统计分析。虽然完成了此次课程设计,但是我深刻地感觉到数据分析在现实生活中的重 要作用,并且认识到以前学到的东西还是非常浅显的,还要在以后的学习过程中 注意多思考、多应用。在此还要特别感谢马建军老师的指导,是我学会了一些科 学的数据分析方法。参考文献1. SPSS中文版常用功能与应用实例精讲电子工业出版社2. 数据统计与分析技术一一SPSS软件实用教程,高等教育出版社
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑环境 > 建筑资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!