数学建模数据录入课件

上传人:无*** 文档编号:241428792 上传时间:2024-06-25 格式:PPT 页数:37 大小:1.49MB
返回 下载 相关 举报
数学建模数据录入课件_第1页
第1页 / 共37页
数学建模数据录入课件_第2页
第2页 / 共37页
数学建模数据录入课件_第3页
第3页 / 共37页
点击查看更多>>
资源描述
第二讲 数据录入与获取本讲主要解决两个问题:本讲主要解决两个问题:第一个问题,第一个问题,根据问题类型的不同,将会从开放题、单根据问题类型的不同,将会从开放题、单选题和多选题的录入方式为例进行介绍。选题和多选题的录入方式为例进行介绍。第二个问题,第二个问题,重点介绍如何用重点介绍如何用SPSS直接读取直接读取Excel类型类型和文本格式的数据,以及如何用和文本格式的数据,以及如何用ODBC接口读取数据库接口读取数据库文件。文件。数据录入的前期准备数据文件的收集 主要包括:数据结构的收集 数据内容的收集数据文件的组织 主要包括:原始数据的组织方式 频数数据的组织方式SPSS数据文件收集SPSS数据文件的保存形式为“xxx.sav”格式。SPSS数据文件的结构1、数据结构 类型、取值说明、数据的缺失情况(图2.1)2、数据内容:待分析数据(图2.2)数据结构数据内容数数 据据 视视 图图可可 以以 直直 接接输输 入入 观观 测测数数 据据 值值 或或存存放放数数据据,表表 的的 左左 端端列列 边边 框框 显显示示 观观 测测 个个体体的的序序号号,最最 上上 端端 行行边边 框框 显显 示示变量名。变量名。标尺栏菜单栏工具栏数据输入区数据编辑区窗口标签标题栏状态栏当前数据栏显示区滚动条问题:由于一般的文本文件仅有数据部分,无数据结构的描述(见图2.3),所以SPSS数据文件不能像一般文本文件那样被大多数编辑软件打开。只能在SPSS中打开。Variable View表用来定义和修改变量的名称、表用来定义和修改变量的名称、类型及其他属性,如图所示。类型及其他属性,如图所示。如果输入变量名后回车,将给出变量的默认属性。如果不定如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接输入数据,系统将默认变量义变量的属性,直接输入数据,系统将默认变量Var00001,Var00002等。等。在在Variable View表中,每一行描述一个变量,依次是:表中,每一行描述一个变量,依次是:Name:变量名。变量名。Type:变量类型。变量类型。Width:变量所占的宽度。变量所占的宽度。Decimals:小数点后位数。小数点后位数。Label:变量标签。关于变量涵义的详细说明。变量标签。关于变量涵义的详细说明。Values:变量值标签。关于变量各个取值的涵义说明。变量值标签。关于变量各个取值的涵义说明。Missing:缺失值的处理方式。缺失值的处理方式。Columns:变量在变量在Date View 中所显示的列宽(默认列宽为中所显示的列宽(默认列宽为8)。)。Align:数据对齐格式(默认为右对齐)。:数据对齐格式(默认为右对齐)。Measure:数据的测度方式。系统给出名义尺度、定序尺度和等数据的测度方式。系统给出名义尺度、定序尺度和等间距尺度三种(默认为等间距尺度)。间距尺度三种(默认为等间距尺度)。为了在统计分析过程中能有效的利用其它软件产生的数为了在统计分析过程中能有效的利用其它软件产生的数据,据,SPSS软件编辑窗口除可以使用软件编辑窗口除可以使用*.sav扩展名数据文件,扩展名数据文件,还可以直接打开和保存下述类型的文件:还可以直接打开和保存下述类型的文件:SPSS DOS版本产生的数据文件版本产生的数据文件*.sys;Excel 报表程序产生的数据文件报表程序产生的数据文件*.xls;DBASE 数据库格式文件数据库格式文件*.dbf;SAS统计软件产生的数据文件。统计软件产生的数据文件。第一步 制定变量名(name)变量名是变量访问和分析的唯一标志。变量名的字符个数不多于8个。首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、原点不能为变量名的最后一个字符。变量名不区分大小写字母。允许汉字作为变量名,汉字总数不能超过4个,不能使用特定含义名如:ALL、BY、AND、NOT、OR等SPSS有默认的变量名,以字母“VAR”开头,后面补足5为数字,如:VAR00001、VAR00002等。第二步 制定每个数据的属性一、变量的储存类型SPSS中,变量有三种的基本类型:数值型、字符型和日期型。数值型:数值型:数值型的数据是数值型的数据是0-9的阿拉伯数字和其他符号,的阿拉伯数字和其他符号,如美元符号、逗号或圆点组成的。如美元符号、逗号或圆点组成的。标准型(Numeric)标准型是SPSS默认的数据类型,默认最大宽度为8位,包括正负符号位、小数点和小数位在内,小数位默认为2位。如果数据的实际宽度大于8,SPSS将自动按照科学计数法显示。(*注:数据的显示不影响数据的存储和计算)科学记数法型(Scientific Notation)科学记数法型是一种常见的数值型数据的表达方式。例:1.2E02。E表示以十为底,02表示正(负)的2次方。科学记数法默认最大宽度为8,其中包括了正负符号位、字母E和符号位后的两位幂次数字。(*注:当类型设定为科学记数法型时可以按照标准型方式输入,SPSS会自行转换)逗号型(comma)此类型数据从整数部分的各位开始每三位以一个逗号分隔,默认的最大宽度为8,小数位为2,逗号所占的位数包括在总显示宽度之内。例:1,234.56(*注:在输入时不用输入逗号,SPSS自动在对应位添加逗号。)圆点型(Dot)此类型数据从整数部分的各位开始每三位以一个原点分隔,逗号作为整数和小数部分的分隔符。默认的最大宽度为8,小数位为2。(*注:在输入时不用输入原点,SPSS自动在对应位添加原点。)美元符号型(Dollar)此类型主要用来表示货币数据,在数据前附加美元符号。例:123,456.78用户自定义型(Custom Currency)如果用户认为上述五种类型均不能满足需要,可以再定义不超过四种的表示方式。这四种方式的名字为:CCA、CCB、CCC、CCD。SPSS系统预先将它们定义成逗号数值型,用户可以进行重新定义。重新定义的菜单顺序为:EditOptionsCurrency。自定义类型字符型字符型字符型数据的默认显示字符型数据的默认显示宽度为宽度为8 8个字符位个字符位,系统不,系统不区分变量名中的大小写字母,并且不能进行数学区分变量名中的大小写字母,并且不能进行数学运算。运算。注意:在输入数据时不应输入引号,否则双引号注意:在输入数据时不应输入引号,否则双引号将会作为字符型数据的一部分。将会作为字符型数据的一部分。日期型用来表示日期或时间。日期型数据的显示格式有很多,SPSS以菜单方式列出日期型数据的显示格式以供用户选择。事实上,SPSS存储中的日期型变量是该实践与1582年10月14日零点相差的秒数。关于日期型格式的几点说明:关于日期型格式的几点说明:“m”在年与日(字母在年与日(字母y与与d)之间表示月份;在时)之间表示月份;在时与秒(字母与秒(字母h与与s)之间表示)之间表示“分分”钟。钟。“mmm”表示要求书写英文月份单词的前三个字母表示要求书写英文月份单词的前三个字母组成的缩写。组成的缩写。“ddd”三个字母三个字母d表示要求用从元月一日算起的表示要求用从元月一日算起的日数表示日期。日数表示日期。指定了日期变量的格式,不一定在输入时就使用指定了日期变量的格式,不一定在输入时就使用指定的格式。可以输入用指定的格式。可以输入用“/”或或“”作分隔符作分隔符的具体日期,回车后,系统将自动将输入的格式的具体日期,回车后,系统将自动将输入的格式转化为指定的格式,显示在单元各种。转化为指定的格式,显示在单元各种。如下图所示二、变量的测量尺度在在SPSS中使用中使用Measure属性对变量的测量尺度进行定义。属性对变量的测量尺度进行定义。(1)定类尺度()定类尺度(Nominal Measurement):定类尺度是对事物的:定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。特点:其值仅代表了事物的类别和属性,即特点:其值仅代表了事物的类别和属性,即能测度类别差异能测度类别差异,不能不能比较各类之间的大小比较各类之间的大小,所以各类之间,所以各类之间没有顺序和等级没有顺序和等级。对定类尺度。对定类尺度的变量只能计算的变量只能计算频数和频率频数和频率。在在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型中,能适用定类尺度的数据可以是数值型,也可以是字符型变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥原则。原则。(2)定序尺度()定序尺度(Ordinal Measurement):定序尺度是对事:定序尺度是对事物之间的等级或顺序差别的一种测度,可比较优劣或排序。物之间的等级或顺序差别的一种测度,可比较优劣或排序。特特点点:由由于于定定序序变变量量只只能能测测度度类类别别之之间间的的顺顺序序,无无法法测测出出类类别别之之间间的的准准确确差差值值,即即测测量量数数值值不不代代表表绝绝对对的的数数量量大大小小,所所以其测量结果以其测量结果只能排序,不能进行运算只能排序,不能进行运算。(3)定距尺度()定距尺度(Interval Measurement):定距尺度是对:定距尺度是对事物类别或次序之间间距的测度。事物类别或次序之间间距的测度。特点:特点:不仅能将事物区分为不同类型并进行排序,而且可能准不仅能将事物区分为不同类型并进行排序,而且可能准确指出类别之间的差距是多少;定距变量确指出类别之间的差距是多少;定距变量通常以自然或物理单通常以自然或物理单位为计量尺度位为计量尺度,因此测量结果往往表现为,因此测量结果往往表现为数值数值,所以计量结果,所以计量结果可以进行加减运算可以进行加减运算。(4)定定比比尺尺度度(Scale Measurement):定定比比尺尺度度是是能能够够测测算算两两个个测测度度值值之之间间比比值值的的一一种种计计量量尺尺度度,它它的的测测量量结结果果同定距变量一样表现为数值。同定距变量一样表现为数值。特点:定比变量是测量尺度的最高水平,它除了具有其他三特点:定比变量是测量尺度的最高水平,它除了具有其他三种测量尺度的全部特点外,还具有种测量尺度的全部特点外,还具有可计算两个测度值之间比可计算两个测度值之间比值值的特点,因此它的特点,因此它可以进行加、减、乘、除运算可以进行加、减、乘、除运算,而定距变,而定距变量值只可进行加减运算。量值只可进行加减运算。三、变量名与变量标签值Label:定义变量名标签Value:定义变量值标签四、缺失值Spss中缺失值有用户自定义缺失值和系统缺失值两大类。中缺失值有用户自定义缺失值和系统缺失值两大类。在在SPSS中,对字符型变量,默认的缺失值为空格;对数值型变量,默中,对字符型变量,默认的缺失值为空格;对数值型变量,默认的缺失值为零。认的缺失值为零。第二个问题 外部数据的获取SPSS读入非读入非SPSS类型的文件数据,有三种主要方式:直接打开,类型的文件数据,有三种主要方式:直接打开,利用文本导向读入文本数据以及利用数据库利用文本导向读入文本数据以及利用数据库OBDC接口读入数据。接口读入数据。1、电子表格数据如何导入、电子表格数据如何导入spss中中SPSS中可以直接读入许多常用格式的数据文件,选择菜单File Open Data或直接单击快捷键工具栏上的 快捷按钮,系统就会弹出Open File 对话框,单击“文件类型”列表框,在里面能够看到可以直接打开的数据文件格式。2、文本数据如何导入、文本数据如何导入spss中中第一步:首先,在第一步:首先,在Open File 文件框中选中文件,单击文件框中选中文件,单击“打开打开”,系统,系统会自动启动文本倒入向导对话框。(你的文本文件和预定义格式相一致会自动启动文本倒入向导对话框。(你的文本文件和预定义格式相一致码?)码?)第二步:选择第二步:选择“NO”并单击并单击“下一步下一步”按钮。按钮。第三步:分别选择第三步:分别选择“Delimited”和和“yes”,然后单击然后单击“下一步下一步”按钮按钮。用某种字符区分固定宽度变量名包括在文件最前面了吗?第四步第四步第一条记录从第几行开始?你的记录是怎样存储在文件中的?你想导入多少条记录?第五步第五步变量间用的是那种分隔符数据中采用的是什么文本限定符?注:如果数据中的字符串变量使用了限定符进行分隔要在此说明第六步第六步定义在数据预览窗口中所选择的变量注:需要变更变量名和类型的在此操作第七步第七步你愿意保存这次的文件格式设置以备下次使用吗?你是否愿意将以上操作粘贴为SPSS语句吗?第四部分 数据的保存1、存为spss格式2、存为其他数据格式谢谢!决不要把你们的学习看成是任务,而要决不要把你们的学习看成是任务,而要把它当作一个令人羡慕的机会,为了你把它当作一个令人羡慕的机会,为了你们自己的快乐和今后你们所从事行业的们自己的快乐和今后你们所从事行业的利益,去学习,去了解精神领域上的美,利益,去学习,去了解精神领域上的美,它具有能让人自由解放的力量。它具有能让人自由解放的力量。爱因斯坦因斯坦
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!