sas编程习题与实例应用要点.doc

上传人:小** 文档编号:13332834 上传时间:2020-06-15 格式:DOC 页数:19 大小:1.21MB
返回 下载 相关 举报
sas编程习题与实例应用要点.doc_第1页
第1页 / 共19页
sas编程习题与实例应用要点.doc_第2页
第2页 / 共19页
sas编程习题与实例应用要点.doc_第3页
第3页 / 共19页
点击查看更多>>
资源描述
一、数据集整理与SAS基本编程1、试用产生标准正态分布函数的随机函数normal(seed)产生均值为170,方差为64的正态随机数100个,并计算其常规统计量(均值、标准差、变异系数、偏度和峰度)。data date1;mu=170;sigma=8;do i=1 to 100;y=mu+sigma*RANNOR(0);output ;end;run;proc means data=data1 mean std cv stderr skewness;var y;output out=result;run;2、设已知数据集class中有5个变量:name, sex, age, height和weight,请编写程序新建数据集class1,其中class1只包含name, sex, age三个变量,且把name重命名为id。data class;input name$ sex$ age heigh weigh;cards;小明 男 15 160 50;run;data class1;set class;keep name sex age;rename name=id ;run;proc print data=class1;run;3、SAS的逻辑库可分为永久库和临时库两种,请编写一段程序直接建立永久库sasuser中的下例数据集,并按降序排序。数据名tong:20 13 20 16 23 19 19 16data Sasuser.tong;input x;cards;20 13 20 16 23 19 19 16;run;proc sort data=Sasuser.tong;by descending x ;run;proc print data=Sasuser.tong;run;4、设已知数据集data1和数据集data2numberprovince1Hebei3Zhejiang5Gansunumbercity2Chengdu4Nanjing请编写程序串接data1和data2,且分组变量为number。data data1;input number province$;cards;1 Hebei3 Zhejiang5 Gansu;run;data data2;input number city$;cards;2 Chengdu4 Nanjing;run;data data;set data1 data2;by number;run;proc print data=data;run;二、描述统计1、下表记录了某超市一个月内每天的营业额(千元),现用SAS过程做描述统计,请根据给出的结果回答以下问题:日期营业额日期营业额日期营业额日期营业额日期营业额16.14714.761342.411911.132533.87248.35839.181430.21201.072620.0930.95936.871515.622117.122734.73418.611015.641640.47228.332843.86537.891130.44178.81238.59297.5663.481223.38182.5244.083023.44(1)、该超市一个月内的平均营业额,哪天最大、最小?(2)、营业额的偏度、变异系数;(3)、数据是否服从正态分布?()data data1;input number province$;cards;1 Hebei3 Zhejiang5 Gansu;run;data data2;input number city$;cards;2 Chengdu4 Nanjing;run;data data;set data1 data2;by number;run;proc print data=data;run; data a;input date total;cards;proc univariate data=a ;var total;run; 2、假设某学校大学生的身高为X(记总体X的均值为,方差为),体重为Y(记总体Y的均值为,方差为),今从全校随机抽取100名学生,测得身高、体重数据如下,请根据输出结果回答以下问题:身高体重身高体重身高体重身高体重身高体重172.475169.354.8169.364171.464.8166.547.4171.462.2168.266.9165.152168.862.2167.865165.862.2167.865164.458.7169.957.5164.963.5160.355.217566.6172.573.517264168.45715557175.563.9172.369168.658176.456.9173.257.5167.550169.452.2166.772169.557165.755.4161.248.5172.857175.175.5157.550.5169.862.9168.663.4172.661163.858.5165.161.5166.752.5170.961166.169.5166.262.5172.452.6172.860177.863.9162.756.8168.854169.166.2177.56017766.2169.955.9167.454.4169.358.4172.872.8169.85816065.3179.162.2172.349.8163.346.5172.966.7165.458175.863.2162.352.2165.465.7171.559.3176.666.3181.768.6175.274.9169.559.5169.661.5169.163.1185.577173.965.5162.550171.558.5175.659.816675.5167.263.3171.957176.658.4177.367169.271.8166.249.8181.763175.868.3172.355.5172.758.5174.364171.259174.868165.455.5169.164.8167.962176.864183.569.9165.548.617170.5170.358.51、身高、体重的均值和方差的90%的置信区间;data a;input heigh weigh;cards;run;proc ttest data=a alpha=0.1;run; 169.31,171.0960.201,62.3072、分析100名学生身高数据频率直方图;proc gchart data=a;vbar heigh/type=freq;run;3、对身高均值和方差做假设检验;0.70720.05 接受原假设没有显著差异; 4、体重数据是否来自正态总体?proc univariate data=a normal;var weight;run;样本少于2000看第一个 大于2000看第二个因为0.4639大于0.05所以接受原假设所以来自正态总体三、假设检验1、某生产企业进行技术改造,为考察改造是否对生产量有提高,记录改造前后各10天的产量(吨/天)的数据: 改造前3.311.79.46.823.15.33.721.817.6改造后3330.88.811.442.65.81.61922.430.2技术改造对产量是否有显著的影响()?data test;input a b;cards;run;proc ttest data=test;paired a*b;run;因为0.03840.01,所以方差相等,看第一个equal,0.00240.01拒绝原假设,两个独立样本有显著差异。四、方差分析1、生产配方问题。生产某种产品需要两种原材料: A和B;考察的指标为产品的产量Y。设因子A有三个品牌:A1,A2,A3;因子B有四个品牌:B1,B2,B3,B4。对这12中配搭的每一种,安排两次实验,得数据如下表(每次实验的产量): B1B2B3B4A119.3,19.224,27.326,28.527.8,28.5A221.7,22.627.5,30.329,28.730.2,29.8A320,20.124.2,27.324.5,27.128.1,27.7(1)、原材料A的不同品牌对产量是否有显著的差别?哪个品牌更好些()?(2)、原材料B的不同品牌对产量是否有显著的影响?(3)、A和B对产量的影响哪个更大些?(4)、A和B是否有交互作用?(5)、使产量达到最大的生产条件是什么?data test3;do a=1 to 3; do b=1 to 4; do c=1 to 2; input x ; output; end; end; end;cards;run;proc glm data=test3;class a b;model x=a b a*b;means a b a*b/t; /*多重比较设置*/run;因为0.00360.05 拒绝原假设,A品牌对产量有显著影响。0.0010.05 接受原假设,A、B相互没有作用。在A品牌中分成两组,a2和a1、a3.因为a2均值最大所以最好。(如何判断看a1a3可分成一组看上面那个表格第五行,只要差值小于1.4596,即可看成一组,两个效果差不多。)同理,b4最好。若A、B相互不影响,那么使产量最大的组合可直接选择A、B分别均值最大那个,即a2*b4.若A、B相互影响,那么看这个表格均值最大那个。2、考虑合成纤维收缩率(因子A)和总拉伸倍数(因子B)对纤维弹性Y的影响。设收缩率(A)有4个水平:A1,A2,A3,A4;总拉伸倍数(B)也有4个水平B1,B2,B3,B4。在每个组合下重复二次试验,弹性的数据如下表: B1(=460)B2(=520)B3(=560)B4(=640)A1(=0)71,7372,7375,7377,75A2(=4)73,7576,7478,7774,74A3(=8)76,7379,7774,7574,73A4(=12)75,7373,7270,7169,69(1)、收缩率对弹性Y是否有显著的影响?哪个收缩率影响更大些?()(2)、不同拉伸倍数对产量是否有显著的影响? (3)、收缩率和拉伸倍数是否有交互作用? (4)、使弹性达到最大的生产条件是什么?五、回归分析1、某厂生产的一种产品的销售额Y与生产成本及销售成本有关。现有10个城市销售数据记录如下,(元)(元)(个)(元)(元)(个)12010010215521046140110100175150931909012012525026130150771452706912010010218030065(1)、建立销售量Y与生产成本及销售成本的回归关系式,说明回归方程在的水平上是否显著?并解释回归系数的含义。data sale;input x1 x2 y;cards;run;proc reg data=sale;model y=x1 x2 / r;run;因为0.0078小于0.05,所以模型达到显著水平。回归关系式:y=79.88271+0.37176x1-0.31736x2(2)、对回归模型进行初步诊断,并指出有无可疑点或异常点?根据 Student Residual 或 星星判断,得观测1、8、9的残差较大,说明这三个模型的预测结果不是很理想。(3)、写出模型的决定系数、均方误差、均方误差的根,并说明决定系数的含义。决定系数: R-Square=0.74990.5,说明多元回归模型的拟合程度较好。均方误差:Mean Square Error =270.21070均方误差的根:Root MSE=16.43809(4)、该回归模型回归系数是否显著?可以从哪些方面对模型进行改进?X1的回归系数p值=0.12650.05,不显著。X2的回归系数p值=0.00290.05,显著。(5)、如果元及元,试预测该厂的销售量。 代进去。2、某地区对某种电器的销售量Y进行调查,它与以下4个量有关:=居民可支配收入,=该电器平均价格指数,=该电器保有量,=其他电器平均价格指数。现有10个历史数据记录如下,82.99217.1948.41311014010114.2889321.3969.6148.21054410415.899.99625.19710.4161.81124910917.9105.394299711.4174.21125111119.6117.71003410012.2184.71125311120.8(1)、建立销售量Y与的回归关系式,说明回归方程在的水平上是否显著?(2)、对回归模型进行初步诊断,并指出有无可疑点或异常点?(3)、写出模型的决定系数、均方误差、均方误差的根,并说明决定系数的含义。(4)、该回归模型回归系数是否显著?可以从哪些方面对模型进行改进?六、属性数据分析1、下表是对195名顾客的购买手机意愿(分为品牌机、山寨机、无所谓)的调查数据,同时记录了每位顾客的年收入经济状况(分为贫穷、下、中、上四个等级)。贫穷下中上山寨机30151112品牌机7181929无所谓523719请问购买何种手机是否与顾客的经济状况有关()?如果有关两者有何趋势?data test;input a$ b$ x;label a=购买手机意愿 b=经济状况;cards;品牌机贫穷 30品牌机下 15品牌机中 11品牌机上 12山寨机贫穷 7山寨机下 18山寨机中 19山寨机上 29无所谓贫穷 5无所谓下 23无所谓中 7无所谓上 19;run;proc freq data=test; table a*b/expected chisq norow measures nopercent alpha=0.01;weight x;run;2、巴西医生马廷思收集了580名犯有各种贪污、受贿罪的官员和580名廉洁官员之寿命调查数据,试分析贪污与寿命之间有无显著的关系?短寿长寿合计贪官348232580清官93487580合计4417191160请问短寿是否与贪污有关?如果有关两者有何趋势?19
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 考试试卷


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!