caseCNNIC抽样设计课件

上传人:无*** 文档编号:150591731 上传时间:2022-09-09 格式:PPT 页数:52 大小:163KB
返回 下载 相关 举报
caseCNNIC抽样设计课件_第1页
第1页 / 共52页
caseCNNIC抽样设计课件_第2页
第2页 / 共52页
caseCNNIC抽样设计课件_第3页
第3页 / 共52页
点击查看更多>>
资源描述
caseCNNIC抽样设计1“网民知多少?网民知多少?”CNNIC CNNIC全国调查抽样方案设计全国调查抽样方案设计 caseCNNIC抽样设计2背景背景随着随着ITIT技术和互联网的飞速发展,中技术和互联网的飞速发展,中国的网民数量、网民特征以及上网行为国的网民数量、网民特征以及上网行为成为社会关注的热点,这些信息不仅对成为社会关注的热点,这些信息不仅对于政府管理部门制定有关政策极具参考于政府管理部门制定有关政策极具参考价值,对于各个网站以及网上广告主也价值,对于各个网站以及网上广告主也有一定的商业价值。有一定的商业价值。19971997年,经国务院信息办研究决定,年,经国务院信息办研究决定,由由中国互联网信息中心(中国互联网信息中心(CNNICCNNIC)来实来实施这方面的调查统计工作。施这方面的调查统计工作。caseCNNIC抽样设计3CNNICCNNIC于于19971997年、年、19981998年、年、19991999年和年和20002000年共发布了六次年共发布了六次“中国互联网络中国互联网络发展状况统计报告发展状况统计报告”对我国上网人群的数量、分布、基对我国上网人群的数量、分布、基本特征等进行了估计本特征等进行了估计对我国网民的上网行为、习惯以及对我国网民的上网行为、习惯以及对有关热点问题的看法和态度进行了对有关热点问题的看法和态度进行了概括性的说明概括性的说明背景背景caseCNNIC抽样设计4背景背景前六次调查采用是网上联机调查的方前六次调查采用是网上联机调查的方式,即在网上发布问卷,由网民自由填式,即在网上发布问卷,由网民自由填写,写,CNNICCNNIC利用技术手段去掉重复的问卷,利用技术手段去掉重复的问卷,并从中抽样。并从中抽样。利用这种网上联机方式来调查网民的利用这种网上联机方式来调查网民的情况,引起了一些争议。情况,引起了一些争议。caseCNNIC抽样设计5为了使调查结果更具说服力,为了使调查结果更具说服力,CNNICCNNIC决决定第七次调查时,有关网民情况的内容定第七次调查时,有关网民情况的内容采用传统的网下抽样调查的方式进行采用传统的网下抽样调查的方式进行希望样本能够代表全国和各省的情况希望样本能够代表全国和各省的情况为此特委托北京广播学院调查统计研为此特委托北京广播学院调查统计研究所(究所(SSISSI)设计全国调查的抽样方案)设计全国调查的抽样方案背景背景caseCNNIC抽样设计6全国以及各省全国以及各省时间有限费用有限抽样方案设计背景背景caseCNNIC抽样设计7CNNICCNNIC调查的主要目的是估计调查的主要目的是估计全国网民的总量全国网民的总量网民的构成以及上网行为网民的构成以及上网行为考虑到上网是有一定年龄限制的,年龄太小的考虑到上网是有一定年龄限制的,年龄太小的孩子不可能独立上网,因此将目标总体界定为孩子不可能独立上网,因此将目标总体界定为“全国所有六岁以上的居民全国所有六岁以上的居民”二、抽样设计的基本思路二、抽样设计的基本思路-总体的界定总体的界定caseCNNIC抽样设计8考虑到上网是有一定年龄限制的考虑到上网是有一定年龄限制的年龄太小的孩子不可能独立上网年龄太小的孩子不可能独立上网目标总体目标总体二、抽样设计的基本思路二、抽样设计的基本思路-总体的界定总体的界定“全国所有六岁以上的居民全国所有六岁以上的居民”caseCNNIC抽样设计9二、抽样设计的基本思路二、抽样设计的基本思路-总体的界定总体的界定代表全国的抽样调查代表全国的抽样调查随机入户面访的方式随机入户面访的方式CNNIC无法承受时间和费用无法承受时间和费用caseCNNIC抽样设计10大规模的入户面访调查大规模的入户面访调查不符合效率原则不符合效率原则二、抽样设计的基本思路二、抽样设计的基本思路-总体的界定总体的界定上网是新生事物上网是新生事物网民的人数还比较少、所占比例低网民的人数还比较少、所占比例低caseCNNIC抽样设计11全国所有六岁以上的居民全国所有六岁以上的居民目标总体目标总体二、抽样设计的基本思路二、抽样设计的基本思路-总体的界定总体的界定无住宅电话的无住宅电话的6岁以上的居民岁以上的居民有住宅电话的有住宅电话的6岁以上的居民岁以上的居民住校的住校的高等院高等院校学生校学生网民caseCNNIC抽样设计12二、抽样设计的基本思路二、抽样设计的基本思路-总体的界定总体的界定住校的住校的高等院校高等院校学生学生拥有住宅电话的拥有住宅电话的六岁以上的居民六岁以上的居民(不包括住校(不包括住校的大学生)的大学生)CATI面访面访抽样总体caseCNNIC抽样设计13二、抽样设计的基本思路二、抽样设计的基本思路-“住宅电话居民住宅电话居民”抽样的总思路抽样的总思路分层分层PPS与等概率结合与等概率结合四阶段混合型抽样四阶段混合型抽样caseCNNIC抽样设计14第一阶段:用第一阶段:用PPSPPS法抽取地区法抽取地区 (城镇和乡村)(城镇和乡村)第二阶段:抽取电话局号;第二阶段:抽取电话局号;第三阶段:抽取电话号码;第三阶段:抽取电话号码;第四阶段:抽取调查对象。第四阶段:抽取调查对象。二、抽样设计的基本思路二、抽样设计的基本思路-“住宅电话居民住宅电话居民”抽样的总思路抽样的总思路按省分层按省分层每个省作为一层每个省作为一层每个省内每个省内所获得的样本可以近似所获得的样本可以近似看成是自加权样本看成是自加权样本对全省有代表性对全省有代表性caseCNNIC抽样设计15分层分层PPSPPS与等概率相结合的与等概率相结合的三阶段混合型抽样三阶段混合型抽样二、抽样设计的基本思路二、抽样设计的基本思路-“大学生大学生”抽样的总思路抽样的总思路caseCNNIC抽样设计16第一阶段:抽学校第一阶段:抽学校第二阶段:抽班级第二阶段:抽班级第三阶段:抽住校学生第三阶段:抽住校学生二、抽样设计的基本思路二、抽样设计的基本思路-“大学生大学生”抽样的总思路抽样的总思路代表全国的近似自加权样本代表全国的近似自加权样本按各省大学生在各层的分配情况按各省大学生在各层的分配情况可以近似推断各省的情况可以近似推断各省的情况caseCNNIC抽样设计17二、抽样设计的基本思路二、抽样设计的基本思路全国网民人数上网行为省住宅电话居民住校大学生省i省加权处理加权处理caseCNNIC抽样设计18(3 3)样本量的确定)样本量的确定上网是一个新生事物,在上网是一个新生事物,在“住宅电话居住宅电话居民民”中,上网人数所占的比例还很小,中,上网人数所占的比例还很小,为了保证目标比例估计值的精度,采用为了保证目标比例估计值的精度,采用最大允许相对误差最大允许相对误差的公式来估计上网比的公式来估计上网比例最低的省所需的样本量。例最低的省所需的样本量。二、抽样设计的基本思路二、抽样设计的基本思路caseCNNIC抽样设计19非常简单随机抽样所需的最小样本含量为:非常简单随机抽样所需的最小样本含量为:PPrtnp1220n no o:非常简单随机样本所需的最小样本量:非常简单随机样本所需的最小样本量r rP P:最大允许的相对误差:最大允许的相对误差P P:所估计的目标比例:所估计的目标比例在置信度为在置信度为95%95%的情况下,的情况下,t=1.96t=1.96二、抽样设计的基本思路二、抽样设计的基本思路caseCNNIC抽样设计20)127.01()25.414.3(16906省乡村住宅电话数目省城镇住宅电话数目省上网用户所占的比例(万)岁以上的人数省有住宅电话省上网用户总数iiiPiiPii3131个省中,个省中,目标总体中网民比例超过目标总体中网民比例超过5%5%的只有的只有7 7个,个,不到不到2%2%的有的有7 7个,网民比例最少的青海省个,网民比例最少的青海省和内蒙古自治区,估计比例为和内蒙古自治区,估计比例为1.5%1.5%二、抽样设计的基本思路二、抽样设计的基本思路caseCNNIC抽样设计21A1A2A3A4A5A6A7A8A9城市住宅城市住宅电话用户电话用户(万户)(万户)乡村住宅乡村住宅电话用户电话用户(万户)(万户)城市住宅城市住宅电话覆盖电话覆盖人口数人口数(万)万)乡村住宅乡村住宅电话覆盖电话覆盖人口数人口数(万)(万)住宅电话住宅电话覆盖的总覆盖的总人数人数(万)(万)CNNIC网网民的地域民的地域分布总数分布总数(万人)(万人)CNNIC网网民的地域民的地域分布百分分布百分比比住宅电话住宅电话人群中网人群中网民的比例民的比例住宅电话住宅电话覆盖的覆盖的6岁岁以上人数以上人数(万)(万)北京市北京市253253525279479422122110151015316.368316.36818.7218.7231.2%31.2%886886天津市天津市1701702121534534898962362347.15147.1512.792.797.6%7.6%544544河北省河北省3073072272279649649659651929192937.51837.5182.222.221.9%1.9%16841684山西省山西省160160575750250224224274574516.05516.0550.950.952.2%2.2%650650内蒙古内蒙古12812832324024021361365385387.2677.2670.430.431.4%1.4%470470辽宁省辽宁省407407151151127812786426421920192056.44656.4463.343.342.9%2.9%16761676吉林省吉林省22122186866946943663661059105923.6623.661.41.42.2%2.2%925925黑龙江省黑龙江省31631686869929923663661358135828.22328.2231.671.672.1%2.1%11851185caseCNNIC抽样设计22估计的目估计的目标比例标比例95%置信度下的最置信度下的最大允许相对误差大允许相对误差非常简单随机抽样所非常简单随机抽样所需的最小样本量需的最小样本量设计设计效应效应计算样计算样本量本量最低最低省样省样本量本量1.0%50%15212.5380338001.0%30%42252.510563106001.5%50%10092.5252226001.5%50%10092.0201820201.5%30%28012.570047000二、抽样设计的基本思路二、抽样设计的基本思路保证精度前提下保证精度前提下更多考虑到更多考虑到CNNICCNNIC能承受的访问实施的费用和时间能承受的访问实施的费用和时间为了便于各省比较,每个省样本量相同为了便于各省比较,每个省样本量相同caseCNNIC抽样设计23在在“大学生大学生”总体中,网民的比例比较高,总体中,网民的比例比较高,样本量按样本量按最大允许的绝对误差最大允许的绝对误差公式计算,综公式计算,综合考虑抽样设计的精度以及合考虑抽样设计的精度以及CNNIC所能承受所能承受的调查费用和调查时间,的调查费用和调查时间,取置信度为取置信度为95%,最大允许绝对误差为,最大允许绝对误差为1.8%,设计效应为设计效应为2,则总样本量为,则总样本量为6,000。共抽取共抽取120所大学,每校抽取所大学,每校抽取5个班,每班调个班,每班调查查10人。人。二、抽样设计的基本思路二、抽样设计的基本思路caseCNNIC抽样设计24“住宅电话居民住宅电话居民”总体总体阶段阶段抽样单元抽样单元抽样指标抽样指标抽样方法抽样方法第一阶段第一阶段地区地区住宅电话数目住宅电话数目PPSPPS第二阶段第二阶段局号局号/普查普查第三阶段第三阶段住宅电话号码住宅电话号码后四位随机抽取后四位随机抽取随机抽样随机抽样第四阶段第四阶段调查对象调查对象/方便抽样方便抽样二、抽样设计的基本思路二、抽样设计的基本思路 抽样指标的确定抽样指标的确定caseCNNIC抽样设计25“大学生大学生”总体总体阶段阶段抽样单元抽样单元抽样指标抽样指标抽样方法抽样方法第一阶段第一阶段学校学校普通本专科与普通本专科与研究生人数研究生人数 PPSPPS第二阶段第二阶段班班/随机抽取随机抽取 第三阶段第三阶段住校大学生住校大学生 /等距抽取等距抽取二、抽样设计的基本思路二、抽样设计的基本思路 抽样指标的确定抽样指标的确定caseCNNIC抽样设计26“住宅电话居民住宅电话居民”总体总体多重抽样框:多重抽样框:大部分的资料来自于统计年鉴大部分的资料来自于统计年鉴有关省级住宅电话数目来自电信部门;有关省级住宅电话数目来自电信部门;抽中地区的电话局号资料,来自电信部门;抽中地区的电话局号资料,来自电信部门;地区一级的住宅电话数目是用回归模型预测的。地区一级的住宅电话数目是用回归模型预测的。二、抽样设计的基本思路二、抽样设计的基本思路-关于抽样框的说明关于抽样框的说明caseCNNIC抽样设计27“大学生大学生”总体总体第一阶段:第一阶段:中国普通高等学校名录中国普通高等学校名录9898版版(教(教育部发展规划司编高等教育出版社),收录了截止育部发展规划司编高等教育出版社),收录了截止19981998年年9 9月按国家规定的审批程序批准设置的月按国家规定的审批程序批准设置的10221022所普通高校。包括所普通高校。包括1515项指标,其中有项指标,其中有2121所学校多项所学校多项指标缺失,最终的抽样框共包括指标缺失,最终的抽样框共包括10011001所大学。所大学。第二阶段、第三阶段的抽样框都是在访问实施过第二阶段、第三阶段的抽样框都是在访问实施过程中建立的完整抽样框。程中建立的完整抽样框。二、抽样设计的基本思路二、抽样设计的基本思路-关于抽样框的说明关于抽样框的说明caseCNNIC抽样设计28三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样第一阶段:抽取地区第一阶段:抽取地区从每个省中抽取五个地区从每个省中抽取五个地区抽样指标:地区的住宅电话数目抽样指标:地区的住宅电话数目caseCNNIC抽样设计29三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样(1 1)利用回归模型预测)利用回归模型预测“地区住宅电话数目地区住宅电话数目”所获得的住宅电话的资料仅到省级,没有地区级的资所获得的住宅电话的资料仅到省级,没有地区级的资料,利用省一级的经济、人口指标作为自变量,料,利用省一级的经济、人口指标作为自变量,“住住宅电话数目宅电话数目”作为因变量,通过作为因变量,通过SPSSSPSS软件对软件对3131个省的个省的资料进行多次测算,建立了一个回归预测模型。资料进行多次测算,建立了一个回归预测模型。住宅电话数目住宅电话数目=325018=325018 +0.02684(+0.02684(地区人口地区人口)+0.03775 +0.03775(国民生产总值)(国民生产总值)+0.1433+0.1433(社会消费品零售总额)(社会消费品零售总额)caseCNNIC抽样设计30三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样 决定系数为决定系数为0.9440.944,回归模型的方差分析的显著性,回归模型的方差分析的显著性水平为水平为0.0000.000,三个自变量的与因变量的线性联系,三个自变量的与因变量的线性联系检验的显著性水平都小于检验的显著性水平都小于5%5%。虽然三个自变量相关显著,但研究的目标是为了预虽然三个自变量相关显著,但研究的目标是为了预测,追求的是决定系数最大,因此可以认为所得的测,追求的是决定系数最大,因此可以认为所得的回归预测模型是比较理想的。回归预测模型是比较理想的。住宅电话数目住宅电话数目=325018=325018 +0.02684(+0.02684(地区人口地区人口)+0.03775 +0.03775(国民生产总值)(国民生产总值)+0.1433+0.1433(社会消费品零售总额)(社会消费品零售总额)caseCNNIC抽样设计31三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样当然,利用省一级的数据做出的预测模型不一当然,利用省一级的数据做出的预测模型不一定完全适用于地区,但是在没有其他办法取得定完全适用于地区,但是在没有其他办法取得实际的各地区住宅电话数目的情况下,采用预实际的各地区住宅电话数目的情况下,采用预测模型也是不得已。测模型也是不得已。按照此回归预测模型,用各个地区的人口数、按照此回归预测模型,用各个地区的人口数、9898年地区国民生产总值以及年地区国民生产总值以及9898年社会消费品零年社会消费品零售总额得到了各个地区的住宅电话数目。售总额得到了各个地区的住宅电话数目。caseCNNIC抽样设计32三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样(2 2)抽取地区)抽取地区根据所估计的各地区根据所估计的各地区“住宅电话的数目住宅电话的数目”的的大小,按照大小,按照PPSPPS抽样法,使每个地区被抽中的抽样法,使每个地区被抽中的概率,等于该地区概率,等于该地区“住宅电话的数目住宅电话的数目”与该与该省省“住宅电话的数目住宅电话的数目”之比。之比。caseCNNIC抽样设计33地区地区住宅电话住宅电话数目数目比例比例累计百累计百分比分比石家庄市石家庄市126118012611800.1400.1400.1400.140唐山市唐山市107971110797110.1200.1200.2600.260 秦皇岛市秦皇岛市5905355905350.0660.0660.3260.326邯郸市邯郸市9248549248540.1030.1030.4290.4291 1邢台市邢台市7557437557430.0840.0840.5130.5131 1保定市保定市109965810996580.1220.1220.6350.6351 1张家口市张家口市6586306586300.0730.0730.7080.708承德市承德市5737735737730.0640.0640.7720.772沧州市沧州市8006088006080.0890.0890.8610.8611 1廊坊市廊坊市6411896411890.0710.0710.9320.932衡水市衡水市6091996091990.0680.0681.0001.0001 1合计合计899508189950811.0001.000 EXCELEXCEL抽样演示抽样演示三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样caseCNNIC抽样设计34三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样(3 3)样本量分配)样本量分配在地区多于五个的省中,各省的样本量在地区多于五个的省中,各省的样本量(20202020)在抽中各地区中按抽中的次数平均)在抽中各地区中按抽中的次数平均分配,如抽中一次,该地区的样本量为分配,如抽中一次,该地区的样本量为404404;如被抽中两次,该地区的样本量为如被抽中两次,该地区的样本量为808808。在地区少于五个的省中,各省的样本量在地区少于五个的省中,各省的样本量(20202020)在各地区中按地区的住宅电话数目)在各地区中按地区的住宅电话数目的比例分配。的比例分配。caseCNNIC抽样设计35样本量分配示例样本量分配示例caseCNNIC抽样设计36三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样第二阶段:抽取电话局号第二阶段:抽取电话局号 对于抽中的地区,通过有关部门获得了该地区的对于抽中的地区,通过有关部门获得了该地区的所有电话局号资料。所有电话局号资料。电话号码由区号、局号和后四位数字(有极少部电话号码由区号、局号和后四位数字(有极少部分地区,交换机还没有更新,电话号码除了局号,分地区,交换机还没有更新,电话号码除了局号,后面是三位数字)构成。抽中的地区中有些地区是后面是三位数字)构成。抽中的地区中有些地区是统一的区号,有些地区可能还有不同的区号。每个统一的区号,有些地区可能还有不同的区号。每个区号下有很多局号,局号相同,则地理位置可能比区号下有很多局号,局号相同,则地理位置可能比较相近,为使样本的代表性更强,每个地区的所有较相近,为使样本的代表性更强,每个地区的所有局号都被抽取。局号都被抽取。平均分配每个局号下的样本量。平均分配每个局号下的样本量。caseCNNIC抽样设计37三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样空号、住宅电话和非住宅电话空号、住宅电话和非住宅电话第三阶段:抽取电话号码第三阶段:抽取电话号码区号局号随机数号码区号局号随机数号码利用随机数字表利用随机数字表caseCNNIC抽样设计38不同局号下的住宅电话号码被抽中的机会不同不同局号下的住宅电话号码被抽中的机会不同概率事前未知概率事前未知为保证各省的样本近似于自加权样本为保证各省的样本近似于自加权样本理论上此阶段要采取事后加权的方式理论上此阶段要采取事后加权的方式三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样电话号码电话号码局号号码住宅电话住宅电话非住宅电话非住宅电话caseCNNIC抽样设计39全部电话数目住宅电话数目理论上事后加权系数有人接听的电话数目住宅电话数目实际上事后加权系数误差可能很大误差可能很大无法判断无人接听无法判断无人接听的电话是否住宅电话的电话是否住宅电话每个局号下三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样caseCNNIC抽样设计40三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样在实施过程中,每个抽中地区的所有电话在实施过程中,每个抽中地区的所有电话局号都被抽取了,也就是说,样本单元的局号都被抽取了,也就是说,样本单元的分布遍布了所有的局号分布遍布了所有的局号因此虽然各省的样本不是严格意义上的自因此虽然各省的样本不是严格意义上的自加权样本,但是,将其按近似的自加权样加权样本,但是,将其按近似的自加权样本处理,误差可能反而会大大小于按近似本处理,误差可能反而会大大小于按近似估计的加权系数来计算所造成的误差估计的加权系数来计算所造成的误差caseCNNIC抽样设计41三、三、“住宅电话居民住宅电话居民”子总体的抽子总体的抽样样第四阶段:抽取调查对象第四阶段:抽取调查对象电话调查方式在中国是新生事物,人们对此还不熟电话调查方式在中国是新生事物,人们对此还不熟悉,为了便于访问实施,提高访问成功率:悉,为了便于访问实施,提高访问成功率:把接听电话的人作为被访对象把接听电话的人作为被访对象先询问其家庭基本状况和个人是否上网、个人背景先询问其家庭基本状况和个人是否上网、个人背景资料和家庭其他成员的最简要资料。如果他(她)不资料和家庭其他成员的最简要资料。如果他(她)不上网,但家中有人上网,则再随机抽取一名上网的成上网,但家中有人上网,则再随机抽取一名上网的成员来接听电话,回答有关上网的问题以及个人基本资员来接听电话,回答有关上网的问题以及个人基本资料,以获取尽可能多的有用信息。料,以获取尽可能多的有用信息。caseCNNIC抽样设计42方法一:拨通住宅电话后,请家庭成员方法一:拨通住宅电话后,请家庭成员(不包括住校的高等学校学生)中生日(不包括住校的高等学校学生)中生日距离访问日期最近的距离访问日期最近的6 6岁以上的成员听电岁以上的成员听电话,该人作为被访对象。即我们的调查话,该人作为被访对象。即我们的调查是以个人作为访问对象;是以个人作为访问对象;缺点:实施起来开始进入有一定的难度,缺点:实施起来开始进入有一定的难度,但是可能存在非随机抽样误差的问题。但是可能存在非随机抽样误差的问题。优点:但一旦开始则会比较容易完成访优点:但一旦开始则会比较容易完成访问;而且由于其随机性,也可以比较容问;而且由于其随机性,也可以比较容易地进行事后的估计;易地进行事后的估计;caseCNNIC抽样设计43方法二:拨通住宅电话后,把接听电话的人作为被访方法二:拨通住宅电话后,把接听电话的人作为被访对象,先询问家庭基本状况和他(她)本人上网(不对象,先询问家庭基本状况和他(她)本人上网(不上网)的有关情况、个人背景资料和家庭其他成员的上网)的有关情况、个人背景资料和家庭其他成员的最简要资料。如果他(她)不上网,但家中有人上网,最简要资料。如果他(她)不上网,但家中有人上网,则再随机抽取一名上网的成员来接听电话,回答有关则再随机抽取一名上网的成员来接听电话,回答有关上网的问题以及自己的个人基本资料。此方法获取了上网的问题以及自己的个人基本资料。此方法获取了最大的信息量,但调查对象不是随机选取的,对目标最大的信息量,但调查对象不是随机选取的,对目标量需要事后加权处理。量需要事后加权处理。方法二实施起来开始比较容易进入,但是由于询问方法二实施起来开始比较容易进入,但是由于询问量大,访问有可能半途中断;而且由于接电话者可能量大,访问有可能半途中断;而且由于接电话者可能具有某些特征,因此后期的估计需要作加权处理。不具有某些特征,因此后期的估计需要作加权处理。不过这种方法所得到的信息量可能是最大的。过这种方法所得到的信息量可能是最大的。caseCNNIC抽样设计44四、四、“大学生大学生”子总体的抽样子总体的抽样 住校大学生的界定如下:住校大学生的界定如下:住校的(不是住在家中的,非走读)大住校的(不是住在家中的,非走读)大专院校普通本专科学生(包括高职、大专院校普通本专科学生(包括高职、大专、本科、续本、双学位)和研究生。专、本科、续本、双学位)和研究生。抽样采用分层三阶段抽样的方法。抽样采用分层三阶段抽样的方法。caseCNNIC抽样设计45四、四、“大学生大学生”子总体的抽样子总体的抽样 分层:分层:选定有关学校的规模和性质的变量作为分层指选定有关学校的规模和性质的变量作为分层指标(可能与学生上网情况比较相关的指标),具标(可能与学生上网情况比较相关的指标),具体包括体包括“普通本专科生人数普通本专科生人数”、“研究生人数研究生人数”、“教授人数教授人数”、“副教授人数副教授人数”、“博士点数博士点数目目”、“硕士点数目硕士点数目”;分层指标标准化后,利;分层指标标准化后,利用用SPSSSPSS软件的聚类分析,把软件的聚类分析,把10011001所大学分为了六所大学分为了六层。层。按各层按各层“普通本专科学生与研究生人数普通本专科学生与研究生人数”所占所占的比例,确定各层应抽取的学校的个数。的比例,确定各层应抽取的学校的个数。caseCNNIC抽样设计46四、四、“大学生大学生”子总体的抽样子总体的抽样 第一级抽样单元为学校,按第一级抽样单元为学校,按PPSPPS方法,以方法,以“普通本专科学生与研究生人数普通本专科学生与研究生人数”作为作为抽样指标;抽样指标;第二级抽样单元为班级,按院系和年第二级抽样单元为班级,按院系和年级分层后随机抽取;级分层后随机抽取;第三级抽样单元为住校学生,等距抽取。第三级抽样单元为住校学生,等距抽取。caseCNNIC抽样设计47五、总体主要目标量及其精度的估计五、总体主要目标量及其精度的估计 本调查的目标量可以分成三类:本调查的目标量可以分成三类:总量总量:比如说目标总体中网民的总数;:比如说目标总体中网民的总数;比例比例:本调查的总体目标量大部分都是以比例的形:本调查的总体目标量大部分都是以比例的形式出现的,如各省中网民人数占目标总体的比例,式出现的,如各省中网民人数占目标总体的比例,不同性别、不同文化程度、不同年龄的人群的上网不同性别、不同文化程度、不同年龄的人群的上网比例等;比例等;均值均值:比如说平均的上网时间、平均的自费上网费:比如说平均的上网时间、平均的自费上网费用等。用等。caseCNNIC抽样设计48五、总体主要目标量及其精度的估计五、总体主要目标量及其精度的估计(1)“住宅电话居民住宅电话居民”子总体各省的比例目子总体各省的比例目标及其方差的估计标及其方差的估计 Nnf nap)1(11)(ppnfPVcaseCNNIC抽样设计49五、总体主要目标量及其精度的估计五、总体主要目标量及其精度的估计(2)“大学生大学生”子总体各省的比例目标及其方差的估子总体各省的比例目标及其方差的估计计hhhpWp61612)1()(hhhhhnppWpV6,5,4,3,2,1hNNWhh其中其中Nh为某省第为某省第h层的学生数;层的学生数;N为该省的学生总数。为该省的学生总数。caseCNNIC抽样设计50五、总体主要目标量及其精度的估计五、总体主要目标量及其精度的估计(3)各省目标总体的比例及其方差的估计)各省目标总体的比例及其方差的估计BBAApWpWpBAAANNNWBABBNNNW其中其中 PA表示某省表示某省“住宅电话居民住宅电话居民”子总体具有某特征的比例子总体具有某特征的比例 PB表示某省表示某省“大学生大学生”子总体具有某特征的比例子总体具有某特征的比例 NA表示某省表示某省“住宅电话居民住宅电话居民”总数总数 NB表示某省表示某省“大学生大学生”总数总数caseCNNIC抽样设计51五、总体主要目标量及其精度的估计五、总体主要目标量及其精度的估计 iiiTpWp311nppWpViiiiT)1()(3112其中其中 Pi表示第表示第i省具有某特征的比例省具有某特征的比例 Wi表示第表示第i省省“住宅电话居民住宅电话居民”总数与总数与“大学生大学生”总数总数之和占全国之和占全国“住宅电话居民住宅电话居民”总数与总数与“大学生大学生”总数之和的总数之和的比例比例(4)全国目标总体的比例及其方差的估计)全国目标总体的比例及其方差的估计caseCNNIC抽样设计52六、结束语六、结束语此方案已被此方案已被CCNIC采用,在采用,在2000年年12月进行了调查实施。月进行了调查实施。在在2001年年1月公布了调查结果,得到社会各方面的认可。月公布了调查结果,得到社会各方面的认可。在本方案的设计过程中,冯士雍研究员(中科院系统所)、在本方案的设计过程中,冯士雍研究员(中科院系统所)、倪加勋教授(中国人民大学)、孙山泽教授(北京大学)和倪加勋教授(中国人民大学)、孙山泽教授(北京大学)和郑京平主任(国家统计局)曾提出过宝贵意见,在此深表感郑京平主任(国家统计局)曾提出过宝贵意见,在此深表感谢。谢。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!