抽样市场调查

上传人:c****d 文档编号:243380666 上传时间:2024-09-22 格式:PPT 页数:33 大小:234.50KB
返回 下载 相关 举报
抽样市场调查_第1页
第1页 / 共33页
抽样市场调查_第2页
第2页 / 共33页
抽样市场调查_第3页
第3页 / 共33页
点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,4.4,抽样市场调查,4.4.1,抽样市场调查的特点,是指调查者为了特定的调研目的,按照随机原则从调查总体中抽取一部分,(1),样本是按随机原则抽取的。,(2),用样本数据推断总体的数量特征。,(3),抽样误差不可避免,但可以计算和控制。,4.4.2,抽样市场调查的优缺点,主要优点,:,(1),调查方式的科学性。误差可控、主观影响小。,(2),调查费用的经济性。调查工作量小、节省费用。,(3),信息获取的时效性。调查工作量小、节省时间。,(4),调查结果的准确性。科学的随机抽样能够保证推断的客观性。,主要缺点:抽样技术方案设计要求高,一般人员难以胜任。如果抽样,技术方案设计存在严重的缺陷,往往会导致抽样调查的失败。,1,4.4.3,抽样市场调查的应用,(1),不可能进行全面调查的现象,只能采用抽样调查。如,产品质量检验。,(2),不必要进行全面调查的现象,采用抽样调查。如消费,者需求潜力测定等。,(3),可作全面调查的现象,为调查费用,亦可采用抽样调,查。如企业员工满意度测评。,(4),对全面调查资料的质量进行检查和修正。,(5),对某些总体的假设进行抽样检验。,2,4.4.4,抽样市场调查的基本范畴,1,总体与样本,总体是所要调查研究的现象的全体,它是由具有同质性和差异,性的许多个别事物的集合体。总体单位数通常用,N,表示。样本是按,随机原则从总体中抽出来的一部分单位的综合体,样本中包含的单,位个数称为样本量,用,n,表示,,n,/,N,称为抽样比。,2,参数与统计量,参数是总体的数量特征,即总体指标。参数在抽样时往往是未,知的,是需要进行推断的。参数通常有总体均值,.,总体标准,差,.,总体比率,P,等。,统计量是样本的数量特征,即样本指标。统计量随样本不同而,不同,因而是一个随机变量。统计量通常有样本均值,.,样本标准,差,s,,样本比率,p,等。,3,3,抽样框与抽样单位,抽样框是一个包括全部总体单位的框架,用来代表总体,以便从中抽取样,本的一个框架。抽样框可以是一览表(名单或名录),一本名册,一幅地图,,一段时间等。,抽样单位是指样本抽取过程中的单位形式,亦即从抽样框中直接抽取的单,位称为抽样单位,它可能是总体中的基本单位,也可能是总体中的基本单位的,集合。,例如,欲调查某市大学的教学用品需求,则全市大学的集合为总体,抽样,框是全市的大学名单。总体单位是每一个大学,抽样单位可以是总体中的每一,个大学,也可以是大学分类中的每一个大学。,4,样本量与样本单位,样本量是指样本的大小,即一个样本中包含的样本单位的多少。样本量的,大小,取决于抽样调查的精度要求,总体各单位的标志变异程度、抽样估计的,可信程度,抽样方式方法等因素的制约。,样本单位是构成样本的基本单位、与总体单位的形式是一致的,样本单,位可以直接从总体中抽取总体单位,亦可从抽样单位中产生。,4,5,总体分布、样本分布与抽样分布,总体分布:总体各单位标志值的分布状况,又称总体结构;,样本分布:样本中各样本单位标志值的分布状况,又称样本结,构。当样本量足够大时,样本分布趋于总体分布。,抽样分布:从总体中抽取的所有可能的样本的统计量构成的分,布。根据中心极限定量,当样本量足够大时,样本均值等统计量的,分布趋近于正态分布,因而可用正态分布来作区间估计。,6,重复抽样与不重复抽样,从,N,个总体单位中抽取,n,个组成样本,有两种抽取方法。,(,1,)重复抽样,即每抽出一个单位进行登记后,放回去,混合,均匀后,再抽下一个,直到抽满,n,个为止。重复抽样有可能出现极,大值或极小值组成的极端样本。,(,2,)不重复抽样,即每次抽出一个单位进行登记后,不再放回,参加下一次抽取,依次下去,直到抽满,n,个为止。不重复抽样可以,避免极端样本出现,抽样误差比重复抽样小。,5,7,抽样误差与抽样标准误差,抽样误差是指在遵守随机原则条件下,样本指标与总体指标之间的差异,是,一种偶然性的代表性误差,不包括系统性误差和非抽样误差。抽样误差的大小通,常受样本量大小、总体标准差、抽样方法、抽样方式四个因素的影响。,抽样误差的大小常用抽样标准误差来反映,而抽样标准误差是指所有可能的,样本均值(或样本比率)与总体均值(或总体比率)的标准差,抽样标准误差的,平方称为抽样方差。依定义有:,式中代表样本平均数的抽样标准误差,代表样本比率的抽样标准误差;,M,代表,样本个数。上述公式可用来解释抽样误差的实质,但不能实际应用,因为所有可,能的样本个数太多,总体均值或总体比率是未知的,是需要推断的,同时,实际,抽样时,往往只能抽取一个样本进行调查。因此,抽样标准误差的计算需要寻求,别的测定方法,将在以下各种抽样方式中介绍。,6,8,点估计与区间估计,点估计也叫定值估计,当样本容量足够大时,可直接用样本均,值代替总体均值,用样本比率代替总体比率,可据此计算有关总量,指标,就是点估计。,区间估计是用一个取值区间及其出现的概率来估计总体参数,,具体说,区间估计是用样本统计量和抽样标准误差来构造总体参数,的取值范围,并用一定的概率来保证总体参数落在估计的区间内。,其概率称为置信概率,概率的保证程度称为可靠性或置信(,Z,),,估计区间称为置信区间。如,总体均值:,总体比率:,其中:和又称为允许误差或极限误差,记作,称为估计的,相对精度。,7,9,抽样方式与抽样方法,(,1,)抽样方式。是指抽样调查的组织方式,通常有简单随,机抽样、分层抽样、系统抽样、整群抽样、目录抽样、多阶,段抽样等等。这些抽样调查的组织方式、抽样误差的计算和,区间估计以下将分别介绍。,(,2,)抽样方法。是指在抽样调查的组织方式既定的前提,下,从总体的全部单位(个体)中抽取,n,个单位组成样本的方,法。通常有重复抽样与不重复抽样两种抽取方法,而重复抽,样与不重复抽样的具体实施,又有不同的具体做法。,8,4.4.5,抽样市场调查的组织方式,1,简单随机抽样,1,)简单随机抽样的概念,是指从总体的全部单位中按随机原则直接抽取,n,个单位组成,样本进行调查。通常采用信手抽取法、抽签法、随机数表法、,计算机随机函数法抽取样本。简单随机抽样只适用于总体单位,数不多,总体单位标志变异度较小的情形。,2,)简单随机抽样标准误差,(,1,)样本平均数的抽样标准误差,重复抽样,不重复抽样,(,2,)样本比率的抽样标准误差,重复抽样,不重复抽样,9,【,例,4.3】,某商场从某天的顾客中,不重复随机抽取,100,个顾客,调查购买商品情况,其中有,5,个顾客未购买商品,(,未购率,5%),;顾客购,买商品的样本平均数为,498,元,样本标准差为,144,元,要求用,95%,的概,率(,Z=1.96,)估计顾客平均购买额和未购率的置信区间。,解:此题不知总体方差,因样本为大样本,可用样本方差代替。,顾客平均购买额的置信区间为,4981.9614.4,即,469.78, 526.22,元,顾客未购率的置信区间为,5%1.962.2%,即,0.69%,9.31%,10,3,)简单随机抽样样本容量的确定,一般来说,样本容量确定应考虑总体方差、抽样估计精度要求,(允许误差的约束)和把握程度(置信概率)的大小、抽样方式方,法、抽样调查费用约束等因素。在不考虑抽样调查费用约束的条件,下,样本容量的计算公式为:,(,1,)总体均值估计所需的样本容量,重复抽样,不重复抽样,(,2,)总体比率估计所需的样本容量,重复抽样,不重复抽样,11,用以上公式计算样本容量时,应注意以下三点。,(,1,)抽样比例,n/N,较大时(大于,5%,)时,应采用不重复抽样公式计算必要的,样本容量,否则无论采用重复抽样还是不重复抽样时,均可用重复抽样公式计算,样本容量,n,,可简化计算,且误差很小。,(,2,)当总体方差,2,或总体比率,P,未知时,可用样本方差(或样本比率),或,历史的类似的总体方差(或总体比率)代替。计算总体比率所需的样本容量时,,亦可直接用,P,(,1,P,)的最大值,0.25,代替。,(,3,)在同一抽样调查中,总体均值与总体比率推断要兼顾时,用以上公式计,算的样本容量一般不相等,为了保证推断结果的精确度,应采用其中的较大的那,个样本容量。,【,例,4.4】,某县某年城关镇共有居民家庭,1.86,万户,根据以往的资料,居民,家庭人均可支配收入的标准差为,0.8,千元,,95%,的居民家庭拥有空调。现采用抽样,调查了解今年和明年居民家庭空调以旧换新的需求情况,若置信概率为,95%,,要,求总体居民家庭今年人均可支配收入估计的抽样极限误差不超过,0.1,千元,空调,拥有率估计的抽样极限误差不超过,3%,,求合适的样本容量。,解:,由于,n1,n2,,故合适的样本容量为,246,户。,12,2,分层抽样,1,)分层抽样的意义,是先将总体按有关的研究标志分组,然后在从每组中按随,机原则抽取样本。在每个组中抽取的调查单位的数目,可按,相同的比例(,n/N,)抽取,也可按不同的比例抽取。为了简便,起见,通常都是按相同比例抽取,称做等比例分层抽样。,在分层抽样时,抽样误差只和层内方差有关,而与层间,方差无关。因此,只要能够扩大层间方差而缩小层内方差,,就可以提高抽样效率。,2,) 分层抽样的抽样标准误差。,设 分别为样本各组的单位数、平均数、方差;,N,为总体各组的单位数,在等比例分层抽样条件下,则有下列,计算公式。,13,总体平均数点估计,:,层内方差平均数,总体平均数的抽样标准误差,重复抽样,:,不重复抽样,:,总体比率估计的抽样误差的计算只需用,( ),代替上述,层内方差平均数公式中的 即可;而总体比率估计的公式为,14,【,例,4.5】,某县某年共有乡镇,18,个,农民家庭,88,万户,按各乡镇收入高低可分,为高收入乡镇、中收入乡镇、低收入三类,各类乡镇的农户数如表,4-2,现从这,三类中按等比例抽样,共抽取,500,户组成样本,样本各组的户均年收入、标准差,等如表,4-2,,要求在,90%,的置信概率(,Z = 1.64,)下对全县户均年收入进行区间估,计。,15,【,例,4.6】,某广告公司从某市,310,万人中采用等比例分层抽样,,调查居民收看某电视广告的收视率,有关资料整理如表,43,。要求,在,95%,的置信概率下,估计居民收看某电视广告的收视率的置信区,间。,16,3,)分层抽样的样本容量,采用等比例分层抽样时,样本容量,n,的确定与简单随机抽样样,本容量的确定公式基本相同(只需用层内方差的平均值替换总体方,差即可)。样本容量,n,确定之后,各层应抽取的样本单位数,ni,可采,用等比例法进行分配,计算公式为,【,例,4.7】,以例,4.6,的某县农民家庭户均年收入估计为例,若要,求明年总体户均年收入的抽样标准误差不超过,6,百元,/,户,概率保证,程度,95%,,则等比例分层抽样的样本容量为,17,3,等距抽样,1,)等距抽样的概念,等距抽样是将总体各单位按一定顺序排列,然后每隔,N/n,个总,体单位抽取一个样本单位组成样本进行调查。等距抽样能使样本十,分均匀地分布在总体中,从而能增加样本的代表性,减少抽样误,差,提高抽样效率。,2,)等距抽样的排序方法。,(,1,)按无关标志排队。即总体单位排列的顺序与所要研究的标,志是无关的。又称无序系统抽样。抽样误差比简单随机抽样小。,(,2,)按有关标志排队。即总体单位排列的顺序与所要研究的标,志是有直接关系的。又称有序系统抽样,抽样误差比分层抽样小。,3,)等距抽样的方法。,(,1,)随机起点等距抽样。 第一段随机抽,然后等距抽。,(,2,)半距起点等距随机抽样。中点法抽取样本。,(,3,)随机起点对称等距抽样。高低搭配称等抽取样本单位。,(,4,)循环等距抽样。构建循环圆形,然后等距抽。,18,4,)等距抽样标准误差的测定,(,1,)无序系统抽样:采用简单不重复随机抽样的公式计算抽,样标准差。,【,例,4.8】,已知某街区共有居民家庭,8 860,户,按登记名册每,隔,10,户抽取,1,户,共抽取了,886,户,调查他们是否收看了某电视广,告,调查结果已收看的有,685,户。要求在,95%,的置信概率下,求收看,率的置信区间。,解:,N,=8 860,n,=886,19,(,2,)有序系统抽样:采用事后分层,利用等比类型抽样标准,误差公式计算抽样标准误差。,【,例,4.9】,某大型超市某年,2,月份有,360,个小时的营业时间,现,按时间顺序每隔,9,小时抽取,1,个小时,以测定,2,月份(春市期间)购,物的顾客流量,其抽出,40,小时,每小时的顾客流量整理如下,5,组,,要求在,95%,的置信率下估计每小时顾客流量的置信区间,.,。,解:本例每组单位,,,故,:,)相等,故,20,5,)等距抽样样本容量的确定,(,1,)无序系统抽样的样本容量。采用简单随机抽样中的样本容,量公式确定样本容量,n,。,(,2,)有序系统抽样的样本容量。采用分层抽样的样本容量公式,确定样本容量,n,。但计算所需的平均组内方差应根据以往的资料作,出估计。,21,4.,整群抽样,1,)整群抽样的概念,整群抽样是将总体按某一标志分组后形成的每个群视为单位进,行随机抽样,然后对抽中的每个群体进行全面调查。整群抽样的特,点是先分群,后抽群作为样本单位,在抽中的群内实行全面调查,,不再从中抽样。,2,)整群抽样标准误差的测定,由于整群抽样对群内的总体单位实行全面调查,因而群内方差,并不引起抽样误差,因而计算整群抽样误差,只需以群间方差代替,总体方差,当总体的群间方差未知时,可用样本群间方差代替。,设总体共分为,R,群,每群内有,M,个总体单位(每群,M,相等称为群抽,样,不等则称为不等群抽样),样本容量为,r,群,各群平均数为,为群间方差,则有下列计算公式。,22,如果为等群抽样,,m,1=,m,2=,m,3,,则以上公式中的,mi,可略去,有,关公式的母项则为,r,。,23,【,例,4.10】,某乡某年从,18,个行政村中,用整群抽样抽取,3,个,村,调查农民家庭电风扇拥有量情况,调查资料如下,要求在,95.4%,的概率下估计户均电风扇拥有量的置信区间(全乡共,5480,户)。,24,3,)整群抽样的样本容量确定。,由于整群抽样一般是不重复抽样,故应按不重复抽样计算必要,的抽样群数,r,。由整群抽样的极限误差 和抽样标准公式可导出,:,其中 为群间方差,可根据以往的资料确定。,【,例,4.11】,某乡从,720,个行政村,拟抽取若干个行政村调查农,民家庭彩电的普及率,根据以往的资料测算,农民家庭彩电普及率,的群间方差为,6%,,要求抽样平均误差不超过,3.98%,,置信概率为,95.44%,,求整群抽样样本容量,r,。,25,5,目录抽样,1,)目录抽样的概念,目录抽样通常用于企业调查,首先编制一份企业目录(抽样框),一般包,括企业名称、从业人数、产值、产量、利润等以往的资料。然后,考虑总体分,布是否呈偏斜状态分布,如果呈极偏斜状态分布,则将其中的大型企业单列出,来作全面调查,对剩余的为数众多的小型企业则实行抽样调查。,目录抽样是全面调查与抽样调查的有机结合。这种方法,可以减少抽样误,差,提高抽样估计的精确度。,2,)目录抽样的参数估计,目录抽样的参数估计通常是对总体的某一总量指标作出推断,设,Y,为总体,的总量指标,它可以分解为如下两部分。,Y,=,Y,1+,Y,2,其中:,Y,1,是全面调查部分,可用汇总统计的方法求得其值。,Y,2,是抽样部,分,是需要利用抽样资料估计的。设,N,2,为抽样部分的单位数,,n,2,为样本容量,,x,i,为各样本单位的观察值,则,在抽样部分中,其抽样标准误差的测定应视抽样方式而定。,26,【,例,4.12】,某市某年有,100,家工业企业,其中,10,家为大中型企,业,,90,家为小型企业。某月对,10,家大中型企业的工业增加值进行全,面调查,汇总得,10,家企业的工业增加值为,9880,元,另从,90,家小型企,业中简单随机抽取,12,家进行抽样调查,这,12,家企业的平均增加值为,32,万元,标准差为,1.8,万元。要求在,95%,的概率下估计该月全市的工,业增加值。,解:全县工业增加值点估计:,9880+3290=12760,(万元),小企业增加值的抽样标准差:,=43.78,万元,小企业增加值区间估计:,32901.9643.78,即,2794.2,2965.8,万元,全县工业增加值区间估计:,2 794.2+9 880,;,2 965.8+9,880,即在,95%,的把握程度下,全县工业增加值介于,12 674.2,万元,至,12 845.8,万元之间,点估计为,12 760,万元。,27,6,二阶段抽样,1,) 二阶段抽样的概念,二阶段抽样又称二级随机抽样,就是在抽取样本时分两个阶段,来进行,第一阶段是从总体中用随机抽样的方法抽取若干个群体,,称为初级单位。然后在第二阶段从这些初级单位中又随机抽取若干,个样本单位,称为基本单位或最终单位,最后根据所抽的基本单位,组成的样本进行调查,用取得的样本资料来推断总体。,如果在二阶段抽样之后,又继续在被抽中的二阶单位中进行第,三次、第四次随机抽样,就形成了三阶抽样、四阶抽样。二阶和二,阶以上的抽样都叫做多阶抽样。例如,农产品产量调查中,由省抽,县,由中选的县抽乡,由中选的乡抽村,由中选的村抽地块,就是,采用多阶段抽样。,多阶段抽样有利于大规模大范围的抽样调查的组织与实施,能,在一定程度上满足各级管理部门对调查资料的需求,有利于减少抽,样误差,提高抽样估计的精确度。因而,在实际工作中应用较多,,如人口、农产品、城镇居民、农村住户等调查都可采用这一方法。,28,2,)二阶段抽样标准误差的测定,二阶段抽样误差的测定需要考虑两个部分的抽样误差,一部分,是初级单位,(,群,),之间的差异 (群间方差)和抽取的初级单位的抽,样数目,r,所决定的抽样误差;第二部分是第二阶段抽样的基本单位,之间的平均群内方差 和全部基本单位,n,所决定的抽样误差。由,于一般采用不重复抽样,故二阶段抽样标准误差测定的基本公式为,其中:,R,为总体的群数,,r,为抽选的群数;,M,为总体各群相等的单位数,;,m,为中选群中抽选的单位数,(,假定亦相等,);,n,为全部基本单位,,n,=,rm,。,29,【,例,4.13】,某省某年有,100,个县,每县有,200,个村,各村的大小,基本相同。现用两阶段抽样估计粮食平均亩产,第一阶段抽取了,A,、,B,、,C,、,D,共,4,个县,第二阶段从中选县又抽取,5,个村(,1,,,2,,,3,,,4,,,5,),一共为,20,个样本村。调查资料整理如表,12-5,,要求在,95%,的置信概率下估计全省粮食平均亩产量及置信区间,。,30,需要指出的是,以上抽样平均误差的测定是假定各群、各单位规模大小相,同,但在实际抽样中,各群和各单位的规模大小是不相同的,因此,总体均值的,估计、各阶段抽样方差的估计、以及抽样标准误差的计算等均应考虑用以加权的,方法进行计算。计算公式如下,:,31,【,例,4.14】,某县某年有,200,个村,,16.2,万个农户,各村农户数目不同,现采,用二阶段抽样估计全县农户生猪的存栏量。第一阶段从,200,个村中抽取了,A,、,B,、,C,、,D,、,E,共,5,个村,第二阶段又从中选村按农户(,Mi,)的多少再抽取,10%,作为,抽样单位(,mi,)。有关资料整理如表,12-6,,要求在,95%,的置信概率下估计全县,农户平均生猪存栏量和生猪总存栏量。,32,33,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!