第五章大众传播学研究方法抽样PPT课件_第1页
第五章大众传播学研究方法抽样PPT课件_第2页
第五章大众传播学研究方法抽样PPT课件_第3页
第五章大众传播学研究方法抽样PPT课件_第4页
第五章大众传播学研究方法抽样PPT课件_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,1,第五章抽样,第一节抽样的基本概念第二节非概率抽样第三节概率抽样,.,2,抽样设计将要解决的是调查谁的问题,即如何挑选调查对象的问题。要解决包括选择哪一部分作为调查对象,这部分应包含的个体有多少,用什么样的方法进行选择,以及所选出来这一部分调查对象与总体间的关系是什么等问题。,.,3,第一节抽样的基本概念,一、为什么需要抽样普查,.,4,.,5,抽样调查起源于统计学,1895年,挪威统计学家凯尔在国际统计学会(InternationalStatisticalInstitute,ISI)第五届大会上提出“用代表性样本方法来代替全面调查”的建议,这一年被认为是抽样调查历史的开端。,.,6,抽样就是从一个总体中抽取部分个体或元素组成样本的过程。原因:1、节省研究经费和时间2、提高研究者对研究过程的管理效率,.,7,抽样的假设:1、部分是含于整体之中;2、部分与整体具有相同的特征、规律、相互关系及变化过程;3、部分能够为研究者提供一个有关整体状态、态度、意见和行为更加清晰的脉络。,.,8,抽样的目的获得具有代表性的样本代表性意味着:1、样本和总体的分布系统相同2、总体和样本的均值相同3、总体和样本里变量之间的关系相同,.,9,二、抽样的基本概念,(一)总体和元素1、总体总体是研究中所涉及的所有个体的集合,它可以是一群人,一批文件,一些事件或观念。2、元素构成总体的每一个个体就是元素。例如,研究我国媒体对艾滋病的报道,那么上万家媒体就成为本研究的总体,每一家具体的媒体是构成总体的元素。,.,10,确定研究的总体和元素,要依赖研究者个人的判断。例如调查我国新闻工作者的职业意识,“新闻工作者”都包括哪些人?,.,11,(二)样本(sample)按照一定方法,从总体抽取出的部分个体就组成了样本,用它来代表总体。如果对总体中所有元素进行研究,称为普查(census)。,.,12,如:上海地区记者生存状态调查总体限定为上海地区报纸、广播电视、杂志的拥有记者证的一线采编人员,主要媒体单位包括SMG、文新集团、解放日报集团、第一财经日报、新民周刊、瞭望东方等上海主流媒体集团。被调查的200名记者以报纸平媒体记者为主要组成部分,占到样本总数的60.67%。因此本次调查样本偏向于报纸、杂志平面媒体记者。主要基于以下因素考虑:上海主流媒体中广播电视呈现一家独大的局面,文广集团是上海最大的广播电视集团,而竞争相对激烈的领域在于平面媒体。,.,13,抽样框指的是包含总体所有元素的详细名单、地图或其他形式的资料。可以分为名单抽样框、地图抽样框、时间抽样框等。在抽样框中,每个元素都有自己的对应位置或顺序,通常通过编号来实现。,抽样框,.,14,第一节抽样的基本概念,.,15,假定要进行一项有关改革开放30年来全国性报纸的广告内容方面的研究,试说明抽样过程,为了简化问题,假定研究的主要目的是改革开放30年来人民日报、中国青年报、光明日报三份全国性报纸的广告规模、内容及形式等方面的变化;总体:1978年1月1日至2007年12月31日在上述三份报纸上刊出的全部广告;抽样框:北京图书馆内可以查阅到的在此30年期间上述三份报纸上的广告;抽样单位:报纸,可以按照等距抽样来进行;记录单位:每份报纸上各个版面各种类型的广告;总体参数:各类报纸和版面上不同时期刊出的平均广告条数、平均面积数、各种类型广告条数所占的比重、面积所占的比重等。,.,16,(三)概率抽样和非概率抽样,概率抽样是根据随机原则进行的选择,每个个体被选择的概率是已知的。它可以在抽样过程中避免人为因素造成的误差,还可以计算出由样本推断总体时的抽样误差,因而其样本能够推断总体;非概率抽样并不遵循随机原则,而是根据主观意识在研究对象中进行的选择,它无法确定每个个体被选中的概率是多少,无法计算抽样误差,所以不能从样本推断总体。,.,17,(四)随机性随机性意味着没有任何已知的准则能够描述事件或解释结果。随机不等于随意或随便,它是根据概率论的基本原理来确定样本,不遵循任何已知的确定的准则。,.,18,三、抽样的原理小样本、大样本为什么大样本能够代表总体?大数法则:总体中的每一个元素都包含着能够体现总体规律的稳定特征和不能体现总体规律的偶然现象。对某个元素来讲,对总体的结论可能不成立;但当总体规模很大的时候,偶然现象可以相互抵消,总体呈现出稳定特征。,.,19,对大样本进行统计分析所得出的并非是针对所有个体都适用的结论,而是估计一定概率机会下总体特征出现的可能性有多大,个体所体现出的无规律的偶然性被限制在“一定概率机会”这个前提之下。,.,20,标准常态曲线,.,21,中心极限定理,当样本数量足够大的时候(如大于30),那么,无论总体的分布如何,其样本的平均值所构成的分布都趋于正态分布。当无穷次地按照同一原则进行抽样时,虽然每次抽取出来的样本所包含的个体并不相同,但是这些样本的均值的分布呈现正态分布,而且这个正态分布的中间位置(即样本的平均值的平均值)就是总体的平均值。,.,22,四、抽样过程中的误差,1、随机误差:不可控因素造成的误差,降低了个体被选入样本或被分析的机会。案例:文学摘要的厄运,.,23,文学摘要为什么会出现这样严重的错误?,原因之一是抽样框和总体不符:抽样框主要是根据电话号码簿和汽车登记册建立的。另一个原因是由于回收率低引起的误差:总共寄出了一百多万份问卷,但是返回的问卷不足25%。,.,24,2、抽样误差:抽样误差是指在采用随机抽样技术,由调查结果推算全体时,预先能算出来的误差。抽样误差会受到样本规模的影响:一般而言,采用随机抽样时,样本规模愈大,抽样误差愈小。抽样误差是衡量样本代表性强弱的标准。,.,25,样本规模是指抽样单位数,在随机抽样时必须确定必要的样本数。样本数过多,浪费人力、物力、财力和时间;样本数过少,会影响调查结果的精确度,造成较大误差。,五、样本规模,.,26,影响样本规模的因素:,(一)对精确性的要求置信水平(confidencelevel):从样本推论总体时,我们有多大的信心确定样本会在可容忍误差内正确反映总体。一般有90%、95或99置信水平。社会科学研究通常把置信水平定为95。,.,27,简单随机抽样中推论总体平均数的样本规模计算公式为:推论总体成数(或百分比)的样本规模计算公式为:,.,28,简单随机抽样所需要的最小样本量,.,29,(二)研究者的精力和经费(三)总体的异质性程度总体异质性程度越高,需要的样本量越大。(四)研究方法和研究目的(五)数据分析里所涉及的变量数目一般来说,多变量数据分析比一元二元变量分析要求更大的样本规模。,.,30,我们能不能说“总体越大,样本规模越大”?,.,31,第二节非概率抽样,优点:1.按一定的主观标准抽选样本,可以充分利用已知资料。2.可以缩小抽样范围,节约调查时间、调查人员和调查费用。不足:无法判断其误差,检查调查结果的准确性。,.,32,一、偶遇抽样(accidentalorhaphazardsampling)或任意抽样、方便抽样:研究者把一定时间内一定环境里最容易接触到的人作为样本的方法,如街头拦访、商业调查、试测。但是偶遇抽样不是随机的,结果偏差较大,可信程度较低,没有足够代表性。,.,33,志愿者抽样(volunteersampling),.,34,志愿者抽样存在的问题:1、回收率低;2、参加研究的志愿者往往更倾向于“夸大”真实情况。,.,35,二、立意抽样(purposivesampling)或目的抽样、判断抽样:指研究者根据特定目的和主观判断而确定研究样本。适用情况:1、研究对象是那些难以接触的、特定总体中的个体2、研究对象是独一无二的个案3、研究者清楚地知道自己的目的是试图深入了解某些特定类型的人群,.,36,三、配额抽样(quotasampling)根据调查目的找出与研究目的关系密切的特性作为配额指标,抽样时保证样本中具有某种特性的比例与总体中具有这种特性的比例一致。,.,37,配额抽样法是在分层基础上进行的。配额抽样法的基本步骤:1、选择控制特性作为分层标准2、分层3、确定各层样本额4、配额指派,.,38,配额抽样根据其抽样方法可以分为:1、独立控制配额抽样,规定按独立的控制特征分配并抽取样本,即对调查对象只规定具有一定控制特征的样本抽取数目并规定配额,而不是规定具有两种或两种以上控制特征的样本抽取数目并规定配额。2、非独立控制配额抽样,也称为相互控制的配额抽样或交叉控制配额抽样。是同时对具有两种或两种以上控制特征的每一个样本数目都作出具体的规定。,.,39,独立控制配额抽样案例,一项研究要调查400名北京市区18-42岁的白领阶层对时尚的看法,配额的重要指标是城区、性别、年龄、职业。根据已知的资料得知总体中这四个指标的大致比例,则400人的样本也应该与总体中各项指标的比例相一致:,.,40,非独立控制配额抽样,某大学有4000名学生,其中男生占60%,女生占40%,管理类和理工类学生各占50%,大一、大二、大三、大四的学生比例分别为40%、30%、20%和10%,现在要抽取500人进行调查,按非独立控制配额抽样,其情况如下:,.,41,四、滚雪球抽样(snowballsampling)或网络抽样(networksampling):是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象。这种抽样中有些分子最后仍无法找到,有些分子被提供者漏而不提,两者都可能造成误差。,.,42,第三节概率抽样,优点:1.排除了人为的干扰。2.能够计算调查结果的可靠程度。不足:1.对所有调查样本都给予平等看待,难以体现重点。2.抽样范围广,所需时间长,参加调查的人员和费用多。3.需要具有一定专业技术的专业人员进行抽样和资料分析。,.,43,概率抽样的基本程序,1、明确研究的目的,确定研究所要估计的主要总体参数;2、确定研究总体和抽样单元;3、确定和构造抽样框:在确定调查总体和抽样单位后,应将总体按照抽样单位划分为各部分,构成抽样框;4、选择适当的抽样方法以及确定样本量的大小;5、制定抽样方案的具体实施细节。,.,44,一、简单随机抽样(simplerandomsampling)又称单纯随机抽样,是所有随机抽样方法中最简单的一种方法。它按照随机的原则从调查总体中不加任何分类、排序、分组等先行工作,直接从总体中逐个抽取若干单位组成研究样本。,.,45,1、无放回的简单随机抽样2、非常简单随机抽样概率抽样是不是等概率抽样?,.,46,抽样框,在进行随机抽样时,研究者首先要列出一个包含所有元素的详细名单,每个元素都对应着一个独一无二的、以数字表示的位置,这个名单就是抽样框。既没有遗漏,也没有重复。,.,47,简单随机抽样的方法1、抽签法:当总体很小的时候,将抽样框中的N个元素编号,把每个元素的号码写在签上,将签充分的混合,随机不放回的抽取直至样本规模符合要求。2、随机数表法:从随机数表上的任意位置开始,横向或纵向地连续选择数字,每个数字所代表的那个元素就被选入样本。3、计算机模拟法;4、使用统计软件直接抽取,.,48,.,49,二、系统抽样(systematicsampling)又称等距抽样、机械抽样,就是先将总体各元素按一定标准排序编号,再根据样本规模确定抽样间隔,然后随机确定以某个元素为起点,每隔若干个元素抽取一个,直到抽取元素符合样本规模的要求。抽样间距=总体规模样本规模,.,50,先按某种顺序给800名观众编号,然后随机确定起点为12,K=80010=80,则样本包括编号为12,92,172,252,332,412,492,572,652,732的十个人。,例:使用系统抽样从800名观众中抽取10名作为调查对象,.,51,1、媒介内容分析:构成周抽样2、系统抽样有可能造成抽样误差。如抽样框里的800个元素按收入高低排序:12,92,172,252,332,412,492,572,652,73275,155,235,315,395,475,555,635,715,795因此,抽样框里的元素要不要按照某种顺序排列,要看这种顺序是否影响了研究变量。3、避开抽样框里的元素排列周期,.,52,三、分层抽样也称分类抽样,方法是将总体按照某些重要的指标分成若干个互不重叠、穷尽的层次,使总体中的每一个单位都属于且只属于一个层次,然后在每一层内分别进行简单随机抽样或系统抽样,将各层所抽取出的子样本组成总的研究样本。,.,53,小学或以下10%初中20%大专以上30%高中或中专40%,大专以上3000人N1,高中或中专4000人N2,初中2000人N3,小学或以下1000人N4,30n1,40n2,20n3,10n4,总体N=10000,样本n=100人,某电视台需要了解某个电视节目的受众接受程度,以观众受教育程度为标志,划为四个层次:小学及以下、初中、高中或中专、大专及以上分别取样,合并成样本。,.,54,分层抽样的优点:1、降低抽样误差:分层抽样可以避免样本差异过大导致的抽样分布不准确。2、了解不同层的情况当具备某些特征的个体在总体里所占比例比较少,而这些特征又可能会影响最终的研究结果时,研究者往往采用分层抽样。,.,55,如研究我国新闻工作者的职业意识。研究者希望能够发现新闻工作者的地理位置和他们的报道风格、收入水平、教育程度等因素之间的关系。东部大城市的新闻工作者要多过于西部,如果进行简单随机抽样,西部的入样概率低于东部。因此首先得按照地理位置(东南西北)和每个省的国民生产总值(高中低)将全国31个省划分为12组,然后在每一组里进行随机抽样,最后的样本才能够体现不同地理位置、不同经济发达程度地区的新闻工作者的特征。,.,56,在实际操作中,使用分层随机抽样应注意以下几点:1、分层的标志必须可以把总体分隔为相互排斥的层次,而层间不能交叉重叠;2、各层之间差异大,但层内差异小;3、各层单位数目和比例必须能够获得;4、分层的层次数量不宜太多。,.,57,分层抽样与配额抽样,相同点:都是事先对总体中所有单位按其属性、特征进行分类,这些属性、特征我们称之为“控制特征”;不同点:分层抽样是按随机原则在层内抽选样本(简单随机抽样&系统抽样),配额抽样则是由调查人员在配额内主观判断选定样本(偶遇抽样&立意抽样)。,.,58,当研究者的抽样框不完整,研究对象在地理位置上过于分散,而研究经费有限时,研究者如何抽样?,.,59,四、整群抽样(clustersampling)或群集抽样,是先将总体划分为若干个群集,然后以简单随机抽样的方法选取部分群集作为调查样本,对群集内各个单位进行调查的一种随机抽样方法。优点:1.可以通过转换抽样单位扩大抽样的应用范围2.可节省人力、财力,.,60,总体群数R=16样本群数r=4样本容量,A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,L,H,P,D,(一)单级整群抽样,.,61,1、定义又称多阶抽样、多级抽样或分段抽样,它是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。调查对象总体庞大,分布广泛时采用。如:全国省市区(简单随机抽样),(二)多级整群抽样,.,62,2、多级整群抽样的步骤以大群为单位编制抽样框抽取若干大群以小群为单位给每个大群编制抽样框分别从每个大群中抽取小群根据需要重复3、4步骤得到基本元素,构成研究样本,.,63,多级整群抽样案例,共有50个村,270人,200人,180人,170人,160人,190人,110人,180人,210人,200人,170人,190人,210人,20人,20人,20人,20人,总体N=10000,样本n=100,110人,20人,.,64,案例,调查背景:为了解普通居民对某种新节目的接受程度,需要在一个城市中抽选1000户居民开展调查,在每户居民中,选择1名家庭成员作为受访者。总体抽样设计:由于一个城市中居民的户数可能多达数百万,除了一些大型的市场研究机构和国家统计部门之外,大多数企业都不具有这样庞大的居民户名单。这种情况决定了抽样设计只能采取多阶段抽选的方式。根据调查要求,抽样分为两个阶段进行,第一阶段是从全市的居委会名单中抽选出50个样本居委会,第二阶段是从每个被选中的居委会中,抽选出20户居民。,.,65,1、对居委会的抽选从统计或者民政部门,我们可以获得一个城市的居委会名单。将居委会编上序号后,用计算机产生随机数的方法,可以简单地抽选出所需要的50个居委会。2、在居委会中的抽样在选定了居委会之后,对居民户的抽选将使用居委会地图来进行操作。此时,需要派出一些抽样员,到各居委会绘制居民户的分布图,抽样员需要了解居委会的实际位置、实际覆盖范围,并计算每一幢楼中实际的居住户数。然后,抽样员根据样本量的要求,采用系统抽样或者其他方法,抽选出每个居委会的20户,作为最终访问的样本。,.,66,3、确定受访者访问员根据抽样员选定的样本户,进行入户访问。以谁为实际的被调查者,是抽样设计中最后一个问题。如果调查内容涉及的是受访户的家庭情

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论