统计研究的程序与数据搜集方法样本_第1页
统计研究的程序与数据搜集方法样本_第2页
统计研究的程序与数据搜集方法样本_第3页
统计研究的程序与数据搜集方法样本_第4页
统计研究的程序与数据搜集方法样本_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

记录研究程序记录调查与数据收集记录调查与数据收集数据组织与整顿数据组织与整顿记录列表、图示记录列表、图示描述记录分析描述记录分析记录资料为记录资料为一种总体还是一种样本为样本为样本推断记录分析推断记录分析为总体为总体关于总体结论关于总体结论二、数据收集办法为什么要收集数据:数据是记录分析基本什么是数据收集:依照记录研究目和规定,有组织、有筹划地向调核对象收集原始资料和次级资料。数据来源数据来源数据来源直接来源间接来源直接来源间接来源观测问卷调查各类出版物实验观测问卷调查各类出版物实验(一)原始数据收集办法1、全面调查(1)定期记录报表制度:严格报告制度指按照国家统一规定各项规定,自下而上地定期向国家和主管部门报送基本记录资料一种报告制度长处:能保证记录资料全面性和持续性能保证记录资料统一性和及时性能满足各级部门对记录资料需要缺陷:记录报表过多会增长基层承担有也许由于虚报瞒报而影响记录资料质量(2)普查:指国家为详尽理解某项重要国情国力而专门组织一次性全面调查由于需要大量人力、物力和财力,不适当经常进行近来一次普查:第一次全国经济普查国内人口普查:1953年1964年1982年1990年2、随机抽样调查:依照随机原则推算总体特性,又称概率抽样抽样调查是一种非全面调查,抽样推断理论基本是概率论。特点:(1)按随机原则选样,即样本单位抽取不受主观因素及其她系统性因素影响,每个总体单位均有均等被抽中机会(2)可以保证样本对总体代表性,即样本单位和总体具备相似概率分布(3)调查目是从数量上推算总体数量特性和数量体现,它可以到全面调查作用(4)抽样误差可以事先计算并控制长处:(1)能用较少人力、物力和时间达到全面调查目(2)调查资料精确性较高、受人为干扰也许性较小方式:(1)简朴随机抽样,每个个体被抽中机会相等;选取一种受试对象对其她元素没有影响;使用随机数表,抽签等方式。可以应用Excel中随机函数rand()依照样本框安排随机样本*样本框:抽样过程中抽取样本所有抽样单位名单。如,从全体学生中,直接抽取200名学生作为样本,那么,全体学生名单(花名册)就是这次抽样样本框。例:在编号为1-100学生中随机抽取随机编号=int(rand()*100))+1学会查看Excel协助文献(2)等距抽样,又称机械抽样或系统抽样,惯用于电话调查。例如:从一种学生人数为200人总体中抽取容量为20样本,将学生学号排序,假定随机选用学号起点4,然后从总体中选用样点学号为第4,第14,第24,…(3)类型抽样,又称分层抽样,把总体某种分类原则分为若干群组,这些群组满足互斥性、完备性、和相似性规定,然后在组中按照同样比例随机选用样本。特点:代表性高,抽样误差低。例如:调核对象按收入分为高、中、低三个层次,然后从每个阶层中或随机抽取(4)整群抽样,又称聚类抽样。先对总体分类,然后用简朴随机抽样选类,最后对选中类作普查或简朴随机抽样调查。较为有效。例如:按照家庭、宿舍楼或街区来抽取调核对象,对抽到家庭、宿舍楼或街区再作全面或随机调查。3、非概率抽样:不按照概率均等原则,而是依照人们主观经验或其他条件来抽取样本。缺陷:(1)由于调查者主观决策影响抽样整个过程,因而不能保证样本与否重现了总体分布构造,样本代表性往往较小,用这样样本推论总体是极不可靠。(2)误差有时相称大,并且这种误差又无法预计。长处:(1)诸多状况下,严格随机抽样几乎无法进行,例如调核对象总体边界不清而无法制作或提供抽样框。(2)有些研究为了符合研究目,不得不按照需要从总体中抽取少数有代表性个体作为样本。(3)随机抽样操作过程规定严格,实行起来比较麻烦,费时费力,因而如果调查目仅是对问题初步摸索,获得研究线索和提出假设,而不是由样本推论总体,采用随机抽样就不一定是必要。综上:操作以便、省钱省力,记录上也远较概率抽样简朴,并且若能对调查总体和调核对象有较好理解,抽样也可获得相称成功。方式:(1)典型调查在对调核对象有一定理解基本上,故意识地选取个别或少数有代表性单位进行调查一种非全面调查典型单位指在数量体现上具备普遍意义和代表性总体单位,可以用来推断总体数量(2)重点调查一种非全面调查,它是在被调查总体中选出一某些重点单位进行调查。这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体基本状况能以较少投入和较迅速度获得总体基本状况及变动趋势资料,但只合用于客观存在着重点单位状况例如:对大型钢铁公司调查可以理解全国钢铁生产状况对35个大中型都市物价调查可以理解全国物价状况(3)就近抽样(偶遇抽样、以便抽样、自然抽样)定义:是指研究者依照现状,以自己以便形式抽取偶尔遇到人作为调核对象,或者仅仅选取那些离得近来、最容易找到人作为调核对象。举例:为了调查某市交通状况,研究者到离她们近来公共汽车站,把当时正在那里等车人选作调核对象。其她类似偶遇抽样尚有:在街口拦住过往行人进行调查;在图书馆阅览室对当时正在阅读读者进行调查;在商店门口、展览大厅、电影院等公众场合向进出往来顾客、观众进行调查;运用报刊杂志向读者进行调查;教师以她所教班级学生作为调查样本调查等等。(4)目的式和判断式抽样(主观抽样、立意抽样):定义:调查者依照研究目的和自己主观分析,来选取和拟定调核对象办法。研究者根据主观判断选用可以代表总体个体作为样本。样本代表性取决于研究者对总体理解限度和判断能力。例如:在编制物价指数时,关于产品项目选取和样本地区决定等,常采用判断抽样。(5)滚雪球抽样:定义:当咱们无法理解总体状况时,可以从总体中少数成员入手,对她们进行调查,向她们询问还懂得哪些符合条件人;再去找那些人并询问她们懂得人。犹如滚雪球同样,咱们可以找到越来越多具备相似性质群体成员。例如,要研究退休老人生活,可以清晨到公园去结识几位散步老人,再通过她们结识其朋友。但是这种办法偏误也很大,那些不好活动、不爱去公园、不爱和别人交往、喜欢一种人在家里活动老人,你就很难把雪球滚到她们那里去,而她们却代表着此外一种退休后生活方式。滚雪球抽样是在特定总体成员难以找时最适合一种抽样办法。譬如对获得无家可归者、流动劳工及非法移民等样本就十分合用。(6)配额抽样(定额抽样):它与分层抽样中比例抽样相似,也是按调核对象某种属性或特性将总体中所有个体提成若干类或层,然后在各层中抽样,样本中各层(类)所占比例与她们在总体中所占比例同样。进行定额抽样时,研究者要尽量根据那些有也许影响研究变量各种因素来对总体分层,并找出具备各种不同特性成员在总体中所占比例。然后根据这种划分以及各类成员比例去选取调核对象,使样本中成员在上述各种因素、各种特性方面构成和在样本比例尽量接近总体情形。例:假设某高校有名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%,二年级、三年级、四年级学生分别占30%、20%和10%。现要用定额抽样办法依上述三个变量抽取一种规模为100人样本。根据总体构成和样本规模,咱们可得到下列定额表:男生(60)女生(40)文科(30)理科(30)文科(20)理科(20)年级一二三四一二三四一二三四一二三四人数129631296386428642配额抽样和分层抽样区别:A分层抽样总体进行分层时,普通根据一种特性或指标,分层目是为了照顾到某些比例小层次,使得所抽样本代表性进一步提高,误差进一步减小;而配额抽样则是根据各种特性,分层目是为了模仿出一种总体B分层抽样在每层进行抽样时,按照一定比例进行随机抽样;而配额抽样则是依照每一层中分派数额进行抽样C分层抽样完全依照概率原则,排除主观因素,客观地、等概率地到各层中进行抽样;而配额抽样则是“按事先规定地条件,有目地寻找”样本单位,在分层和抽样过程中有诸多人为因素影响(二)次级资料收集记录资料汇编刊物:各种记录年鉴、调查报告、记录摘要、网上电子资源有用记录信息网站:中华人民共和国国家记录局:中华人民共和国记录数据经济中华人民共和国中华人民共和国商业报告库.com/dir/baogao/bg00.htmgoogle和百度也是惯用数据来源……特别提示:要学会使用学校图书馆免费数据库财政学系09级研究生生曾颖同窗惯用数据库(详细内容见网络平台中课件“曾颖数据库”)1、国研网数据库特点:记录数据库包括宏观数据、金融、教诲、行业数据等,但是宏观数据年度跨度不大。适合对个别指标进行跨省、跨时间统一检索。此外有全文数据库等,包括某些专家学者文章,可以作为参照。2、中经网:90/scorpio/aspx/main.aspx?width=1014&height=708特点:以宏观数据为主,包括国家一级、31个省以及200各种市数据,与国研网记录数据库类似,记录项目没有国研网多,但是有些指标年份跨度更大。适合统一检索。3、资讯行特点:非常全数据库,几乎囊括了所有最新年鉴。适合寻找数据来源。缺陷在于:没有1995年之前年鉴,数据不是表格形式,需要自己修改。(可行办法涉及:粘贴到word中,把空白(^w)替代为制表符(^t),或者直接粘贴到excel,进行数据分列)。4、记录局数据库特点:近来几年刚出,还在完善中。可以对记录局出版年鉴数据进行统一检索。(和1、2很相似)有时候能找到1、2所没有数据。5、年鉴涉及历年记录年鉴以及普查数据、专项数据等,适合浏览年鉴。事实上,当前诸多最新年鉴,涉及《新中华人民共和国六十年记录资料汇编》、《记录摘要》等都可以在网上下载到excel版本。6、知网6.1文献非常全学术文献数据库,涉及了期刊、学位论文、学术会议论文等。这个加上维普话,基本上可以把中华人民共和国比较好期刊论文都涉及了。6.2年鉴中华人民共和国记录年鉴数据库(挖掘版)=提供对记录年鉴统一检索,但是效果不抱负,比较凌乱。列出了500部左右年鉴,比较全,但是不一定有最新。可以先在资讯行搜索数据指标所属年鉴,再在这里找到年鉴。……三、调查误差1、登记误差:调查过程中,工作不精确所导致误差。(1)偶尔性登记误差:调查人员责任心不强、技术不高所导致观测、测量、计算错误、笔误、错填、漏掉,以及被调查者回答有误、理解有误。特点:普通不具备倾向性,即在数量不会偏向某一方,理论上它可以用某种办法加以消除(2)系统误差:具备明显倾向性,在数量上往往偏向某一方,又称偏差。A、故意误差:故意虚报、瞒报、假报、编造、故意歪曲事实。B、非主观因素所引起误差。测量工具不准、调查方式安排不当。例如:使用非概率抽样办法进行调查也许由于访问时样本偏倚而浮现误差案例1:1936年,富兰克林·罗斯福(FranklinRoosevelt)第一任总统任期届满,共和党候选人、堪萨斯州州长阿尔弗雷德·兰登(AlfredLandon)与其竞选总统。为了预测大选成果,《文摘》杂志(LiteraryDigest)发出了1000万张模仿选票,收回237.6万张。据此,《文摘》杂志预测兰登将以57%对43%压倒性优势获胜,但选举成果却是罗斯福以62%对38%优势击败兰登。LiteracyDigest杂志民意调查尽管样本容量很大(240万),但是样本选取偏倚仍导致预测失败,该杂志可信度大大减少,最后走向了破产。与此同步,乔治·盖洛普在1936年大选预测中一方面使用运用定额抽样办法(即按照总体单位各种特性将总体分层,安排每个层次样本数额),运用一种约5万人样本,精确预测出罗斯福将获胜。LiteracyDigest问题出在哪呢?《文摘》杂志调核对象大多数是从电话簿和俱乐部花名册上选取。这样抽样办法从两方面影响了样本代表性。其一,当时只有1/4家庭拥有电话,并且拥有电话绝大多数都是富人。其二,如果是在1936年此前,这种偏好对预测影响也许不大,由于富人和穷人根据相似路线投票。而在大萧条年代,政治上划分更紧密地遵循经济路线,绝大多数穷人投民主党票,而比较富有人则倾向于共和党。案例2:1948年美国大选时,盖洛普联合全美约100家独立报纸,继续采用定额抽样办法对5万人次进行寻访,预测杜威(Dewey)将战胜杜鲁门,而成果是杜鲁门以52.8%选票获胜,杜威得票率为44.5%。《芝加哥论坛报》甚至未等大选最后成果揭晓,就在头版以大标题宣布杜威战胜杜鲁门,成果成为民意研究历史上一大笑话。而在那年大选中,密歇根调查研究中心所采用概率抽样宣布胜利。盖洛普问题出在哪呢?定额抽样似乎保证了样本和选举总体在被以为对选举办为有影响所有重要特性方面将会相似,但是选民哪些特性会影响她们选取,这恰恰是调查机构所不懂得而正努力尝试去发现。并且在规定定额内,访问人员可以自由选取她喜欢任何人,这给人为选取留有过多余地。2、代表性误差:非全面调查所固有产生因素:抽取样本时没有遵循随机原则;个别或某些单位不能完全反映总体性质;样本容量局限性;由某些单位数值来推断总体数值所产生误差,它不可以消除,但普通可以事先计算,并能将它控制在一定范畴内。§1.4记录调查方案与实践北京大学校园主流文化调查问卷问卷编号:调查时间:月日调查地点: 调查人:学号数据审核人:学号亲爱同窗:您好!咱们是经济学院本科生,为理解北京大学当前主流校园文化,并为咱们《记录学》案例教学收集数据,咱们在北大校园内展开本次调查。此问卷采用匿名填写方式,决不用于任何商业目。谢谢您支持!【填写阐明】请在每一问题后所给备选答案中选取符合你状况或你批准答案,并在所选答案前方框内打“√”,或在问题中处填写恰当内容。您当前所在年级是(1)大二(2)大三(3)大四您性别是(1)男(2)女您来自__________院系。您家庭来自(1)大都市(2)中小都市(3)农村您家里经济状况怎么样?(1)还不错(2)普通吧(3)比较差您父母受教诲限度:爸爸___妈妈___(1)大学(2)高中(3)初中(4)小学您以为北大最可贵地方是:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论