版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
社会调查人员系列培训调查统计/数据分析讲座课程要点一、数据的收集二、数据的整理三、数据的统计特性分析一、数据的收集两种数据来源:原始数据次级数据两种数据形式横截面数据(点)时间数列数据(面)数据的来源与分类数据收集(调查)策划调查目的调查对象-调查内容-调查方法调查结果满足调查目的调查对象一、全面调查不重复、不遗漏二、非全面调查代表性、选择偏性例—1936年罗斯福与兰登的总统竞选:《文学摘要》:罗斯福(43%)兰登(57%)1千万盖洛普:罗斯福(56%)5万人实际结果:罗斯福(62%)兰登(38%)调查方法方法对象特点适用条件普查全部单位一次性、周期性、数据准确、全面、使用面窄掌握总体情况有限总体抽样调查样本单位经济、实用、准确、适应面广掌握总体情况、有限总体与无限总体重点调查重点单位非随机性掌握趋势存在重点单位典型调查典型单位非随机性用于定性分析统计报表全部单位与非全部单位统一性、准确性调查内容(一)问卷结构:说明词、填写要求、问卷正文及结尾说明词:主办单位及调查员身份、调查的目的和意义、承诺及感谢问卷正文:需要调查的问题及答案、被调查者的背景资料结尾:说明问卷设计清楚定义内容:5w“您使用什么品牌的化妆品”用词通俗、词义明确“您经常收看电视节目吗?”“1、从来不看;2、偶尔看;3、有时看;4、经常看;5、天天看”避免隐含的选择(乘车、牛仔裤)避免否定形式的提问避免诱导性或倾向性的词汇、避免重叠、答案详尽(二)问卷的措辞(三)问题的顺序1、先易后难2、封闭型问题置前,敏感性、开放性问题置后3、注意对后继问题的影响:1)您在选择购物时,哪些因素是重要的?2)您在选择购物时,售后服务这个因素的重要性如何?4、逻辑思路保持一致二、数据的整整理审核分组(品质质数据、数量量数据)计算频数与频频率观察数据的表表现审核数据资料料的可用性方法错误如:时间,空空间,口径等等逻辑错误如:产值与销销售值,年龄龄与工作年限限主观错误敏感性、政治治性等如:失业率与与平均每周申申请失业保险险人数IBM
IBM
帕科特•贝尔
康柏
IBM帕科特•贝尔
苹果
苹果
盖威特-2000
帕科特•贝尔康柏
康柏
苹果
…………………数据的分组与与频率的计算算(一)品质数数据的分组与与计算频数:每组数数据值出现的的次数例:下表为购购买50台台计算机的样样本数据下表为购买计计算机数据的的频数分布表表按公司分组频数苹果机13康柏机12盖威特-20005IBM9帕科特•贝尔11合计50数量数据频数数分布的分组组需要3个个步骤:1.确定组数数;2.确确定组距;3.确定组组限。1214191815151817202722232221332814181613(二)数量数据据的整理案例:下表表为年终审计计耗用的时间间(单位:天天)=1.确定分组组数目:本例组数==5.3确确定分5个个组。2.确定组距距:本例组距=取整数5天天按审计时间分组(天)频
数10-14415-19820-24525-29230-341合
计203.计算频数数与频率5.计算审计计时间数据的的相对频数和和百分比频数数分布:按审计时间分组(天)相对频数百分比频数10-140.202015-190.404020-240.252525-290.101030-340.055合
计1.00100按审计时间分组(天)频数向上累计频数分布向下累计频数分布10-14442015-198121620-24517825-29219330-341201合
计20——6.计算审计计时间数据的的累积频数分分布在数量数据整整理中要注意意的问题1、在一些些应用中,我我们需要知道道各分组的中中点,也就是是组中值。2、开口组组(即只有上上限或只有下下限的组),,其组中值用用邻组的组距距计算。3、在数据据较少的情况况下,可用品品质数据整理理的方式,采采取单变量值值分组。4、连续变量量与离散变量量的组限问题题上组限不不在内5、等距与不不等距分组观察数据的表表现观察数据的表表现(特征))一般通过图图表来分析::统计图统计表统计指标(一)统计图图1、直方图::是用图形形说明数量数数据的一种常常用方法。下图为审计时时间数据直方方图2、条形图::是用图的方式式描述已概括括成频数、相相对频数或百百分比频数分分布的数据的的特征3、饼图::是用圆的各各部分面积来来呈现品质数数据的常用方方法。本例中中所有各组计计算机购买的的百分比频数数总和为100,一一个圆有360°,,则饼图中中苹果机的部部分为26%X360°°=93.6°其他组的部分分以此类推算算出:4.统计折线线图与曲线图图洛伦茨曲线生命曲线投机需求曲线线质量曲线5、象形图按收入大小顺序排列的家庭数占总收入的%累计家庭数%累计收入的%最低的20%4.7204.7第二个20%114015.7第三个20%176032.4第四个20%24.48056.8最高的20%43.2100100洛伦茨曲线累计收入的%累计家庭的%197519851995100101(二)统计表表年份国内生产总值最终消费最终消费率年末人口)1989112704199018319.511365.261.3114333199121280.413145.960.8115838199225863.615952.159.91171711993199419951996
合计34500.647110.959404.968498.2
274978.120182.158.327216.258.234529.459.040171.758.6
162562.6118517119850121121122389
—三、数据的统统计特性分析析绝对数与相对对数集中趋势:众数、中位数数、平均数离散趋势:全距方差、标准差差方差系数、标标准差系数一.绝对数与与相对数(一)绝对数数反映社会现象象整体规模和和水平时期数时点数(二)相对数数结构、比较、、计划等(三)绝对数数与相对数的的应用1、指标内涵涵和可比性::GNP、工业增加值2、指标的结结合运用举例:在美国,1985年有有19893人遭谋杀,,与1970年16848人遭到谋谋杀相比,增增加了20%。这些数字字揭示了在1970-1985年期期间美国变成成一个更多暴暴力的社会中国的国民生生产总值增长长了8%,美美国的为1%二.数据集中中趋势的分析析(一)众数数Mode众数是总体数数据中出现次次数最多的变变量值。例一:有10名大学学生的年龄::18,,18,,19,,19,,19,,19,,19,,20,,20,,21,,在这里19岁的人人数最多,所所以19岁岁是众数。。例二:有10名职工工的年龄:20,21,22,23,24,25,26,27,28,29,由由于各年龄的的人数相同,,没有明显集集中趋势点的的数值,所以以这里没有众众数。注意:1、是位置平平均数,不受受极端值的影影响2、假定各单单位在组内是是均匀分布的的3、信息量小小,缺乏敏感感性,不适合合代数运算4、用于非对对称的次数数数列、特别是是品质标志数数列5、用于数列列中有较多的的数值向某一一数值集中6、有时会存存在多个众数数(二)中位数数Medium中位数就是把把计算对象的的数据按大小小顺序排列后后,处于中间间位置上的变变量值。1、是位置平平均数,不受受极端值的影影响2、假定各单单位在组内是是均匀分布的的3、信息量小小,缺乏敏感感性,不适合合代数运算4、用于非对对称的次数数数列如:个人收入入、年龄注意:(三)均值Mean1.定义:均值就就是分布中全全部数据的算算术平均值。。2.确定1、对未经经整理的原始始数据,表示均值2、对分组数数据(加权))的均值某公司推销员员工作量如下下:推销量(件)组中值X推销员人数(人)FXF20-3030-4040-5050-6060-7025354555652810415028045022065合
计——251065举例对平均数的理理解:(1)某房间间有10人平平均身高1.6米,第11人走进,其身高1.9米,求11人的的平均身高;若房间里20个人身高平均1.6米则第21人走进,21人的身高高又会如何(2)一教师师出3个问题题,每题1分分班级中30%得3分,50%得2分,10%得1分,10%得0分;全班有有10个人;;全班有20人?(3)经济衰衰退时,工人人的平均工资资高,平均失失业期短;经经济繁荣时,平平均工资低,平均失业期期长;这会是真实吗吗?注意:1.平均数的的大小受变量量值和权重两两个因素的影影响2.平均数收收极端值的影影响3.权重的选选择要注意其其经济意义4.正确理解解各平均数指指标测度值优
点缺
点众数1、当数据有明显的集中趋势又是偏态分布时其代表性较好;2、不受极端数值的影响;1、具有不唯一性,有的分布有不只一个众数,有的分布没有众数;2、具有假定性,当假定不成立时其代表性会很差。中位数1、不受极端数值的影响;2、可描述集中趋势不明显;3、数据分布中心值;1、具有假定性,当假定性不成立时其代表性会很差;2、当分组数较少而分布又较集中时,中位数不一定准确。均值1、数据信息提取最充分,具有优良的数学性质;2、既是数据分布的中心,又是数据的重心,应用广泛,是其他统计方法的基础;1、对组距分组数据计算均值具有一定的假定性;2、受极端数值的影响;众数、中位数数和均值的特特点和应用场场合三.数据分布布离散程度的的分析离散程度是评评价数据一般般水平代表性性大小的依据据,并可以反反映数据分布布的均衡程度度。(一)全距((Range)与四分位距::全距也称极差差,是用分布布数据中的最最大值减去最最小值的差,,表示为四分位距::将所有数据据分为4份,,每部分之间间的分界点为为四分位数据据1、简单标准准差:(二)标准差差与方差举例:某百货货公司有6家分店,,经理要求掌掌握这6家家分店的年年净收入差异异水平,其标标准差计算如如下:平均年年净收入年净收入(万元)离差(
)离差平方(
)490-684624538-204005602457012144590321024600421764合
计07960(三)对标准准差的理解:1、相同的数数列,用原始始数据计算和和用分组数据据计算,标准准差有何不同同?2、10个数数的数列,若若只包括1、、9且标准差差最大,这10个数是什什么?1、是非变量量的标准差在统计研究中中,经常遇到到这样一种情情况,即统计计对象总体只只有两种表现现的可能,这这类总体的现现象表现就是是是非变量。。一般我们将其其中一种表现现的变量值表表示为1,,另一种表表现的变量值值表示为零,,如果我们用用P表示变量值1在总体体中出现的频频率,用Q表示变量值零零在总体中出出现的频率,,则有:,,,(四)其他形形式的标准差差是非变量的均均值:是非变量的方方差:2.总体方差差与组方差举例:某厂厂某班组12名工人人日产量件数数如下:9,11,14,15,16,19,20,21,21,22,23,28,对上述述12名名工人求日产产量的均值及及总方差得::如果对上述12名工工人按工人的的技术等级分分为两组:第一组工人的的日产量分别别为9,,11,,14,,15,,16这这5个变变量值,则其其组内均值::组方差:第一组的方差差:第二组的方差差:同理,第二组组2人日日产量分组有有19,,20,,21,,21,,22,,23,,28七七个变量值,,则其组内均均值和组内方方差为:工人分组工人日产量(件)工人数组内均值组内均值与总均值离差离差平方和乘频数XjFi
第一组9,11,14,15,16513-5125第二组19,20,21,21,22,23,287224112组间方差计算算列表组内方差的均均值与组间方方差之和等于于总方差,在在本例中各组组内方差的均均值为:则各类方差之之间的关系为为:26.92=7.17+19.75主要是标准差差系数或(五)离散系系数举例:有两个不同的的生产小组,,甲组是生产产配件,乙组组是整机装配配,现在要比比较这两个生生产小组在一一周内平均日日产量的均衡衡程度。
日期生产小组周一周二周三周四周五甲组6065707580乙组257912计算:(六)标准值值设标准化分位位值为Z,,则有有::或举例例::某某班班的的统统计计学学考考试试成成绩绩平平均均分分数数为为80分分,,标标准准差差为为6分分,,某某同同学学考考试试成成绩绩86分分,,则则该该同同学学统统计计学学的的分分数数相相对对于于平平均均分分数数的的标标准准化化分分位位值值是是::如果果该该同同学学在在英英语语考考试试中中的的成成绩绩是是120分分,,全全班班的的平平均均分分数数是是100分分,,标标准准差差是是20分分,,则则该该同同学学英英语语的的分分数数相相对对于于平平均均分分数数的的标标准准化化分分位位值值是是::在这这里里英英语语的的120分分与与统统计计的的86分分是是等等值值的的,,都都是是高高于于平平均均分分一一个个标标准准差差谢谢谢大大家家!!9、静夜四四无邻,,荒居旧旧业贫。。。12月-2212月-22Saturday,December24,202210、雨中黄黄叶树,,灯下白白头人。。。05:48:3005:48:3005:4812/24/20225:48:30AM11、以我我独沈沈久,,愧君君相见见频。。。12月月-2205:48:3005:48Dec-2224-Dec-2212、故人江海海别,几度度隔山川。。。05:48:3005:48:3005:48Saturday,December24,202213、乍见翻疑疑梦,相悲悲各问年。。。12月-2212月-2205:48:3005:48:30December24,202214、他他乡乡生生白白发发,,旧旧国国见见青青山山。。。。24十十二二月月20225:48:30上上午午05:48:3012月月-2215、比不了得就就不比,得不不到的就不要要。。。十二月225:48上上午12月-2205:48December24,202216、行动出成果果,工作出财财富。。2022/12/245:48:3005:48:3024December202217、做前,能能够环视四四周;做时时,你只能能或者最好好沿着以脚脚为起点的的射线向前前。。5:48:30上上午5:48上上午05:48:3012月-229、没有失败败,只有暂暂时停止成成功!。12月-2212月-22Saturday,December24,202210、很多事事情努力力了未必必有结果果,但是是不努力力却什么么改变也也没有。。。05:48:3005:48:3005:4812/24/20225:48:30AM11、成功就就是日复复一日那那一点点点小小努努力的积积累。。。12月-2205:48:3005:48Dec-2224-Dec-2212、世间成事,,不求其绝对对圆满,留一一份不足,可可得无限完美美。。05:48:3005:48:3005:48Saturday,December24,202213、不知香积积寺,数里里入云峰。。。12月-2212月-2205:48:3005:48:30December24,202214、意志坚强强的人能把把世界放在在手中像泥泥块一样任任意揉捏。。24十二二月20225:48:30上上午05:48:3012月-2215、楚塞塞三湘湘接,,荆门门九派派通。。。。十二月月225:48上上午午12月月-2205:48December24,202216、少年年十五五二十十时,,步行行夺得得胡马马骑。。。2022/12/245:48:3005:48:3024December202217、空山山新雨雨后,,天气气晚来来秋。。。5:48:30上上午5:48上上午午05:48:3012月
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度年福建省高校教师资格证之高等教育心理学考前练习题及答案
- 2024年度山西省高校教师资格证之高等教育法规典型题汇编及答案
- 一年级数学计算题专项练习集锦
- 戒毒康复人员常规医疗服务工作总结
- 2024年保安人员劳务服务协议
- 自然保护区建设与管理结课论文
- 2024年回迁房屋购买协议格式
- 2024年合作伙伴合资经营协议
- 2024年学生暑假工聘任协议示例
- 物联网L1题库测试与答案2020第23部分
- 三年级上册数学说课稿《5.笔算多位数乘一位数(连续进位)》人教新课标
- 行贿受贿检讨书
- 人教版《劳动教育》六上 劳动项目二《晾晒被子》教学设计
- (正式版)QC∕T 1208-2024 燃料电池发动机用氢气循环泵
- 中外合作办学规划方案
- 医学美容技术专业《中医美容技术》课程标准
- CJJ207-2013 城镇供水管网运行、维护及安全技术规程
- 六年级道德与法治期末测试卷加答案(易错题)
- 三位数除以两位数300题-整除-有标准答案
- 办公室装修工程施工方案讲义
- 医院护理人文关怀实践规范专家共识
评论
0/150
提交评论