统计学课件统计数据_第1页
统计学课件统计数据_第2页
统计学课件统计数据_第3页
统计学课件统计数据_第4页
统计学课件统计数据_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一数据的预处第二品质第一数据的预处第二品质数据的整理与显第三数值型数据的整理与显第四统计Li掌握数值型数据整理与显示的方用Excel作频数分布表和形合理使用统计Li数据的审核与筛二数据的审核与筛二数据的排Li数据的审发现数据中的错数据的审发现数据中的错数据的筛找出符合条件的数数据排发现数据的基本特升序和降Li数据的审核(原始数据审核的内完整数据的审核(原始数据审核的内完整性审检查应调查的单位或个体是否有遗所有的调查项目或指标是否填写齐––准确性审检查数据是否真实反映客观实际情况,内检查数据是否有错误,计算是否正确––Li数据的审核(原始数据审核数据准确性数据的审核(原始数据审核数据准确性的方––检查调查表中的各项数据在计算结果和计算方–上有无错主要用于对定距和定比数据的审–Li数据的审核(第二手数据适用性审数据的审核(第二手数据适用性审弄清楚数据的来源、数据的口径以及有关的确定这些数据是否符合自己分析研究的需––时效性审应尽可能使用最新的统计数–确认是否必要做进一步的加工整Li当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,Li数据的排序(要点数据的排序(要点排序可借助于计算机完Li(方法字母型数据,排序有升序降(方法字母型数据,排序有升序降序之分,但习惯上汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降递增排序:设一组数据为X1,X2,…,XN,–递减排序可表–Li一定类数据的整理与一定类数据的整理与显二定序数据的整理与显Li定类数据的整理与显示(基定类数据的整理与显示(基本问题要弄清所面对的数据类型,因为不同类型的适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整Li定类数据的整理(基本过程定类数据的整理(基本过程Li定类数据的整理(可计算的指标定类数据的整理(可计算的指标频比数:落在各类别中的数据个例:某一类别数据占全部数据的比百分比:将对比的基数作为100而计算的比比率:不同类别数值的比LiLi【例3.1】为研究广告市场城市随机抽取200人就广告中的一个问题是“您比较关1.商品广告;2.服务Li【例3.1】为研究广告市场城市随机抽取200人就广告中的一个问题是“您比较关1.商品广告;2.服务地产广告;5.招生招聘广表3- 某城市居民关注广告类型的频数分广告类人数(人比频率92合1定类数据的图示—条形图(定类数据的图示—条形图(制作Li绘制Li其他广告招生招聘广 广房地产广 告 金融广 服务广 人数(人)绘制Li其他广告招生招聘广 广房地产广 告 金融广 服务广 人数(人)图3- 某城市居民关注不同类型广告的人数分定类数据的图示—圆形图(定类数据的图示—圆形图(制作在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占360的相应比例确定的例如,关注服务广告的人数占总人数的百分比25.5%3600×25.5%=91.80,其余类Li 绘制Li 绘制Li房地产广 招生招聘广告其他广 图3-2某城市居民关注不同类型广告的人数构定序数据的整理(可计算定序数据的整理(可计算的指标累计频数:将各类别的频数逐级累累计频率:将各类别的频率(百分比)Li定序数据频数分布表(实)Li表3- 甲城市家庭对住房状况评价的频数分定序数据频数分布表(实)Li表3- 甲城市家庭对住房状况评价的频数分回答甲城户(户百分向上向下户(户百分户(户百分满非常8合————【例3.2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1常不满意;2.不满;3.一般;4.满意;5.非定序数据频数分布表(实)Li表3- 乙城市家庭对住房状况评价的定序数据频数分布表(实)Li表3- 乙城市家庭对住房状况评价的频数分回答乙城户(户百分向上向下户(户百分户(户百分满非常合————定序数据的图示—累计频数分布图绘制Li图3- 甲城市家庭对住房状况评价的累积频数分定序数据的图示—累计频数分布图绘制Li图3- 甲城市家庭对住房状况评价的累积频数分累积户数(户0非常不满意一般满意非常 (b)向上累 累户数 0非常不满意一般 不满 满(a)定类数据的图示—环形图(制作定类数据的图示—环形图(制作––Li品质数据的图示—环形图(Excel绘制图3-甲品质数据的图示—环形图(Excel绘制图3-甲乙两城市家庭对住房状Li一.数据的分二.数一.数据的分二.数值型数据的图频数分布的类Li布表的步Li布表的步Li频数分布表的编制(实例频数分布表的编制(实例Li【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。分组方单变量值分组距分组方单变量值分组距分等距分异距分Li单变量值分组(要点单变量值分组(要点将一个变量值作为一适合于离散变适合于变量值较少的情Li单变量值分组表(实例Li表3- 某车间50单变量值分组表(实例Li表3- 某车间50名工人日加工零件数分组零件(个频(人零件(个频(人零件(个频(人121211133121443223211122112组距分组(要点组距分组(要点适合于变量值较多的情必须遵循“不重不漏”的原~~~~~Li组距分组(步骤确定组数:组数的确组距分组(步骤确定组数:组数的确定应以能够显示数据的分特征和规律为目的。在实际分组时,可以按 提出的经验公式来确定组数lg)K1确定各组的组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最组距=)根据分组整理成频数分布Li组距分组(几个概念组距分组(几个概念限:一个组的最大距:上限与下限之下上组.下限值+上限组中值2Li等距分组表(上下组限重叠Li表等距分组表(上下组限重叠Li表3- 某车间50名工人日加工零件数分组频数(人频率3586468合等距分组表(上下组限间断Li表等距分组表(上下组限间断Li表3- 某车间50名工人日加工零件数分组频数(人频率3586468合等距分组表(使用开口组Li表3-等距分组表(使用开口组Li表3- 某车间50名工人日加工零件数分组频数(人频率1101353586468合组距分组与不等距分组(频数分布上的组距分组与不等距分组(频数分布上的差异各组频数的分布不受组距大小的影可直接根据绝对频数来观察频数分布的特征和––规各组频数的分布受组距大小不同的影各组绝对频数的多少不能反映频数分布的实际–––Li分组数据—直方图(制作分组数据—直方图(制作形,实际上是用矩形的面积来表示各组的直方图下的总面积等于Li分组数据—直方图(绘制直方图下的积之和等于分组数据—直方图(绘制直方图下的积之和等于频数(人963110120125130135日加工零件数(个Li图3- 某车间工人日加工零件数的直方分组数据—直方图(与条分组数据—直方图(与条形图的区别直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有直方图的各矩形通常是连续排列,条形图Li分组数据—折线图(制作折线图也分组数据—折线图(制作折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组折线图的两个终点要与横轴相交,具体的做法第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点折线图下所围成的面积与直方图的面积相等,二者––Li分组数据—折线图(绘制频数(人963105分组数据—折线图(绘制频数(人963105110115135日加工零件数(个Li图3- 某车间工人日加工零件数的折线未分组数据—茎叶图(制作未分组数据—茎叶图(制作用于显示未分组的原始数据的分对于n(20≤n≤300)个数据,茎叶图最大行数不超过L=[10×log10n茎叶图类似于横置的直方图,但又有区直方图可大体上看出一组数据的分布状况,但没有给茎叶图既能给出数据的分布状况,又能给出每一个原––Li未分组数据—茎叶图(制作树3Li未分组数据—茎叶图(制作树3Li图3- 某车间工人日加工零件数的茎叶树未分组数据—茎叶图(扩展树树树树未分组数据—茎叶图(扩展树树树树7802247788800222233344456677880344797802235777888001222233334455667778801334579Li图3- 图3.7扩展后的茎叶未分组数据—箱线图(制作未分组数据—箱线图(制作箱线图由一组数据的5个特征值绘制而成,它首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL––Li未分组数据—单批数据箱线图(构成X最小X最大未分组数据—单批数据箱线图(构成X最小X最大中位468Li图3- 简单箱线未分组数据—单批数据箱线图(实例下四分中位上四分未分组数据—单批数据箱线图(实例下四分中位上四分最小最大Li图3- 50名工人日加工零件数的箱线中位中位QQ中位Li图3- 不同分布的箱线中位中位QQ中位Li图3- 不同分布的箱线Li表3- 11名学生各科的考试成绩数课程学生12345Li表3- 11名学生各科的考试成绩数课程学生123456789英计算机应用基【例3.4】从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表3-8试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特未分组数据—多批数据箱线图(STATIATICA绘制LiMedian图3- 8门课程考试成绩的箱线未分组数据—多批数据箱线图(STATIATICA绘制LiMedian图3- 8门课程考试成绩的箱线未分组数据—箱线图(由STATIATICA绘制Median学生学生学生学生学生学生学生学生学生学生学生图3-11名学生8门课Li未分组数据—箱线图(由STATIATICA绘制Median学生学生学生学生学生学生学生学生学生学生学生图3-11名学生8门课Li时间序列数据—线图(制时间序列数据—线图(制作绘制线图时应注意以下一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断Li时间序列数据—线图(实例Li时间序列数据—线图(实例Li表3- 1991~1998年城乡居民家庭人均收年城镇居农村居年我国城乡居民家庭的人均收入数据如表¥$绘制Li城镇居 农村居入(元绘制Li城镇居 农村居入(元0 图3-14城乡居民家庭人均收多变量数据—雷达图(要多变量数据—雷达图(要点雷达图(RadarChart)是显示多个变量的在显示或对比各变量的数值总和时十分有假定各变量的取值具有相同的正负号,总可用于研究多个样本之间的相似程Li多变量数据—雷达图多变量数据—雷达图(制作设有n组样本S1,S2,…Sn,每个样本测得先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个幅射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到再将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达Li多变量数据—雷达图(实例面Li【例多变量数据—雷达图(实例面Li【例3.6】1997年我国城乡居民家庭平均每人各项生活消费支出数据如表3-12。试主食表3- 1997年城乡居民家庭平均每人生活消费支城镇农村衣交通杂项商品与绘制Li食(元 绘制Li食(元 品及服娱乐教 医疗保文化交通图3- 1997年城镇居民家庭消费支农村居多变量数据—雷达图(实例Li【例3.7】为研究某条河流的污染程度,环保局分别在上游、中游和下游设立取样点,每个取样点化验水中的五项污染指标,多变量数据—雷达图(实例Li【例3.7】为研究某条河流的污染程度,环保局分别在上游、中游和下游设立取样点,每个取样点化验水中的五项污染指标,所得数据如表3-13。将各指标用雷达图表示出来,并分析该河流的主要污染源表3- 不同样本点的化验指指标指标指标指标指标中下6。Li指

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论