第三章-统计数据的整理与显示课件_第1页
第三章-统计数据的整理与显示课件_第2页
第三章-统计数据的整理与显示课件_第3页
第三章-统计数据的整理与显示课件_第4页
第三章-统计数据的整理与显示课件_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章统计数据的整理与显示第三章统计数据的整理与显示第一节数据的预处理一、数据的审核与筛选第一节数据的预处理一、数据的审核与筛选、数据的审核审核内容原始数据第二手数据完整性准确性适用性时效性 逻辑检查计算检查审核方法、数据的审核审核内容原始数据第二手数据完整性准确性适用性时剔除有明显错误的数据剔除不符合特定条件的数据、数据的筛选剔除有明显错误的数据、数据的筛选二、数据的排序数据排序就是按一定顺序排列数据、主要作用发现数据的变化趋势。为分类或分组提供依据。直接利用排序结果作分析。、方法定类数据按类排序定量数据按序排序二、数据的排序数据排序就是按一定顺序排列数据第二节品质数据的整理与显示第二节品质

2、数据的整理与显示一、定类数据的整理与显示 、频数与频数分布频数每一类别包含的数据个数,称为频数。各类别及相应的频数,称为频数分布比例部分与全体之比百分比用百分数表示的比例比率任两数值的比值一、定类数据的整理与显示 、频数与频数分布频数为研究广告市场的状况,一家广告公司在某城市随机抽取人就广告问题做了邮寄问卷调查,其中的一个问题是:“您比较关心下列哪一类广告?”商品广告; 服务广告; 金融广告;房地产广告;招生招聘广告;其他广告。例为研究广告市场的状况,一家广告公例广告类型人数(人)频率频率(%) 商品广告 112 0.560 56.0 服务广告 51 0.255 25.5 金融广告 9 0.0

3、45 4.5 房地产广告 16 0.080 8.0 招生招聘广告 10 0.050 5.0 其他广告 2 0.010 1.0 合计 200 1.000 100.0 表某城市居民关注广告类型的频数分布广告类型人数(人)频率频率(%) 商品广告 112 、定类数据的图示条形图用宽度相同的条形高度或长短来表图某城市居民关注不同类型广告的人数分布频数(人)示各类别频数或频率的图形、定类数据的图示条形图用宽度相同的条形高度或长短、圆形图用圆形及圆内扇形的面积来表示各类别频率的图形图某城市居民关注不同类型广告的人数的构成、圆形图用圆形及圆内扇形的面积来表示各类别频率的、累积频数把各类别的频数逐项累加、累积

4、频率把各类别的频率逐项累加二、定序数据的整理与显示、累积频数和累积频率、累积频数把各类别的频数逐项累加二、定序数据的整理在一项有关住房问题的研究中,研究人员在甲、乙两个城市各抽样调查户家庭,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”非常不满意; 不满意; 一般; 满意;非常满意。例在一项有关住房问题的研究中,研例回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意248.0 248.0 300100.0 不满意10836.0 13244.0 27692.0 一般9331.0 22575.0 16856.0 满意4515.0 2

5、7090.0 7525.0 非常满意3010.0 300100.0 3010.0 合计300100.0 表甲城市家庭对住房状况的评价回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意217.0 217.0 300100.0 不满意9933.0 12040.0 27993.0 一般7826.0 19866.0 18060.0 满意6421.3 26287.3 10234.0 非常满意3812.7 300100.0 3812.7 合计300100.0 表乙城市家庭对住房状况的评价回答

6、类别乙城市户数(户)百分比(%)向上累积向下累积户数(户、定序数据的图示累计频数分布图根据累积频数或累积频率作折线图累计户数(户)累计户数(户)(a)向上累积(b)向下累积图甲城市家庭对住房状况评价的累积分布图、定序数据的图示累计频数分布图根据累积频数或累积环形图用一段园环表示某一类别的频率图甲、乙两城市家庭对住房状况的评价环形图用一段园环表示某一类别的频率图甲、乙两第三节数值型数据的整理与显示一、数据的分组分组方法单变量值分组组距分组等距分组异距分组第三节数值型数据的整理与显示一、数据的分组分组方法单变量、单变量值分组、适用于离散变量且变量值较少、把每一变量值作为一组、单变量值分组、适用于离

7、散变量且变量值较少、例某生产车间名工人日加工零件数(单位:个)如下。试采用单变量值对数据进行分组。117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121例某生产车间名工人日加工零件117零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)107111911282108212021291110112111301112212241311113

8、112341332114112431342115112521351117312621371118312731392表某车间名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数适用连续变量或离散变量且变量值较多把一个区间作为一组,区间长度可以相等也可以不相等分组时应“不重不漏”、组距分组适用连续变量或离散变量且变量值较多、组距分组按数据的个数及数据本身的特点选择组数,也可按经验公式确定组数。组距分组步骤:选择组数(3.2)按数据的个数及数据本身的特点选择组数,也组距分组步骤一组数据的最大值与最小值之差称为极差,用表示,即最大值最小值由组数和极差就可确定组距,即确定

9、各组的组距与组限各组取相同的组距。然后选择接近数据中的最小值作为第一组的组中值,则各组的下限与上限由下式确定下限组中值,上限组中值即组距上限下限,组中值一组数据的最大值与最小值之差称为极差,用表示,即确定把数据归组后得频数分布表归组把数据归组后得频数分布表归组按零件数分组(个)频数(人)频率(%)1051103 6 1101155 10 1151208 16 12012514 28 12513010 20 1301356 12 1351404 8 合计50 100 表某车间名工人日加工零件数分组表按零件数分组(个)频数(人)频率(%)1051103 6 表某车间名工人日加工零件数分组表按零件数

10、分组(个)频数(人)频率(%)1051093 6 1101145 10 1151198 16 12012414 28 12512910 20 1301346 12 1351394 8 合计50 100 表某车间名工人日加工零件数分组表按零件数分组(个表某车间名工人日加工零件数分组表按零件数分组(个)频数(人)频率(%)110以下3 6 1101155 10 1151208 16 12012514 28 12513010 20 1301356 12 135以上4 8 合计50 100 表某车间名工人日加工零件数分组表按零件数分组(个各组的组距都相等各组的组频数可直接比较等距分组与不等距分组:等距

11、分组各组的组距都相等等距分组与不等距分组:等距分组各组的组距不都相等由于各组的组频数受组距大小影响,不能直接比较为消除组距大小对频数的影响,采用频数密度反映频数分布的实际状况,其中频数密度不等距分组各组的组距不都相等不等距分组二、定距数据和定比数据的图示、分组数据:直方图和折线图二、定距数据和定比数据的图示、分组数据:直方图和折线图用横轴表示组限,纵轴表示频数或频率等距分组时,各组以组距为宽,以频数或频率为高形成一个矩形,即为直方图。不等距分组时,则各组以组距为宽,以频数密度为高形成矩形,这时直方图的总面积等于数据个数。若各组以组距为宽,以频率密度()为高形成矩形,那么这种直方图的总面积等于直

12、方图用矩形来表示频数分布的图形用横轴表示组限,纵轴表示频数或频率直方图用矩图某车间工人日加工零件数的直方图105 110 115 120 125 130 135 140日加工零件数(个)频数(人)图某车间工人日加工零件数的直方图105 1直方图与条形图的差别条形图用宽度表示类别,宽度都相等,而直方图用宽度表示组距,宽度可以不相等条形图通常分开排列,而直方图则是连续排列直方图与条形图的差别条形图用宽度表示类别,宽度都相等折线图用折线表示频数分布的图形用横轴表示组中值,纵轴表示频数或频率用直线连接各组中值相应的频数或频率,即为折线图通常在第一组的左边和最后一组的右边各延伸一组,然后与这两组的组中值

13、连接折线图用折线表示频数分布的图形用横轴表示组中图6某车间工人日加工零件数的折线图日加工零件数(个)频数(人图6某车间工人日加工零件数的折线图日加工零件数(个)频茎叶图由“茎”和“叶”两部分组成,按“茎”把一组数据分为若干行,“茎”相同的数据分在同一行把尾数作为叶,其余数作为茎对数据个数为的一组数据,当 20300 时,可按经验公式确定茎叶图的行数L L=10log nX 表示不超过X 的最大整数。例如 n=50,则 L=10log 50=16.99=16茎叶图类似于横置的直方图、未分组数据:茎叶图和箱线图茎叶图、未分组数据:茎叶图和箱线图图某车间工人日加工零件数的茎叶图107 8 8(3)1

14、10 2 2 3 4 5 7 7 7 8 8 8 9 (13)120 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9 (24)130 1 3 3 4 4 5 7 9 9 (10) (个位)树茎树叶数据个数图某车间工人日加工零件数的茎叶图107 8 8(3)图8扩展的茎叶图10*10 7 8 811*0 2 2 3 411 5 7 7 7 8 8 8 9 12*0 0 1 2 2 2 2 3 3 3 3 4 4 412 5 5 6 6 7 7 7 8 8 913*0 1 3 3 4 413 5 7 9 9 树茎 树叶10s710 8 811*011t2

15、 2 3 11f4 511s7 7 711 8 8 8 9 12*0 0 112t2 2 2 2 3 3 3 312f4 4 4 5 512s6 6 7 7 712 8 8 913*0 113t3 313f4 4 513s713 9 9 树茎 树叶(a)(b)图8扩展的茎叶图10*10 7 8 811*0 . 由一个箱子和两条线段组成. 先连接下四分位数和上四分位数画出箱子,在箱子中确定中位数的位置,然后再连接最大值和值与箱子的连线不仅可表示一组数据的分布,还可以对多组数据作比较箱线图. 由一个箱子和两条线段组成箱线图图简单箱线图最小值下四分(位)数中位数最大值上四分(位)数图简单箱线图最小值

16、下四分(位)数中位数最大值上四分(图名工人日加工零件数的箱线图min107下四分位数117.75中位数123上四分位数128max139图名工人日加工零件数的箱线图min下四分位数中图不同分布的箱线图左偏分布中位数中位数中位数对称分布右偏分布图不同分布的箱线图左偏分布中位数中位数中位数对称分从某大学经济管理专业二年级学生中随机抽取人,对门主要课程的考试成绩进行调查,所得结果见表试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征。例从某大学经济管理专业二年级学生中例表名学生各科的考试成绩数据课程名称学生编号 英语 76 90 97 71 70 93 86 83 78 85 81 经济

17、数学 65 95 51 74 78 63 91 82 75 71 55 西方经济学 93 81 76 88 66 79 83 92 78 86 78 市场营销学 74 87 85 69 90 80 77 84 91 74 70 财务管理 68 75 70 84 73 60 76 81 88 68 75 基础会计学 70 73 92 65 78 87 90 70 66 79 68 统计学 计算机应用基础5585 9178 6881 7395 8470 8167 7082 6972 9480 6281 7177 表名学生各科的考试成绩数据课程名称学生编号 表各学科考试成绩的特征值课程名称最小值最大

18、值英语7071767881838586909397经济数学5155636571747578829195西方经济学6676787879818386889293市场营销学6970747477808485879091财务管理6068687073757576818488基础会计学6566687070737879879092统计学5562686970717381849194计算机应用基础6770727778808181828495表各学科考试成绩的特征值课程名称最小值最大值英语70图门课程考试成绩的箱线图英语统计学西方经济学市场营销学基础会计学计算机应用基础财务管理经济数学405060708090100

19、图门课程考试成绩的箱线图英语统计学西方市场营销学、时间序列数据:线图横轴表示时间,纵轴表示相应的数值图形长宽比例大致为 10:7一般纵轴从 0 开始,也可根据实际需要从某一值开始,并且用折断符号表示、时间序列数据:线图横轴表示时间,纵轴表示相应的数年我国城乡居民家庭的人均收入数据如表,试绘制线图。例表年城乡居民家庭人均收入年份城市居民农村居民1991 1700.6 708.6 1992 2026.6 784.0 1993 2577.4 921.6 1994 3496.2 1221.0 2019 4283.0 1577.7 2019 4838.9 1926.1 2019 5160.3 2091.

20、1 2019 5425.1 2162.0 年我国城乡居民例表图城乡居民家庭人均收入图城乡居民家庭人均收入、多变量数据:雷达图先画一个园,每个个体需同时考察个变量,则把园等分,连接圆心得个变量的坐标轴再把一个个体的个变量在坐标上的点相连接,可得一个边形个个体则可得个边形,这个多边形就是一个雷达图、多变量数据:雷达图先画一个园,每个个体需同时考察年我国城乡居民家庭平均每人各项消费支出数据如表,试绘制雷达图。例表3122019 年城乡居民家庭平均每人各项消费支出项目城市居民农村居民食品 1942.59 890.28 衣着 520.91 109.41 家庭设备用品及服务 316.89 85.41 医疗

21、保健 179.68 62.45 交通通讯 232.90 53.92 娱乐教育文化服务 448.38 148.18 居住 358.64 233.23 专项商品与服务 185.70 34.27合计 4185.60 1617.15 年我国城乡居民家庭平均例表3图 年城乡居民家庭消费支出图 年城乡居民家庭消费支出为研究某条河流的污染程度,环保局分别在上游、中游和下游设立取样点,每个取样点化验水中的五项污染指标,所得数据见表。将各指标用雷达图表示出来,并分析该河流的主要污染源。例表不同样本点的化验指标指标指标指标指标指标上游 4.52 5.0 483 196 14 中游 0.34 1.4 36 41 6 下游 2.17 6.8 208 112 35 为研究某条河流的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论