第二章统计数据的描述课件_第1页
第二章统计数据的描述课件_第2页
第二章统计数据的描述课件_第3页
第二章统计数据的描述课件_第4页
第二章统计数据的描述课件_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、华南理工大学精品课程统计学统计数据的描述第二章华南理工大学精品课程第二章 统计数据的描述录取中有无歧视?某高校只有两个系,财经系和工程系。该校报考及录取的总体情况如下:男生女生录取350200未录取450400报考人数800600引例:华南理工大学精品课程第二章 统计数据的描述 如果我们只看该校男女生录取的比率,即男生350/800=44%, 女生200/600=33%。这时我们不免会问,是男同学的成绩比女同学好,还是在录取中存在着性别的歧视?学过统计学的同学不会简单地做出结论,而是继续搜集数据并得到两个系各自录取的男女生数据:引例:华南理工大学精品课程第二章 统计数据的描述工程系财经系男生女

2、生男生女生录取30010050100未录取300100150300报考人数600200200400引例:华南理工大学精品课程第二章 统计数据的描述 有了分系的录取数据,不难看到工程系录取的人数比较多,男女生录取的比率都是50%。 而财经系招生名额较少,男女生录取的比率都是25%。由于女生报财经系的人多,男生报工科的人多,因而导致男生整个录取率偏高,而女生偏低。这个例子告诉我们对数据一是要从不同角度进行分析,二是要注意权数的影响,这就是本章要讨论的问题。引例:华南理工大学精品课程6引例提问录取中有无歧视?Q1Q2Q3统计学怎样对数据进行有效分析?怎样理解权数对均值的影响?华南理工大学精品课程7本

3、章学习内容1.学习如何用数据对客观事物进行计量, 如何获取数据以及对数据质量的评价2.如何对获取的数据进行整理3.数据分布的集中趋势和离散程度4.非正态总体的分布偏态和峰度5.茎叶图和箱线图的特点和优势6.统计表及统计图华南理工大学精品课程8本章学习目标 了解数据的计量尺度 了解统计数据的来源和数据的质量要求 掌握数值型数据的整理方法 掌握数据集中趋势和离散程度的测度方法 掌握茎叶图和箱线图的制作方法 掌握分布偏态与峰度的测度方法 掌握统计表和统计图的使用华南理工大学精品课程9第一节 数据的计量尺度2.42.5第二章具体章节结构 第二节 统计数据的来源第三节 统计数据的质量第

4、四节 统计数据的整理第五节 分布集中趋势的测度华南理工大学精品课程10第六节 分布离散程度的测度2.9第七节 分布偏态与峰度的测度第八节 茎叶图与箱线图第九节 统计表与统计图第二章具体章节结构 华南理工大学精品课程第一节 数据的计量尺度 按照计量学的一般分类方法,对数据分为四种计量尺度,即: 一、列名尺度二、顺序尺度三、间隔尺度四、比率尺度华南理工大学精品课程12列名尺度 (Nominal scale)也称名义尺度或分类尺度计量层次最低对事物进行平行的分类各类别可以指定数字代码表示使用时必须符合类别穷尽和互斥的要求数据表现为“类别”具有=或的数学特性华南理工大学精品课程13顺

5、序尺度 (Ordinal scale)也称定序尺度对事物分类的同时给出各类别的顺序比定类尺度精确未测量出类别之间的准确差值数据表现为“类别”,但有序具有或的数学特性华南理工大学精品课程14间隔尺度 (Interval scale)也称间隔尺度对事物的准确测度比定序尺度精确数据表现为“数值”没有绝对零点具有 + 或 - 的数学特性华南理工大学精品课程15比率尺度 (Ratio scale)也称比率尺度对事物的准确测度与定距尺度处于同一层次数据表现为“数值”有绝对零点具有 或 的数学特性华南理工大学精品课程16四种计量尺度的比较定类尺度定序尺度定距尺度定比尺度 分类( = , ) 排序( ) 间距

6、( + ,- ) 比值( , ) “”表示该尺度所具有的特性表2-1 四种计量尺度的比较华南理工大学精品课程17本节提问数据的计量尺度分为哪几种?Q1Q2Q3不同计量尺度各有什么特点?间隔尺度和比例尺度有何区别?华南理工大学精品课程第二节 统计数据的来源 统计数据来源于直接组织的调查、观察和科学试验,我们称之为第一手数据或直接的数据;或者来源于已有的数据,我们称之为第二手数据或间接的数据。一、间接获取的数据 二、直接获取的数据华南理工大学精品课程19间接取得的数据统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提

7、供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅到的相关资料中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社华南理工大学精品课程20提供统计数据的部分政府网站中国政府及相关机构 网址数据内容国家统计局http:/统计年鉴、统计月报等国务院发展研究中心信息网http:/宏观经济、财经、货币金融等 中国经济信息网http:/经济信息及各类网站华通数据中心http:/国家统计局授权的数据中心中国决策信息网http:/决策知识及案例三农数据网http:/三农信息、论坛及相关网站表2-2 提供统计数

8、据的部分政府网站华南理工大学精品课程21提供统计数据的部分政府网站美国政府机构 网址数据内容人口普查局http:/人口和家庭等联邦储备局http:/www.bog.frb.fed.us货币供应、信誉、汇率等预算编制办公室http:/omb财政收入、支出、债券等商务部http:/商业、工业等表2-2 提供统计数据的部分政府网站(续表)华南理工大学精品课程22普查 (census)为特定目的专门组织的非经常性全面调查通常是一次性或周期性的一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄总体华南理工大学精品课程23抽样调查 (sampling survey)1.从总体中随机抽取一部

9、分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法 2.具有经济性、时效性强、 适应面广、准确性 高等特点总体随机样本华南理工大学精品课程24本节提问简要说明统计数据的来源?Q1Q2获取直接统计数据的渠道主要有哪些?华南理工大学精品课程第三节 统计数据的质量 统计数据的误差: 一、抽样误差二、非抽样误差华南理工大学精品课程26统计数据的误差华南理工大学精品课程27抽样误差 (sampling error)由于抽样的随机性所带来的误差 所有样本可能的结果与总体真值之间的平均性差异 影响抽样误差大小的因素样本量的大小总体的变异性华南理工大学精品课程28非抽样误差 (non-sa

10、mpling error)相对于抽样误差而言除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异存在于所有的调查之中概率抽样,非概率抽样,全面性调查有抽样框误差、回答误差、无回答误差、调查员误差、测量误差华南理工大学精品课程29误差的控制抽样误差可计算和控制非抽样误差的控制 调查员的挑选 调查员的培训 督导员的调查专业水平 调查过程控制 调查结果进行检验、评估 现场调查人员进行奖惩的制度华南理工大学精品课程30本节提问简要说明抽样误差和非抽样误差?Q1Q2非抽样误差的控制有哪些途径?华南理工大学精品课程第四节 统计数据的整理一、统计数据的分组 二、次数分配三、次数分配直方图四、

11、洛伦茨曲线华南理工大学精品课程32统计数据的分组 统计分组是统计整理的第一步,它是按照统计研究的目的,将数据分别分入不同的组内。在本章第一节中,我们将数据分成四种计量尺度,即列名尺度、顺序尺度、间隔尺度和比例尺度。其中列名尺度和顺序尺度的数据是按照事物的性质和属性划分的,因而又称为按品质标志分组;间隔尺度和比例尺度是按照事物的数量标准划分的,又称为数量标志分组。 华南理工大学精品课程33组距分组(要点)将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况需要遵循“不重不漏”的原则可采用等距分组,也可采用 不等距分组华南理工大学精品课程34组距分组 (步骤)确定组数:组数的确定应以能够

12、显示数据的分布特征和规律为目的确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距( 最大值 - 最小值) 组数统计出各组的频数并整理成频数分布表华南理工大学精品课程35组距分组 (几个概念)1. 下限(low limit) :一个组的最小值2. 上限(upper limit) :一个组的最大值3. 组距(class width) :上限与下限之差4. 组中值(class midpoint) :下限与上限之间的中点值下限值+上限值2组中值 =华南理工大学精品课程36案例分析 次数分配表的编制【例】 某车间30名工人每周加工

13、某种零件件数如右表试对数据进行分组。 工人编号周加工零件数工人编号周加工零件数工人编号周加工零件数12345678910106841109110991111107121105111213141516171819209994119881189720310695106212223242526272829308510610110596105107128111101表2-3 某车间30名工人周加工零件数 (单位:件)华南理工大学精品课程37案例分析 次数分配表表2-4 某车间30名工人周加工零件数的频数分布按周加工零件数分组次 数80 9090 100100 110110 120120 1303713

14、52合计30华南理工大学精品课程38使用Excel频数函数 (FREQUENCY) Excel的“直方图”工具的缺陷是:频数分布和直方图没有与数据联系起来,这样,如果你改变任何一个数据,频数分布表和直方图不会跟着改变 使用Excel中的统计函数“FREQUENCY”来创建 频数分布表和直方图,可解决这一问题。华南理工大学精品课程39使用Excel频数函数 (FREQUENCY)创建频数分布表的步骤是:选择与接受区域相临近的单元格区域,作为频数分布表输出的区域选择统计函数中的“FREQUENCY”函数在对话框 Date-array 后输入数据区域,在Bins-array后输入接受区域同时按下ct

15、rl-shift-Enter组合键,即得到频数分布统计函数FREQUENCY华南理工大学精品课程40分组数据的图示 (直方图的绘制)我一眼就看出来了,周加工零件在100110之间的人数最多!图2-1 某车间工人周加工零件直方图华南理工大学精品课程41分组数据的图示 (折线图的绘制)折线图与直方图下的面积相等!图2-2 某车间工人周加工零件折线图 华南理工大学精品课程42次数分配的类型对称分布右偏分布左偏分布正J型分布反J型分布U型分布图2-3 几种常见的频数分布华南理工大学精品课程43洛伦茨曲线20世纪初美国经济学家、统计学家洛伦茨(M.E. Lorentz)根据意大利经济学家巴雷特(V. P

16、areto)提出的收入分配公式绘制而成描述收入和财富分配性质的曲线分析该国家或地区分配的平均程度AB累积的人口百分比 绝对公平线 累积的收入百分比 华南理工大学精品课程44基尼系数20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡收入分配平均程度的指标A表示实际收入曲线与绝对平均线之间的面积B表示实际收入曲线与绝对不平均线之间的面积如果A=0,则基尼系数=0,表示收入绝对平均华南理工大学精品课程45基尼系数5.如果B=0,则基尼系数=1,表示收入绝对不平均6.基尼系数在0 和1之间取值7.一般认为:基尼系数若小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,

17、即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。AB华南理工大学精品课程46本节提问描述次数分配表的编制过程。Q1Q2Q3解释洛伦茨曲线及其用途。说明基尼系数的含义和用途。华南理工大学精品课程第五节 分布集中趋势的测度一、众数二、中位数三、四分位数四、均值五、几何均值六、切尾均值七、众数、中位数和均值的比较华南理工大学精品课程48众数 (mode)一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据华南理工大学精品课程4

18、9众数 (不惟一性)无众数原始数据: 11 3 7 12 9 8一个众数原始数据: 7 4 6 13 4 4多于一个众数原始数据: 17 15 25 33 24 24华南理工大学精品课程50中位数 (median)1.排序后处于中间位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据4.各变量值与中位数的离差绝对值之和最小,即Me50%50%华南理工大学精品课程51中位数 (位置的确定)华南理工大学精品课程52案例分析 (9个数据的算例)【例】 9个家庭的人均月收入数据原始数据: 1400 750 760 1050 870 950 2100 1450 154

19、0 排 序: 750 760 870 950 1050 1400 1450 1540 2100位 置: 1 2 3 4 5 6 7 8 9中位数 = 1050华南理工大学精品课程53案例分析 (10个数据的算例)【例】 10个家庭的人均月收入数据 排 序: 635 690 770 820 930 1078 1230 1450 1690 2150 位 置: 1 2 3 4 5 6 7 8 9 10 华南理工大学精品课程54四分位数 (quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLQMQU25%25%25

20、%25%华南理工大学精品课程55四分位数 (位置的确定)华南理工大学精品课程56案例分析 (四分位数7个数据的算例)原始数据: 23 21 30 32 28 25 26排 序: 21 23 25 26 28 30 32位 置: 1 2 3 4 5 6 77+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6QL= 23QU = 30N+1华南理工大学精品课程57案例分析(四分位数10个数据的算例)【例】 10个家庭的人均月收入数据排 序: 500 650 760 780 940 1060 1350 1680 1790 1900位 置: 1 2 3 4 5 6 7 8 9

21、 10统计函数QUARTILE华南理工大学精品课程58均值 (mean)集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据华南理工大学精品课程59简单均值 (simple mean)设一组数据为: x1 ,x2 , ,xn总体均值样本均值华南理工大学精品课程60加权均值 (weighted mean)设一组数据为: x1 ,x2 , ,xn相应的频数为: f1 ,f2 , ,fk总体均值样本均值华南理工大学精品课程61案例分析 加权均值按零件数分组组中值(Xi)频数(Fi)XiFi105110110115115120120

22、125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计506160.0【例】根据表中的数据,计算50 名工人日加工零件数的均值 表2-5 某车间50名工人日加工零件均值计算表华南理工大学精品课程62均值 (数学性质)1. 各变量值与均值的离差之和等于零2. 各变量值与均值的离差平方和最小华南理工大学精品课程63几何均值 (geometric mean)n 个变量值乘积的 n 次方根适用于对比率数据的平均主要用于计算平均增长率计算公式为:可看作

23、是均值的一种变形华南理工大学精品课程64案例分析 几何均值 【例】 一位投资者购持有一种股票,在1997年、1998年、1999年和2000年收益率分别为 4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率 平均收益率103.84%-1=3.84%华南理工大学精品课程65切尾均值 (trimmed Mean)去掉大小两端的若干数值后计算中间数据的均值在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用计算公式为:n 表示观察值的个数;表示切尾系数,华南理工大学精品课程66案例分析 切尾均值【例】某次求职面试中共有11名评委,对某位求职者的给分分别是:

24、经整理得到顺序统计量值为去掉一个最高分和一个最低分,取1/11 华南理工大学精品课程67众数、中位数和均值的关系左偏分布均值 中位数 众数对称分布 均值= 中位数= 众数右偏分布众数 中位数均值图2-4 众数、中位数和均值的关系华南理工大学精品课程68众数、中位数、均值的特点和应用众数 -不受极端值影响 -具有不惟一性 -数据分布偏斜程度较大时应用中位数 -不受极端值影响 -数据分布偏斜程度较大时应用均值 -易受极端值影响 -数学性质优良 -数据对称分布或接近对称分布时应用小结数据类型和所适用的集中趋势测度值数据类型定类数据 定序数据定距数据定比数据适用的测度值众数中位数算术平均数算术平均数四

25、分位数众数调和平均数众数中位数几何平均数四分位数 中位数四分位数众数红色为该数据类型最适合用的测度值华南理工大学精品课程70本节提问一组数据的分布特征可以从哪几个方面进行测度?Q1Q2Q3怎样理解均值在统计学中的地位?对于比率数据的平均,为什么采用几何平均?简述众数、中位数和均值的特点和应用场合。Q4华南理工大学精品课程第六节 分布离散程度的测度一、极差二、内距三、方差和标准差四、离散系数华南理工大学精品课程72极差 (range)一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布7891078910计算公式为: R = max(xi) - min(xi)华南理工

26、大学精品课程73内距 (Inter-Quartile Range,IQR)也称四分位差上四分位数与下四分位数之差 内 距 = Q3 Q1反映了中间50%数据的离散程度不受极端值的影响可用于衡量中位数的代表性华南理工大学精品课程74案例分析 四分位差【例】 根据表中的数据,计算甲城市家庭对住房满意状况评价的四分位差回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 已知 QL = 不满意 = 2 QU = 一般 = 3四分位差: QD =

27、 QU = QL = 32 = 1表2-6 甲城市家庭对住房状况评价的频数分布华南理工大学精品课程75方差和标准差(Variance and Standard deviation)1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4 6 8 10 12 x = 8.3华南理工大学精品课程76总体方差和标准差 (Population variance and Standard deviation)未分组数据:方差的计算公式标准差的计算公式未分组数据:组距分组数:组距分组数:

28、华南理工大学精品课程77案例分析 总体标准差计算过程及结果【例】根据表中的数据,计算工人日加工零件数的标准差表2-7 某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)(Xi- X )2(Xi- X )2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计503100.5华南理工大学精品课程

29、78样本方差和标准差 (simple variance and standard deviation)方差的计算公式注意:样本方差用自由度n-1去除!标准差的计算公式未分组数据:未分组数据:组距分组数据:组距分组数据:华南理工大学精品课程79样本方差 自由度(degree of freedom)1.一组数据中可以自由取值的数据的个数2.当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x = 5。当 x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自

30、由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值4.样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量华南理工大学精品课程80案例分析 样本方差 样本方差与标准差原始数据: 10 5 9 13 6 8华南理工大学精品课程81离散系数(coefficient of variation)1.标准差与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为:华南理工大学精品课程82案例分析 离散系数【例】某公司抽查了所属的8家超市,其产品销

31、售数据如表。试比较产品销售额与销售利润的离散程度超市编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0表2-8 某公司所属8家超市的产品销售数据华南理工大学精品课程83案例分析 离散系数v1=536.25309.19=0.577v2=32.521523.09=0.710结论: 计算结果表明,v10时为正偏斜;当 0)(0时,表示频数分布比正态分布更集中,分布呈尖峰状态,0)(=0) (0)图2-8 峰度示意图华南理工大学精品课程第八节 茎叶图与箱线图一、茎叶图二、箱线图华

32、南理工大学精品课程97茎叶图 (stem-and-leaf display)用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形由数字组成以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留一位数字茎叶图类似于横置的直方图,但又有区别:-直方图可观察一组数据的分布状况,但没有给出具体的数值-茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息华南理工大学精品课程98案例分析 茎叶图树茎树叶78022347778889001222233334446677789013344579910111213数据个数31324 10茎叶图类似横置的直方图图2-9 某车间30

33、名工人周加工零件数据的茎叶图表华南理工大学精品课程99案例分析 扩展的茎叶图图2-10 扩展的茎叶图表7 8 80 2 2 3 45 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 90 1 3 3 4 4 5 7 9 9树茎树叶10*10.11*11.12*12.13*13.树茎树叶10s10.11*11t11f11s11.12*12t12f12s12.13*12t13f13s13.78 802 2 34 57 7 78 8 8 90 0 12 2 2 2 3 3 3 34 4 4 5 56 6 7 7 78 8 90 13

34、 34 4 579 9华南理工大学精品课程100箱线图 (box plot)用于显示未分组的原始数据的分布箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成箱线图的绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接华南理工大学精品课程101箱线图 (箱线图的构成)中位数4681012QUQLX最大值X最小值图2-11 简单箱线图华南理工大学精品课程102案例分析 箱线图最小值107最大值139中位数123下四分位数117.75上四分位数128105 110 11

35、5 120 125 130 135 140图2-12 50名工人日加工零件数的箱线图华南理工大学精品课程103分布的形状与箱线图对称分布QL中位数 QU左偏分布QL中位数 QU右偏分布QL 中位数 QU图2-13 不同分布的箱线图华南理工大学精品课程104案例分析 多批数据箱线图 课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础7665937468705585909581877573917897517685709268817174886984657395707866907378847093637980608781678691837

36、7769070828382928481706972787578918866948085718674687962818155787075687177【例】 从某大学工商管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征表2-11 11名学生各科的考试成绩数据华南理工大学精品课程105图2-14 8门课程考试成绩的箱线图案例分析 多批数据箱线图 华南理工大学精品课程106图2-15 11名学生8门课程考试成绩的箱线图min-max25%-75%median value455565758595105学生1

37、学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11案例分析 多批数据箱线图 华南理工大学精品课程107本节提问描述茎叶图和箱线图的画法?Q1Q2说明茎叶图和箱线图的用途。Q2Q2华南理工大学精品课程第九节 统计表与统计图统计表和统计图是显示统计数据的两种方式统计表把杂乱的数据有条理地组织在一张简明的表格内;统计图把数据形象地显示出来 。华南理工大学精品课程109统计表数字资料行标题附加列标题 表2-12 19992000年城镇居民家庭抽样调查资料 项 目单位1999年2000年 调查户数户4004442220 平均每户家庭人口人3.143.13 平均每户就业人口人1.771.68

38、 平均每户就业面%56.4353.67 平均每一就业者负担人数人1.771.86 平均每人全部年收入元5888.776316.81 可支配收入元5854.026279.98 平均每人消费性支出元4615.914998.00表头 资料来源:中国统计年鉴2001,中国统计出版社,2001,第305页。 注:本表为城镇居民家庭收支抽样调查材料。 华南理工大学精品课程110统计表设计的一般要求1.要合理安排统计表的结构2.总标题内容应满足3W要求3.数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明4.表中的上下两条横线一般用粗线,其他线用细线5.通常情况下,统计表的左右

39、两边不封口华南理工大学精品课程1116.表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的为数应统一7.对于没有小数点的单元,一般用“-”表示8.必要时可在表的下方加上注释统计表设计的一般要求华南理工大学精品课程112统计图常见的统计图:直方图、茎叶图和箱线图 折线图、条形图和圆形图、环行图、雷达图等等华南理工大学精品课程113定类数据的图示条形图(条形图的制作)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。条形图有单式、复式等形式。在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率。绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。

40、华南理工大学精品课程114定类数据的图示-条形图人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广告类型 图2-16 某城市居民关注不同类型广告的人数分布由 Excel 绘制的条形图定类数据的图示圆形图(圆形图的制作)华南理工大学精品课程1151.也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形。2.主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。3.在绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的。4.例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为360025.5%91.80,其余类推。定类数据的图示圆形图华南理工大学精品课程116 其他广告1.0% 房地产广告8.0% 商品广告56.0% 金融广告4.5% 服务广告25.5% 招生招聘广告5.8%图2-17 某城市居民关注不同类型广告的人数构成由 Excel 绘制的圆形图定序数据的图示环形图(环形图的制作)华南理工大学精品课程1171.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示2.环形图与圆形图类似,但又有区别圆形

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论