




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1样本数据的样本数据的基本基本特征特征图形表示图形表示频次与频率频次与频率计算计算延伸延伸累计频次与频率累计频次与频率样本数据的样本数据的位置位置特征特征对数据的对数据的离散离散描述描述对数据的对数据的集中集中描述描述点状描述点状描述区间描述区间描述第第3 3章章 样本数据特征的初步分析样本数据特征的初步分析 样本数据的样本数据的综合特征综合特征描述描述箱型图箱型图样本数据的样本数据的分布特征分布特征峰度和偏度峰度和偏度21.1.频次(频次(Frequency) 2.2.频率(频率(Percentage或或Relative Frequency)种类种类:1.1.刻度级刻度级数据的频次与频率数据
2、的频次与频率2.2.顺序级顺序级数据的频次与频率数据的频次与频率3.3.名义级名义级数据的频次与频率数据的频次与频率3.1 3.1 样本数据结构的样本数据结构的基本基本特征:频次与频率特征:频次与频率一、频率、频次的一、频率、频次的含义含义会计学院 彭韶兵3某商品在抽样商店的单价某商品在抽样商店的单价(单位:元)(单位:元)9.98 10.02 10.00 10.04 10.01 9.99 10.05 10.04 9.98 10.02 10.00 10.04 10.01 9.99 10.05 10.04 10.0610.06 10.0l 10.0l 10.03 9.99 9.97 10.03
3、9.99 9.97 9.939.93 l0.01 10.03 l0.03 10.02 10.05 9.99 l0.01 10.03 l0.03 10.02 10.05 9.999.95 9.96 9.98 10.00 9.97 10.0l 10.00 9.99 9.98 10.009.95 9.96 9.98 10.00 9.97 10.0l 10.00 9.99 9.98 10.00表表3.1.2 某单位职工受教育程度的结构某单位职工受教育程度的结构受教育程度受教育程度 小学小学 初中初中 高中高中 大学大学 硕士研究生硕士研究生 合计合计 各个受教育程度出现的频次各个受教育程度出现的频次
4、1229216各受教育程度出现的频率各受教育程度出现的频率(%)(%)6.2512.512.556.2512.5100表表3.1.2 3.1.2 家具基色调出现的频次家具基色调出现的频次 家具的基色调家具的基色调BGRWY合计合计 各个基色调出现的频次各个基色调出现的频次16851030各个基色调出现的频率各个基色调出现的频率(%)(%)3.3320.0026.6716.6733.33100会计学院 彭韶兵4频数分布(次数分布)频数分布(次数分布)频率分布频率分布变量分布数列变量分布数列属性分布数列属性分布数列单项数列单项数列等距数列等距数列分分 类类异距数列异距数列组距数列组距数列二、频率分
5、布的二、频率分布的常用指标常用指标的计算方法的计算方法产量产量人人 数数比率(频率比率(频率% %)合合 计计10010050605060607060702 28 830306.67%6.67%26.67%26.67%会计学院 彭韶兵5向下累计数向下累计数(2 2)开口组)开口组= =上限上限- -邻近组组距邻近组组距/2/2(缺下限)(缺下限) 下限下限+ +邻近组组距邻近组组距/2/2(缺上限)(缺上限)1.1.全距(极差)全距(极差)= =最大值最大值- -最小值最小值2.2.组距组距= =全距全距/ /组数组数3.3.组中值:组中值:(1 1)闭口组)闭口组= =(上限(上限+ +下限
6、)下限)/2/25.5.累计数累计数向上累计数向上累计数4.4.组平均数组平均数会计学院 彭韶兵6组别组别组组1 1组组2 2 组组3 3 组组4 4 组组5 5 组组6 6 组组7 7 组界组界(15.75(15.75,16.25)16.25) 16.2516.25,16.7516.7516.7516.75,17.25)17.25) 17.2517.25,17.75)17.75) 17.7517.75,18.25)18.25) 18.2518.25,18.7518.75 18.7518.75,19.25)19.25) 身高身高16.016.3,16.5 16.8,17.0,17.1,17.2
7、17.5,17.6,17.717.8,18.018.1,18.218.3,18.5,18.619.0频次频次1 11 1 1 1 1 1 1 1 1 1 1 12 2 22 2 22 1 1 2 1 1 1 11 1 11 1 11 1组频组频次次1 12 24 46 65 53 31 1某班组男职工的身高数据分组某班组男职工的身高数据分组 会计学院 彭韶兵7 产产 值值( (万元万元) )人数人数(人)(人)频率频率(% %)向上累计向上累计 向下累计向下累计(% %)6060以下以下 60-70 60-70 70-80 70-80 80-100 80-100 100100以上以上 5 5
8、11 11 17 17 11 11 6 6 101022223434222212125 516163333444450501001009090686834341212 合合 计计50501001005050名学生统计学考试成绩分布表名学生统计学考试成绩分布表二、频率、频次的二、频率、频次的图形表示法图形表示法会计学院 彭韶兵8会计学院 彭韶兵91.1.饼图饼图(Pie Chart)(1 1)适用范围)适用范围:适用于所有测度级别的数据。适用于所有测度级别的数据。(2 2)SPSS实现实现:AnalyzeGraphsChartFrequenciesDescriptive StatisticsPi
9、e10会计学院 彭韶兵11会计学院 彭韶兵122.2.条形图条形图(Bar Chart)(1 1)适用范围适用范围:适用于顺序级以上的数据,:适用于顺序级以上的数据, 也可以也可以“强行强行”用于名义级。用于名义级。(2 2)SPSS实现实现:AnalyzeGraphsChartFrequenciesDescriptive StatisticsBar会计学院 彭韶兵13会计学院 彭韶兵14(2 2)SPSS实现实现:3.3.直方图(直方图(Histogram)(1 1)适用范围适用范围:适用于:适用于顺序级顺序级以上的数据。以上的数据。GraphsHistogramExploreAnalyze
10、Descriptive StatisticsFrequenciesDescriptive Statistics Analyze(3 3)与条形图的关系)与条形图的关系:条形图是直方图的:条形图是直方图的特例特例。会计学院 彭韶兵15会计学院 彭韶兵16(3)“(3)“茎节茎节”的宽度的宽度确定原则:确定原则: 茎节是有变化的茎节是有变化的1231.231.23,茎节宽度为,茎节宽度为10010012.312.3,茎节宽度为,茎节宽度为1010样本值样本值=“=“茎节茎节. .叶叶”表达表达“茎节茎节”的宽度的宽度 (4 4)茎节的长度)茎节的长度茎节长度茎节长度=“=“允许的最大叶值最小叶值允
11、许的最大叶值最小叶值+1”+1”。茎节长度茎节长度= =茎节宽度10n4.4.茎叶图茎叶图(1 1)适用范围适用范围:适用于:适用于顺序级顺序级以上的数据。以上的数据。(2 2)基本含义基本含义:会计学院 彭韶兵17某班级男生的身高数据某班级男生的身高数据(单位:厘米)(单位:厘米) 171 182 175 177 178 181 185 168 170 175 177180 176 172 165 160 178 186 190 176 163 183 按照按照“样本数据集合中的样本数据集合中的茎节茎节必须是有变必须是有变化化”的原则的原则, ,显然,在本例中显然,在本例中, , 应以百位数
12、和十位应以百位数和十位数为数为“茎茎( (节节)”)”,也就是说,也就是说,“茎茎( (节节)”)”的宽度是的宽度是10(10(厘米厘米) )。这样。这样,“,“叶叶”就只能是个位数了。就只能是个位数了。 于是于是, ,按照上述制作规则,我们可以用按照上述制作规则,我们可以用SPSS软软件得到茎叶图。件得到茎叶图。 (5 5)SPSS实现实现:AnalyzeDescriptive StatisticsExplore会计学院 彭韶兵18某商品价格某商品价格(单位单位:元元) Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 99 . 3 1.00 99
13、. 3 1.00 99 . 5 1.00 99 . 5 3.00 99 . 677 3.00 99 . 677 7.00 99 . 8889999 7.00 99 . 8889999 8.00 100 . 00001111 8.00 100 . 00001111 5.00 100 . 22333 5.00 100 . 22333 4.00 100 . 4455 4.00 100 . 4455 1.00 100 . 6 1.00 100 . 6 Stem width: 0.10000.1000 Each leaf: 1 1 case( (s) )会计学院 彭韶兵19数据分组的思路数据分组的思路计
14、算备选的中心坐标(组中值)计算备选的中心坐标(组中值)=取整后的最小取整后的最小数据数据+计算组数计算组数确定中心坐标。离取整后的最小数据最近的备确定中心坐标。离取整后的最小数据最近的备选中心坐标选中心坐标确定区间确定区间=中心坐标中心坐标0.5区间长度区间长度找出所给数据资料中的最小数据,向下取整。找出所给数据资料中的最小数据,向下取整。k区间长度。 k=0,1,且k 区间长度 1。确定数据的量纲单位确定数据的量纲单位例题例题会计学院 彭韶兵20组别组别组组1 1组组2 2 组组3 3 组组4 4 组组5 5 组组6 6 组组7 7 组界组界(15.75(15.75,16.25)16.25)
15、 16.2516.25,16.7516.7516.7516.75,17.25)17.25) 17.2517.25,17.75)17.75) 17.7517.75,18.25)18.25) 18.2518.25,18.7518.75 18.7518.75,19.25)19.25) 身高身高16.016.3,16.5 16.8,17.0,17.1,17.217.5,17.6,17.717.8,18.0,18.1,18.218.3,18.5,18.619.0频次频次11 1 1 1 1 12 2 22 1 1 11 1 11组频组频次次1246531某班男生的身高数据分组某班男生的身高数据分组 会计
16、学院 彭韶兵21 某工厂同工种的某工厂同工种的5050名工人完成个人生产定额名工人完成个人生产定额百分数如下百分数如下(%)83 88 123 118 158 121 146 l 17 l08 105110 107 137 120 163 125 136 127 142 118103 87 115 141 117 123 126 138 151 10186 82 113 114 119 126 135 93 142 108101 105 95 125 116 132 138 131 127 125试根据上述资料对数据进行分组试根据上述资料对数据进行分组。练习练习会计学院 彭韶兵22无无众数众数
17、(极端情况下极端情况下)二、样本数据的位置特征:二、样本数据的位置特征: 对数据中心的描述对数据中心的描述一、样本众数一、样本众数( (Sample Mode) ) 1.1.样本众数样本众数定义定义 2. .样本众数样本众数种类种类单一单一众数众数(大多数情况下大多数情况下)复复众数众数(一般情况下一般情况下)3. .样本众数的样本众数的计算计算顺序级顺序级的样本数据的样本数据名义级名义级的样本数据的样本数据刻度级刻度级的样本数据的样本数据分组分组不分组不分组会计学院 彭韶兵23单项数列单项数列某商品的价格某商品的价格价格价格单位:元次数次数频率频率9.93 9.94 9.95 9.96 9.
18、97 9.98 9.99 10.00 10.01 10.02 10.03 10.04 10.05 10.06 1 0 1 1 2 3 4 4 4 2 3 2 2 13.33 0 3.33 3.33 6.67 10.0 13.33 13.33 13.33 6.67 10.0 6.67 6.67 3.33组距数列组距数列dLM21101:众数组次数与前一组次数之差众数组次数与前一组次数之差2:众数组次数与后一组次数之差众数组次数与后一组次数之差L:众数组的下限众数组的下限 会计学院 彭韶兵242.2.样本中位数的样本中位数的使用使用: 当样本数据的个数当样本数据的个数( (样本容量样本容量) )为
19、为偶数偶数时,样时,样本中位数本中位数仅适用于刻度级仅适用于刻度级的样本数据集合的样本数据集合( (因因为顺序级的数据不能做加减运算为顺序级的数据不能做加减运算) )。 当样本数据的个数当样本数据的个数( (样本容量样本容量) )为为奇数奇数时时, ,样样本中位数本中位数适用于顺序级以上适用于顺序级以上的样本数据集合;的样本数据集合;二、样本中位数二、样本中位数( (Sample median) )1.1.样本中位数样本中位数定义定义:3.3.样本中位数的样本中位数的计算计算:会计学院 彭韶兵25 当当 为为奇数奇数时时, ,中位数中位数位置位置= =n5 . 0121)( nn样本样本中位数
20、中位数= = 21nx 当当 是是偶数偶数时时, ,中位数中位数位置位置= =n样本样本中位数中位数= = 5 . 0121)(nn 5 . 0)(2)(2122122nnnnnxxxxx未分组数列未分组数列组距数列组距数列刚好大于刚好大于 的向上累计数所在的组的向上累计数所在的组f:中位数组的次数:中位数组的次数s:中位数组前一组的向上累计数:中位数组前一组的向上累计数22222dfSfLMe2f会计学院 彭韶兵26 某车间同工种的某车间同工种的1010名工人完成个人生产定额名工人完成个人生产定额百分数如下百分数如下(%):93 98 123 118 158 121 146 l 17 l08
21、 105试根据上述资料求出试根据上述资料求出工人平均完成生产定额大约工人平均完成生产定额大约是多少?是多少? 该车间工人完成个人生产定额该车间工人完成个人生产定额排序排序如下:如下:93 98 105 108 117 118 121 123 146 15893 98 105 108 117 118 121 123 146 158DataSort Case排序的排序的SPSS实现命令实现命令:会计学院 彭韶兵27 产产 值值( (万元万元) )人数人数(人)(人)频率频率(% %)向上累计向上累计 向下累计向下累计(% %)6060以下以下 60-70 60-70 70-80 70-80 80-
22、100 80-100 100100以上以上 5 5 11 11 17 17 11 11 6 6 101022223434222212125 516163333444450501001009090686834341212 合合 计计50501001005050名学生统计学考试成绩分布表名学生统计学考试成绩分布表22222dfSfLMe会计学院 彭韶兵28三、样本均值(三、样本均值(Sample Mean) 样本均值样本均值 又称样本平均数又称样本平均数仅适用于刻度级仅适用于刻度级的的数据。数据。xniixnx11未分组数列未分组数列分组数列分组数列fxfxx:组中值:组中值f:频次或次数:频次或
23、次数加权平均数加权平均数简单平均数简单平均数会计学院 彭韶兵29 人均月奖金(元) 职工人数(人) 1020 6 2030 10 3040 20 4050 30 5060 40 6070 240 7090 60 90以上 20 练习练习某地区抽样调查职工月奖金资料如下:某地区抽样调查职工月奖金资料如下:试计算平均月奖金,中位数和众数。试计算平均月奖金,中位数和众数。会计学院 彭韶兵303.4 3.4 样本数据的离散特征样本数据的离散特征 一、一、 点状点状描述描述:适用于适用于顺序级以上顺序级以上数据。数据。 在一般情况下在一般情况下, , 仅适用于仅适用于刻度级刻度级的数据。只有的数据。只有
24、在在n+1n+1能够被能够被4 4整除整除时时, ,才适用于才适用于顺序级顺序级的数据。的数据。 1.1.极值极值MaximumMinimum2.2.四分位点四分位点中四分位点中四分位点下四分位点下四分位点Lower Quartile上四分位点上四分位点Upper Quartile0 1 2 3 4 3Q (99.8) (99.9) (100.1) (100.2) (99.8) (99.9) (100.1) (100.2) 1Q的位置的位置 的位置的位置 的位置的位置2Q1n未分组数列未分组数列会计学院 彭韶兵31组距数列组距数列刚好大于刚好大于 的向上累计数所在的组的向上累计数所在的组f:中
25、位数:中位数(四分位数四分位数)组的次数组的次数s:中位数:中位数(四分位数四分位数)组前一组的组前一组的2222242dfSfLMQe42f向上累计数向上累计数3.上下十分位点上下十分位点(Percentile) 会计学院 彭韶兵32 产产 值值( (万元万元) )人数人数(人)(人)频率频率(% %)向上累计向上累计 向下累计向下累计(% %)6060以下以下 60-70 60-70 70-80 70-80 80-100 80-100 100100以上以上 5 5 11 11 17 17 11 11 6 6 101022223434222212125 5161633334444505010
26、01009090686834341212 合合 计计50501001005050名学生统计学考试成绩分布表名学生统计学考试成绩分布表22222dfSfLMe会计学院 彭韶兵333.3.样本标准差(样本标准差(Sample Deviations)2.2.四分位距(四分位距(Interquartile Rang)二、区间描述二、区间描述1.1.极差(极差(Rang)4.4.样本方差(样本方差(Sum of Squared Deviations)三、样本数据的综合表达三、样本数据的综合表达箱形图箱形图刻度尺极差四分位距上四分点中位数下四分点极小值极大值SPSS实现实现ExploreAnalyzeDescriptive StatisticsGraphs
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年中国电火花滤芯行业深度研究分析报告
- 2025年高级涂布白卡纸项目可行性研究报告
- 2020-2025年中国妇科药行业发展前景预测及投资战略研究报告
- 中国喷流式诱导风机箱项目投资可行性研究报告
- 2024-2025学年高中历史第2单元工业文明的崛起和对中国的冲击第7课新航路的开辟练习岳麓版必修2
- 2024-2025学年高中物理第二章恒定电流第8节多用电表的原理课时训练含解析新人教版选修3-1
- 2024年高中语文第四单元第14课一名物理学家的教育历程课时优案1含解析新人教版必修3
- 2024-2025学年高中物理第四章第5节电磁感应现象的两类情况课后达标能力提升练习含解析新人教版选修3-2
- 电平坑扒炉行业市场发展及发展趋势与投资战略研究报告
- 广东瓷砖项目申请报告范文模板
- 疫情统计学智慧树知到答案2024年浙江大学
- 三方资金转换协议书范本
- 2024住院患者静脉血栓栓塞症预防护理与管理专家共识要点(全文)
- 火锅店后厨培训计划
- CJJ6-2009 城镇排水管道维护安全技术规程
- JT-T-1253-2019道路运输车辆卫星定位系统车辆终端检测方法
- QCT1177-2022汽车空调用冷凝器
- 六年级下健康教案设计
- 人美版新课标小学三年级美术(下册)
- 2024年04月国家药品监督管理局药品审评检查长三角分中心招考聘用笔试笔试历年典型考题及考点研判与答案解析
- 医院院外会诊申请单、医师外出会诊审核表、医师外出会诊回执
评论
0/150
提交评论