教育统计学课件-2 数据的初步整理_第1页
教育统计学课件-2 数据的初步整理_第2页
教育统计学课件-2 数据的初步整理_第3页
教育统计学课件-2 数据的初步整理_第4页
教育统计学课件-2 数据的初步整理_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、课前作业课前作业n期中考试成绩与花在学习上的时间的关系;n抽烟大学生与不抽烟大学生花在学习上的时间有差异吗?n身体锻炼对情绪有什么效应?n到快毕业了还没考过四级的学生有些什么特征?n喝咖啡的人与不喝咖啡的人在焦虑水平上有差异吗?n咖啡摄入对情绪有什么影响?n英文书阅读量与四级阅读理解成绩有什么关系?n男性和女性购买衣物时挑选时间有差异吗?exercises请说出自变量和因变量的差异和关系。请判断下列各问题分别应该由哪种研究来回答,描述性研究,相关研究,固定组比较研究还是实验研究?心理与教育统计学心理与教育统计学第一章数据的初步整理n本章要点:n1. 频数分布表的绘制;n2. 频数分布图的绘制;

2、n3. 散点图、线形图、条形图和圆形图;第一章数据的初步整理第一节第一节 频数分布表及相关概念频数分布表及相关概念n次数分布次数分布n一批数据中各个不同数值所出现的次数情况。或者是指一批数据在量尺上各等距区组内所出现的次数情况。 tables of frequency distribution2007年年1月份龙泉市医院出生的月份龙泉市医院出生的20名新生婴儿的体重如名新生婴儿的体重如下:(单位:下:(单位:kg)3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6 tables of f

3、requency distribution2007年年1月份龙泉市医院出生的月份龙泉市医院出生的20名新生婴儿的体名新生婴儿的体重如下:(单位:重如下:(单位:kg)3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.62.8 2.9 3.2 3.3 3.4 3.4 3.5 3.5 3.5 3.6 3.6 3.6 3.7 3.7 3.8 4.0 4.3 4.5 4.7 4.82.82.93.23.33.43.53.63.73.84.04.34.54.74.811112332111111n次数

4、分布表次数分布表n其实质是反映一批数据在各等距区组内的次数分布结构。编制次数分布表主要有下列一些步骤:n1. 求全距;n2. 定组数;n3. 定组距;n4. 写出组限;n5. 求组中值;n6. 归类划记;n7. 登记次数; tables of frequency distributionn1. 求全距求全距n全距(以符号R表示)是指一批数据中最大值(Max)与最小值(Min)之间的差距。nR=Max-MinnR=4.8-2.8=2n注:全距也叫两级差n或者极差。 tables of frequency distribution2007年年1月份龙泉市月份龙泉市医院出生的医院出生的20名新名新生

5、婴儿的体重如下:生婴儿的体重如下:(单位:(单位:kg)3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6n2. 定组数定组数n定组数(以符号K表示)就是要确定把整批数据划分为多少个等距的区组。n组数的大小要看数据的多少而定;一般说来,当一批数据的个数在200个以内时,可以取8-18组;100个数据以内分5-12组。鉴于此,我们把上例中的组数定位6 6。n如果数据来自于一个正态的总体,可以用下列公式来确定组数: tables of frequency distribution251.87

6、(1)KNn3. 定组距定组距n组距(以符号i表示)通过对全距R与组数K的比值取整来确定。n组距一般原则是取奇数或5的倍数。n对于本例而言R/K=2/6=0.33,故组距可取0.4:n注:本例中的数字均含一位小数点,所以组距既不能取整,当然也不是奇数或5的倍数。 tables of frequency distribution的整数部分的整数部分 1 1组距组距组数组数 全距全距n4. 写出组限写出组限n组限是每个组的起始点界限,也有人称之为边界值。 tables of frequency distribution20名新生婴儿的体重名新生婴儿的体重如下:如下:3.8 3.4 3.4 3.5

7、2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6组别(组别(kg)人数人数n4. 写出组限写出组限n组限(以符号i表示)是每个组的起始点界限,也有人称之为边界值。 tables of frequency distribution20名新生婴儿的体重名新生婴儿的体重如下:如下:3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6n4. 写出组限写出组限n组限(以符号i表示)是每个组的起始点界限,也有人称之为边界值。

8、 tables of frequency distribution n5. 求组中值求组中值n组中值是每个组的组中点在量尺上的数值,其计算公式为:组中值(组实上限组实下限)2 tables of frequency distribution n6. 归类划记归类划记n用唱票的方式把每个数据准确地划归到所属的组别。 tables of frequency distribution 20名新生婴儿的体重如名新生婴儿的体重如下:下:3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6n7. 登记

9、次数登记次数n根据划计的结果,点计各组的次数或频数(用符号f表示。)。 tables of frequency distribution 20名新生婴儿的体重如名新生婴儿的体重如下:下:3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6体重在标准体重范围(体重在标准体重范围(3.553.95kg)内的婴内的婴儿有多少个?儿有多少个?20276221n8. 相对次数分布表相对次数分布表n各组的次(频)数f与总次(频)数N之间的比值,符号为 。n则有: tables of frequency

10、 distribution fRffRN相对次数能反映各组数据的百分比结构。相对次数也叫频率频率。n9. 累计次数分布表累计次数分布表 tables of frequency distribution n10. 累计相对次数分布表和累计百分数分布表累计相对次数分布表和累计百分数分布表 tables of frequency distribution 课堂作业课堂作业1一组数据的最大值与最小值的差叫做_2将数据分组后,落在各小组内的数据个数称为_3一组数据的全距为40,最小值为57,则最大值为_4一个样本的样本容量是30,全距为15,分组时取组距为 3,为了使数据不落在边界上,可将数据分为_组,

11、 各组的次数总和为_,频率之和_5已知10个数据:1,2,2,3,3,3,4,4,4,4,其中 4出现的次数是_,相对次数为_6一组数据的最大值为100,最小值为45,若选取组距为 10,则这组数据可分成_组全距全距次数次数97630460.41exercisesexercises课前作业课前作业1.在频数分布表中,各小组的频数之和 ( )A. 小于数据总和 B. 等于数据总和C. 大于数据总和 D. 不能确定 2.为了绘制一组数据的频数分布表,首先要算出这组数据的变化范围,数据的变化范围是指数据的( ) A. 最大值 B. 最小值 C. 最大值与最小值的差 D. 数据的个数3.在一次抽样调查

12、中收集了一些数据,对数据进行分组,绘制了下面的频数分布表:(1)已知最后一组(89.599.5)出现的频率为15%,则这一次抽样调查的容量是_ 。(2)第三小组(69.579.5)的频数是_,频率是_;4.有若干个数据,最大值是124,最小值是103,用频数分布表描述这组数据时,若取组距为3,则应分为 ( )A6组 B7组 C8组 D9组5.已知一个样本: 27,23,25,27,29,31,27,30,32, 28,31,28,26,27,29,28,24,26, 27,30。那么频数为 8 的范围是 ( ) A. 24.5 26.5 B. 26.528.5 C. 28.530.5 D. 3

13、0.532.5 6.在1000个数据中,用适当的方法抽取50个作为样本进行统计,频率分布表中54.557.5这一组的频率是0. 12,那么估计总体数据落在54.557.5 之间的约有 () A.120个; B.60个; C.12个; D.6个;7.为了了解某中学初三年级250名学生升学考试的数学成绩,从中抽取50名学生的数学成绩进行了分析,求得下面是 50名学生数学成绩的统计表数据统计表中的数据a=_ ,b=_。估计该校初三年级这次升学考试数学平均成绩为_分(免做)表2.1 八年级某班全体学生英语学科期末考试成绩的频数分布表(1)(1)请完成该表,并说出该班请完成该表,并说出该班8080分以上

14、有多少学生?分以上有多少学生?(2)(2)数据分组时的组距为多少数据分组时的组距为多少? ?(3)(3)估计全距至多为多少?估计全距至多为多少?101059表2-1 某班全体学生英语期末成绩的频数分布表表号表号标目标目表注表注标目标目顶线顶线表线表线数字数字底线底线标题标题注:表中的数据来源于某教材中的例2统计表的结构和组成要素统计表的结构和组成要素第一章数据的初步整理第二节第二节 频数分布图的绘制频数分布图的绘制n次数分布图次数分布图n为了更直观、更形象地表达一个次数分布的结构形态及特征,我们可以进一步从次数分布表出发,绘制出相应的次数分布图。次数分布图有两种表达方式:n次数直方图n次数多边

15、图 graphs of frequency distributionn次数直方图次数直方图n由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。 graphs of frequency distribution某班一次数学测验成绩如下: 63,84,91,53,69,81,61,69,91,78,75,81,80,67,76,81,79,94,61,69,89,70,70,87,81,86,90,88,85,67,71,82,87,75,87,95,53,65,74,77 graphs of frequency distributionn1. 求全距求全距nR=Max-Min=95

16、-53=42某班一次数学测验成绩如下: 63,84,91,53,69,81,61,69,91,78,75,81,80,67,76,81,79,94,61,69,89,70,70,87,81,86,90,88,85,67,71,82,87,75,87,95,53,65,74,77 graphs of frequency distributionn2. 定组数和组距定组数和组距=+1全距组数的整数部分组距某班一次数学测验成绩如下: 63,84,91,53,69,81,61,69,91,78,75,81,80,67,76,81,79,94,61,69,89,70,70,87,81,86,90,88,

17、85,67,71,82,87,75,87,95,53,65,74,77 graphs of frequency distributionn3. 写出组限写出组限n第一组(最低分所在组)的下限应该是怎样设定?分数段频数累计频数52.562.562.572.572.582.582.592.592.5102.5合计53,53,61,61,63,65,67,67,69,69,69,70,70,71,74,75,75,76,77 ,78,79,80,81,81,81,81,82,84,85,86,87,87,87,88,89,90,91,91,94,954101311240分数段频数52.562.546

18、2.572.51072.582.51382.592.51192.5102.52合计40表2-1 某班一次数学测验成绩的频数分布表注: 本数据纯属虚构,如有雷同,定是巧合第一步:以细线条标出横轴和纵轴,使其垂直相交。美观的要求:53 ;按比例等间隔地标出刻度;第一步:以细线条标出横轴和纵轴,使其垂直相交。美观的要求:53 ;按比例等间隔地标出刻度;横轴代表测验分数量尺,纵轴代表各组次数的量尺测验分数次数第二步:画出直方条,直方条的宽度与组距i相应,其高度则由相应组别的次数f决定。测验分数次数优点:直观形象,凸显次数之间的相对大小及分布形态;缺点:各组确切的次数不明,因此往往在图上标出;第三步:在

19、直方图的横轴下方标上图的编号和图的题目,并检查图形结构的完整性。测验分数次数Y轴名称轴名称填充图案填充图案轮廓线轮廓线基线基线刻度标记刻度标记图号图号图题图题X轴名称轴名称图2-1某班一次数学测验成绩的频数分布图n次数多边图次数多边图n利用闭合的折线构成多边形以反映次数变化情况的一种图示方法。 graphs of frequency distribution第一步:横轴和纵轴的画法相同,只是要在横轴上最低组和最高组之外各增加一个次数为0的组。测验分数次数第二步:在两轴所在的直角坐标平面山,分别以每个组的组中值为横坐标,相应的次数为纵坐标,画出各个点。测验分数次数第三步:用线段把相邻的点连起来。

20、一批数据的个数不是很多时,所绘制的次数多边图常表现为不规则的多边形。从理论上讲,当一批数据的个数足够大,随着分组时组距的不断变小,绘制成的次数多边图会越来越光滑。若分为无数组时,就形成一条极光滑的曲线,这便是统计学上的次数分布曲线。测验分数次数为了解各年级段的观众对某电视剧的收视率,某校初三(1)班的一个兴趣小组,调查了部分观众的收视情况并分成A、B、C、D、E、F六组进行整理,其频率分布直方图如图:ADFBCE248181269.5 19.5 29.5 39.5 49.5 59.5 60.5请回答:1. E组的频数为( ),被调查的观众为( )人。2. 收视率50%以上的观众有( )人。pH

21、121086420各种矿泉水的各种矿泉水的pH频数分布直方图频数分布直方图频数(种)频数(种)5.96.3 6.7 7.1 7.5 7.9 8.3请观察右图,并回答下列问题:请观察右图,并回答下列问题: 被检查的矿泉水总数有多少种?被检查的矿泉水总数有多少种? 被查矿泉水被查矿泉水pH最低组的组中值是?最低组的组中值是? 组界为组界为6.97.3这一组的频数、频率这一组的频数、频率分别是多少?(每一组包括前一个边分别是多少?(每一组包括前一个边界值,不包括后一个边界值)界值,不包括后一个边界值) 根据我过根据我过2001年公布的生活饮用水卫生规范,饮用水的年公布的生活饮用水卫生规范,饮用水的p

22、H应在应在6.58.5的范围内,被检测的矿泉水不符合这一标准的范围内,被检测的矿泉水不符合这一标准的有多少种?占总数的百分之几?的有多少种?占总数的百分之几?146105632种种5.9频数为频数为10,频率为频率为0.31255种种,15.625%每年的6月6日是全国的爱眼日,让我们行动起来,爱护我们的眼睛!某校为了做好全校2000名学生的眼睛保健工作,对学生的视力情况进行一次抽样调查,如图,是利用所得数据绘制的频数分布直方图。请你根据此图提供的信息,回答下列问题:第1组第2组第3组第4组第5组视力视力605040302010(1)本次调查共抽测了)本次调查共抽测了-名学生;名学生;(2)视

23、力在)视力在4.9及及4.9以上的同学约以上的同学约占全校学生比例为占全校学生比例为-,(3)如果视力在)如果视力在4.87以下者均属视以下者均属视力不良,那么调查中共有力不良,那么调查中共有-名名学生视力不良。学生视力不良。16037.5%1004.14.75.04.45.3频数频数(名名)(4)这个图的结构完整吗?)这个图的结构完整吗? 2. 下面的频数分布直方图反映了某城市抽查一些家庭每月水电下面的频数分布直方图反映了某城市抽查一些家庭每月水电费的开支费的开支(单位单位:元元).请根据该直方图请根据该直方图,回答下列问题回答下列问题:(1)被调查家庭的样本容量是多少被调查家庭的样本容量是

24、多少?(2)数据分组的组距是多少数据分组的组距是多少?(3)频数最大一组的组中值是频数最大一组的组中值是多少多少?(4)自左至右第自左至右第3组的频数、频率组的频数、频率分别是多少分别是多少?(5)每月水电费开支为多少元之间每月水电费开支为多少元之间的家庭约占的家庭约占55%117123501006106124820150开支开支(元元)25013200300某城市部分家庭每月水电费开支某城市部分家庭每月水电费开支 的频数分布直方图的频数分布直方图频数频数(个个)4050元元150元元频数是频数是11频率是频率是0.275第一章数据的初步整理第三节第三节 其他统计图其他统计图n散点图(scat

25、ter diagram)n用平面直角坐标系上点的散布图形(密集程度和趋势)表示两种事物之间的相关关系。n横轴:自变量X,连续变量和离散变量;n纵轴:应变量Y,只能是连续变量;n纵轴与横轴的起点可根据资料的情况而定。n制作散点图应注意:n1. 在平面直角坐标系中,横轴上的点一般代表自变量,纵轴上的点一般代表因变量;横轴可作连续变量或离散变量的量尺,纵轴一般代表连续变量的量尺。n2. 点的描绘依二元观测数据而定,用细线划坐标轴,用稍粗的黑点描绘各坐标点。n3. 注意图形的调和比例和必要的图注说明。 图?-? x变量与y变量的散点图n线形图n线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统

26、计图。n线形图的特点:形象较为生动,从图上可以看出某事物或现象的变化趋势n适用于描述两种事物在时间序列上的变化趋势;n也适用于描述一事物随另一事物发展变化的趋势模式;n还适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系;n绘制要领:n横、纵坐标轴的画法及量尺设计与散点图相同;n根据数据资料在坐标轴上画出圆点,然后用稍粗的线段把相邻的点一次联接;n同一坐标轴上可以划几条线形图,以便于比较分析;图?-? 不同民族人民平均寿命折线图民族平均寿命n条形图n用宽度相同的长条来表示各个统计事项之间的数量关系。有两种形式:简单或复合条形图。n简单条形图 n是用同类的直方长条来比较若干统计事

27、项之间的数量关系的一种图示方法,它适用于统计事项仅按一种特征进行分析的情况。n绘制简单条形图需注意:n各直方长条的宽度相同,色调一致;n相邻长条之间的间隔要适当,一般而言其间距大约是直方长条宽度的0.5-1倍。n复合条形图 n是指用两类或三类不同色调的直方长条来表示多特征分类下的统计事项之间的数量关系的一种图示方法;n绘制条形图应注意:n各类直方长条的宽度要相同;n不同类型的直方长条应用不同类型的色调加以区别,并在图形右上方适当位置标明图例;n把要比较的统计事项(二重分类)的直方长条靠在一起,在横轴上标明的分类项目的直方长条之间要相互隔开,其间距一般取直方长条宽度的0.5-1倍。n圆形图n圆形

28、图是以单位圆内各扇形面积所占整个圆形面积的百分比来来表示各统计事项在总体中所占相应比例的一种图示方法。n适用于描述具有百分比结构的分类数据;n圆形图的主要制作步骤如下:n1. 以适当的半径作一圆代表事物总体;n2. 分别以统计事项在总体中的比例乘以圆周角求出各相应扇形的圆心角;n3. 根据计算结果将整个圆分成若干扇形部分,并在其中标上各自的百分比数值;n4. 用不同的色调对不同的扇形加以区分,并在图形的右边标上图例以便阅读;n5. 在图形的适当位置上,注明总体事物的数量,亦可把总体事物的数量体现在图题中;n6. 注意整个图形的对称与协调,在图形下边的适当位置标上图号和图题。圆图:用于表达事物内

29、部的百分构成比大小。各个扇形面积(3.6)的大小反映了各组成部分百分比(1)的大小。从12点钟处开始绘制,顺时针方向排列。 民民 族族人数人数 构成比()构成比()汉汉 族族69696969满满 族族12121212蒙古族蒙古族12121212白白 族族7 77 7总总 计计100100100 100 白族蒙古族满族汉族图?-? 不同民族人数构成比圆形图1.要清楚地表明一病人的体温变化情况,应选择的统计图是( ) A.扇形统计图 B.条形统计图 C.折线统计图 D.以上都不是 2.某音乐行出售三种音乐CD,即古典音乐、流行 音乐、民族音乐,为了表示这三种音乐唱片的 销售量的百分比,应该用 ( ) A.扇形统计图 B.折线统计图 C.条形统计图 D.以上都可以 3.某班有50人,其中三好

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论