数据初步分析-2024年新九年级数学暑假提升讲义(沪科版)_第1页
数据初步分析-2024年新九年级数学暑假提升讲义(沪科版)_第2页
数据初步分析-2024年新九年级数学暑假提升讲义(沪科版)_第3页
数据初步分析-2024年新九年级数学暑假提升讲义(沪科版)_第4页
数据初步分析-2024年新九年级数学暑假提升讲义(沪科版)_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题07数据初步分析

题型1由样本所占百分比估计总体的

专题07数据初步分

知识点1:全面调查与抽样调查

1、统计调查的方法:全面调查(即普查)和抽样调查.

2、全面调查与抽样调查的优缺点:

①全面调查收集的到数据全面、准确,但一般花费多、耗时长,而且某些调查不宜用全面调查.

②抽样调查具有花费少、省时的特点,但抽取的样本是否具有代表性,直接关系到对总体估计的准确程度.

1

3、选择调查方法:一般来讲:通过普查可以直接得到较为全面、可靠的信息,但花费的时间较长,耗费大,

且一些调查项目并不适合普查.其一,调查者能力有限,不能进行普查.如:个体调查者无法对全国中小

学生身高情况进行普查.其二,调查过程带有破坏性.如:调查一批灯泡的使用寿命就只能采取抽样调查,

而不能将整批灯泡全部用于实验.其三,有些被调查的对象无法进行普查.如:某一天,全国人均讲话的

次数,便无法进行普查.

知识点2:总体、个体、样本、样本容量

(1)定义

①总体:我们把所要考察的对象的全体叫做总体;

②个体:把组成总体的每一个考察对象叫做个体;

③样本:从总体中取出的一部分个体叫做这个总体的一个样本;

④样本容量:一个样本包括的个体数量叫做样本容量.

(2)关于样本容量

样本容量只是个数字,没有单位.

知识点3:用样本估计总体

用样本估计总体是统计的基本思想.

1.用样本的频率分布估计总体分布:

从一个总体得到一个包含大量数据的样本,我们很难从一个个数字中直接看出样本所包含的信息.这时,

我们用频率分布直方图来表示相应样本的频率分布,从而去估计总体的分布情况.

2.用样本的数字特征估计总体的数字特征

主要数据有众数、中位数、平均数、标准差与方差,一般来说,用样本去估计总体时,样本越具有代表性、

容量越大,这时对总体的估计也就越精确.

知识点4:频数与频率、频数(率)分布表

1.频数:是指每个对象出现的次数.

2.频率:是指每个对象出现的次数与总次数的比值(或者百分比).即频率=频数+总数

一般称落在不同小组中的数据个数为该组的频数,频数与数据总数的比值为频率.频率反映了各组频数的

大小在总数中所占的分量.

3.频数(率)分布表

(1)在统计数据时,经常把数据按照不同的范围分成几个组,分成的组的个数称为组数,每一组两个端点

的差称为组距,称这样画出的统计图表为频数分布表.

(2)列频率分布表的步骤:

第一步:计算极差,即计算最大值与最小值的差.

第二步:决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过

100时,按数据的多少,常分成5〜12组).

第三步:将数据分组.

2

第四步:列频率分布表.

知识点5:频数(率)分布直方图、频数(率)分布折线图、扇形统计图

1.频率分布直方图:

步骤:

(1)计算极差,即计算最大值与最小值的差.

(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100

时,按数据的多少,常分成5〜12组).

(3)确定分点,将数据分组.

(4)列频率分布表.

(5)绘制频率分布直方图.

注:①频率分布表列出的是在各个不同区间内取值的频率,频率分布直方图是用小长方形面积的大小

来表示在各个区间内取值的频率.直角坐标系中的纵轴表示频率与组距的比值,即小长方形面积=组距X

粤萋=频率.②各组频率的和等于1,即所有长方形面积的和等于1.③频率分布表在数量表示上比较确

组距

切,但不够直观、形象,不利于分析数据分布的总体态势.④从频率分布直方图可以清楚地看出数据分布

的总体态势,但是从直方图本身得不出原始的数据内容.

2.频数(率)分布折线图

一般利用直方图画频数分布折线图,在频数分布直方图中,把每个小长方形上面的一条边的中点顺次连接

起来,得到频数折线图.

注意:折线图要与横轴相交,方法是在直方图的左右两边各延伸一个假想组,并将频数折线两端连接到假

想组中点,它主要显示数据的变化趋势.

3.扇形统计图

(1)扇形统计图是用整个圆表示总数用圆内各个扇形的大小表示各部分数量占总数的百分数.通过扇形统

计图可以很清楚地表示出各部分数量同总数之间的关系.用整个圆的面积表示总数(单位1),用圆的扇形

面积表示各部分占总数的百分数.

(2)扇形图的特点:从扇形图上可以清楚地看出各部分数量和总数量之间的关系.

(3)制作扇形图的步骤

①根据有关数据先算出各部分在总体中所占的百分数,再算出各部分圆心角的度数,公式是各部分扇形圆

心角的度数=部分占总体的百分比X360。.—②按比例取适当半径画一个圆;按扇形圆心角的度数用量

角器在圆内量出各个扇形的圆心角的度数;

④在各扇形内写上相应的名称及百分数,并用不同的标记把各扇形区分开来.

知识点6:数据的集中趋势与离散程度

1.算术平均数

(1)平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.

3

(2)算术平均数:对于〃个数XI,X2,…,Xn,则X=2(X1+X2+…+%)就叫做这〃个数的算术平均数.

n

(3)算术平均数是加权平均数的一种特殊情况,加权平均数包含算术平均数,当加权平均数中的权相等时,

就是算术平均数.

2.加权平均数

(1)加权平均数:若“个数XI,XI,X3,…,Xn的权分别是Wl,W2,W3,Wn,则'"+"叫'…+"吗

将+叫+明+...+%

叫做这〃个数的加权平均数.

(2)权的表现形式,一种是比的形式,如4:3:2,另一种是百分比的形式,如创新占50%,综合知识占

30%,语言占20%,权的大小直接影响结果.

(3)数据的权能够反映数据的相对“重要程度”,要突出某个数据,只需要给它较大的“权”,权的差异

对结果会产生直接的影响.

(4)对于一组不同权重的数据,加权平均数更能反映数据的真实信息.

3.中位数

C1)中位数:

将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是

这组数据的中位数.

如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.

(2)中位数代表了这组数据值大小的“中点”,不易受极端值影响,但不能充分利用所有数据的信息.

(3)中位数仅与数据的排列位置有关,某些数据的移动对中位数没有影响,中位数可能出现在所给数据中

也可能不在所给的数据中出现,当一组数据中的个别数据变动较大时,可用中位数描述其趋势.

4.众数

(1)一组数据中出现次数最多的数据叫做众数.

(2)求一组数据的众数的方法:找出频数最多的那个数据,若几个数据频数都是最多且相同,此时众数就

是这多个数据.

(3)众数不易受数据中极端值的影响.众数也是数据的一种代表数,反映了一组数据的集中程度,众数可

作为描述一组数据集中趋势的量•.

5.极差

(1)极差是指一组数据中最大数据与最小数据的差.

极差=最大值-最小值.

(2)极差是刻画数据离散程度的一个统计量.它只能反映数据的波动范围,不能衡量每个数据的变化情况.

(3)极差的优势在于计算简单,但它受极端值的影响较大.

6.方差

(1)方差:一组数据中各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差.

4

(2)用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结

果叫方差,通常用$2来表示,计算公式是:

r=l[(xi-x)2+(x2-x)2+-+x)2](可简单记忆为“方差等于差方的平均数”)

(3)方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越大,稳定性也越小;反

之,则它与其平均值的离散程度越小,稳定性越好.

7.标准差

(1)标准差:样本方差的算术平方根表示样本的标准差,它也描述了数据对平均数的离散程度.

公式:s=s2=ln[(尤1-尤)2+(x2-x)2+…+ixn-x)2]

(2)标准差是反应一组数据离散程度最常用的一种量化形式,是表示精密确的最要指标.标准差越大,则

平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.

匡康恒晅|

,题型归纳

【题型1由样本所占百分比估计总体的数量】

满分技法

在扇形统计图中,每部分占总部分的百分比等于该部分所对应的扇形圆心角的度数与的比.

1.(22-23八年级下•安徽合肥・期末)如图,为了了解某校学生的课外阅读情况,小明同学在全校随机抽取

40名学生进行调查,并将统计数据汇总,整理绘制成学生每周课外阅读时间频数分布直方图,(每组含前

一个边界值,不含后一个边界值)如图所示,若该校有学生2338人,估计阅读时长不低于6小时的人数约

有()人.

频数▲

25

20

15

10

Ui---------------------------------------------

246810时间(小时)

A.351B.818C.1052D.1520

2.(2024八年级下•安徽・专题练习)学校开展“阳光体育”活动,学生会为了解学生最喜欢哪一种球类运动

项目,从A:足球、B:乒乓球、C:篮球、D:羽毛球等四个方面,随机抽取了一部分学生进行调查,

5

并将调查结果绘制成如下两个不完整的统计图,如图1,图2(要求每位同学只能选择一种喜欢的球类),

请你根据图中提供的信息解答下列问题:

(1)在这次调查中,一共调查了一名学生?

(2)在图1扇形统计图中,求出“D”部分所对应的圆心角等于一度?

(3)补全频数分布折线统计图.

3.(22-23八年级下•安徽合肥・期末)星空浩瀚无垠,探索永无止尽,某校在第八个中国航天日期间,举

办了名为“星空遐想”的太空绘画展,并根据分数x给画展上的作品评定等级,评定结果有

4954x<100),5(90<x<95),C(85<x<90),0(85分以下)四种,现从中随机抽取部分作品,对其结果进行整

理,制成如图所示两幅不完整的统计图,

画展评定结果频数分布直方图画展评定结果扇形统计图

请根据以上信息,完成下列问题:

(1)本次共抽取了幅作品,扇形统计图中结果。所对应的扇形的圆心角为,

(2)请补全频数分布直方图;

6

(3)已知该校共有2400名学生参加了本次画展,请估计评定结果为A的绘画作品大约有多少幅.

4.(22-23八年级下•安徽安庆・期末)2023年4月15日是全民国家安全教育日,某校为加强学生的安全意

识,组织了全校学生参加安全知识竞赛,从中抽取了部分学生成绩(得分取正整数,满分为100分)进行统

⑵分别求出B组,E组的频数

(3)该校共有2200名学生,若成绩在70.5分以下的学生安全意识不强,有待进一步加强安全教育,则该校安

全意识不强的学生约有多少人?

【题型2根据数据描述求频数】

满分技法

(1)概念我们把一批数据中落在某个小组内数据的个数称为这个组的频数.例如,一次数学测验中,有

20人获得优秀等次,那么优秀等次的频数就是20.

(2)公式:频数=频率X数据总数

5.(22-23八年级下•安徽阜阳•期末)在一篇文章中,“的”“地”“得”三个字共出现100次,己知“的”与“地”

的频率之和是0.7,那么“得”字出现的频数是().

A.28B.30C.32D.34

6.(22-23八年级下•安徽安庆・期末)一个样本含有20个数据:68,69,70,66,68,64,65,65,69,

62,67,66,65,67,63,65,64,61,65,66,在列频数分布表时,64.5〜66.5这组的频数为()

A.5B.6C.7D.8

7.(22-23八年级下•安徽马鞍山•期末)将50个数据分成4组,第1组的频数是12,第2、3组的频率之和

7

为0.6,则第4组的频数为.

8.(22-23八年级下•安徽淮南•期末)小华调查了某地1月份上旬的最低气温(单位:℃),分别是

-2,0,3,-1,1,0,4,-3,-2,0,其中0C以下(不含0℃)出现的频数是.

【题型3求一组数据的平均数】

满分技法

⑴平均数的单位与原数据的单位一致,

⑵平均数的大小与一组数据里的每个数据都有关,因此,为排除极端值对平均数的影响,通常先去掉

一个最大数和一个最小数,再计算平均数.

9.(22-23八年级下•安徽蚌埠•期末)近年来,电动汽车快速发展,某汽车制造商设计生产一款新型纯电动

汽车,现测试该款电动汽车低速工况和高速工况的能耗情况,为了更接近真实的日常用车环境,低速工况

的平均时速在30km/h左右,包括城市一般道路等路况;高速工况的平均时速保持在90km/h左右,路况主要

是高速公路,设低速工况时能耗的平均数为方差为S;,高速工况时能耗的平均数为兀,方差为青,根

据统计图中的数据,可得出正确结论是(

低速工况能耗测试高速工况能耗测试

能耗(KWh/lOOkm)能耗(KWh/lOOkm)

20------L&9----------------IN------------------------------------20一…电3—二I%-—理6-4%乏一域6

i88f卫一18,118.618.918.718.6

17116.616.4

1010

01--------------------------------------------------------------►01----------------------------------------------------------------►

20406080100120140160180200路程(km)20406080100120140160180200路程(km)

A.玉<%2,S;>S;B.玉<,S;<Sf

C.x1>x2,S;>S;D.%j>x2,S;<S;

10.(2024八年级下•安徽・专题练习)某农民几年前承包了甲、乙两片荒山,各栽了100棵蜜橘,成活98%,

现已挂果,经济效益初步显现,为了分析收成情况,他从甲山随意采摘了3棵树上的蜜橘,称得质量(单

位:kg)分别为25,18,20;他从乙山采摘了4棵树上的蜜橘,称得质量(单位:kg)分别是21,24,

19,20.组成一个样本,那么:

(1)样本容量是多少?

(2)样本平均数是多少?并估算出甲乙两山蜜橘的总产量?

(3)甲乙两山哪座山上蜜橘挂果更均匀?为什么?

11.(22-23八年级下•安徽马鞍山•期末)某校八年级学生参加每分钟跳绳的测试,并随机抽取部分学生的

8

成绩制成了频数分布直方图(如图),若取每组的组中值作为本小组的均值,则抽取的部分学生每分钟跳

绳次数的平均值(结果取整数)为()

八年级部分学生每分钟跳绳次数

的频数分布直方图

A.87次B.110次C.112次D.120次

12.(22-23八年级下•安徽•期末)为了选拔一名学生参加新站区演讲比赛,对两名备赛选手进行了校内选

拔,10名评委打分如下(单位:分)

甲:50,60,60,60,60,60,70,90,90,100

乙:50,60,60,60,70,70,70,70,90,100.

选手平均数中位数众数方差

甲ab60260

乙7070C200

⑴成绩统计分析表中a=,b=,c=;

⑵的成绩更稳定(填“甲”或"乙”);

(3)根据以上信息,你认为应该选哪位同学参加比赛,请说出你的理由.

【题型4已知平均数求未知数据的值】

9

满分技法

若一组数据中有未知数据,往往要根据题目信息先求出未知的数据,平均数中得未知数可以先用平均

数X总个数得到总数量,再减去已知数据,即可求出未知数.

13.(20-21八年级下•安徽合肥・期末)一组数据:5,5,3,x,6,2的平均数为4,则这组数据的方差为

A.1B.2C.3D.4

14.(22-23八年级下•安徽六安・期末)有一组数据2,a,4,6,7,它们的平均数为5,下列说法不正确的

是()

A.a-6B.这组数据的众数是6

C.这组数据的中位数为4D.这组数据的方差为3.2

15.(22-23八年级下•安徽合肥・期末)已知一组数据0,2,x,3,5的平均数是尤-1,则这组数据的平均

数为.

16.(22-23八年级下•安徽铜陵•期末)两组数据:3,尤,2y,5与尤,6,V的平均数都是6,若将这两

组数据合并为一组新数据:3,x,2y,5,x,6,则这组新数据的众数为

【题型5求加权平均数】

满分技法

_X,W.+X71V2+...+XW

加权平均数:若n个数x1,x2,x3,•••,xn的权分别是w1,w2,w3,•••,wn,贝|=—=

wt+w2+w3+...+wn

叫做这n个数的加权平均数.

17.(22-23八年级下•安徽淮南•期末)每年的4月23日是“世界读书日”,某校为了解4月份八年级学生的

读书情况,随机调查了八年级50名学生读书的册数,由此估计该校八年级学生4月份人均读书一册.

册数01234

人数9320153

18.(22-23八年级下•安徽合肥・期末)在学校举行的“幸福长丰,美丽家园”演讲比赛中,评委分别从演讲

内容、演讲能力、演讲效果这三方面打分,小华这三项得分的成绩分别为88分,80分,85分,最后再按

照5:3:2的得分比例计算最终得分,则小华的最终得分是分.

19.(22-23八年级下•安徽芜湖•期末)某中学八年级某个同学一个学期的平时作业成绩为90分,期中考试

成绩为85分,期末考试成绩为88分,如果平时成绩:期中成绩:期末成绩=2:3:3,那么这个同学的总平

均分为分.

10

20.(22-23八年级下•安徽安庆・期末)某市招聘教师,采取的是“笔试+专业测试”的形式,笔试成绩和专业

测试成绩按6:4合成报考人员的综合成绩,最终录用则依据招聘计划按综合成绩从高到低确定.

教学设计课堂教学答辩

甲908590

乙809285

(注:每组含最小值,不含最大值)

0707580859095分数

(1)将笔试入围的报考人员的成绩绘制成如图所示的频数分布直方图,其中成绩80分以上(包括80分)的

人数占40%,则笔试入围的共有多少人?补全频数分布直方图;

(2)专业测试包括教学设计、课堂教学、答辩三项测试,已知甲、乙两人的笔试成绩分别为80分,82分,在

笔试入围后,参加了专业测试,两人的成绩如表格所示:(单位:分)根据招聘公告规定,专业测试成绩

按教学设计占30%、课堂教学占50%、答辩占20%来计算,若按综合成绩在甲、乙两人中录用一人,谁将

被录用?

【题型6利用中位数求未知数据的值】

满分技法

一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从小到大(或从大到小)的顺

序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数

是偶数,则中间两个数据的平均数就是这组数据的中位数.可以利用一组数据个数的奇偶性和中位数

来退出未知数的值.

21.(22-23八年级下•安徽芜湖・期末)五名学生投篮训练,规定每人投10次,记录他们每人投中的次数,

11

得到五个数据,经分析这五个数据的中位数为6,唯一众数是7,则他们投中次数占投篮总次数的百分率可

能是()

A.40%B.56%C.60%D.62%

22.(22-23八年级下•安徽合肥・期末)五名同学进行投篮练习,规定每人投20次,统计他们每人投中的次

数,得到5个数据,若这5个数据的中位数是6,唯一众数是7.设另外两个数据分别是b,则的值

不可能是()

A.1B.5C.9D.10

23.(22-23八年级下•安徽合肥•期末)一组数据从小到大的顺序排列:1,2,3,x,4,5,若这组数据

的中位数为3,求这组数据的方差.

【题型7求方差】

满分技法

求方差的步骤:

第1步:求出数据的平均数.

第2步:套用方差公式进行计算.或者简记为先平均,再求差,然后平方,最后再平均:

24.(22-23八年级下•安徽安庆・期末)2023年6月是第22个全国“安全生产月”,主题是“人人讲安全,个

个会应急”,为加强安全宣传教育,某校在全体学生中进行了一次安全知识竞赛,随机抽取了10名学生的

竞赛成绩如下(单位:分):

得分80849296100

人数12232

根据表格中的信息判断,下列关于这10名学生竞赛成绩的结论中专肯误的是()

A.平均数为92B.众数为96C.中位数为92D.方差为44.8

25.(22-23八年级下•安徽亳州•阶段练习)对于一组统计数据3,3,6,5,3.下列说法错误的是()

A.众数是3B.平均数是4C.方差是1.6D.中位数是16

26.(22-23八年级下•安徽芜湖・期末)为迎接省运会,芜湖市射击队要从甲、乙两名射击运动员中选拔一

人参加比赛.两名射击运动员近五次选拔测试成绩条形统计图如图所示(单位:环)

12

甲、乙五次选拔测试赛成绩统计图

甲、乙五次选拔测试赛成绩统计表

年级平均数众数方差

甲a8C

乙8b0.4

(1)已知甲成绩的众数是8环,乙成绩的平均数是8环,贝壮=,b=

(2)请补全条形统计图;

(3)现要从甲、乙两人中选拔一个成绩较为稳定的运动员参加比赛,应选谁?请说明理由.

27.(22-23八年级下•安徽芜湖•期末)某市举行知识大赛,A校、8校各派出5名选手组成代表队参加决

赛,两校派出选手的决赛成绩如图所示.

平均数中位数众数

A校选手成绩a85b

8校选手成绩8580C

13

⑴a=,b—

(2)结合两校成绩的平均数和中位数,分析哪个学校的决赛成绩较好;

(3)计算两校决赛成绩的方差,并判断哪个学校代表队选手成绩较为稳定.

【题型8根据方差判断稳定性】

满分技法

方差是反映一组数据离散程度的统计量.方差越大,这组数据的离散程度越大,越不稳定;方差越小,

这组数据的离散程度越小,越稳定.

28.(22-23八年级下•安徽淮南•期末)在甲、乙两位射击运动员的10次考核成绩中,两人的考核成绩的平

均数相同,方差分别为魇=1,^=0.85,则考核成绩更为稳定的运动员是—.(填“甲”或“乙”)

29.(22-23八年级下•安徽合肥・期末)某学校为了解学生的身高情况,各年级分别抽样调查了部分同学的

身高,并分年级对所得数据进行处理.下面的频数分布直方图(部分)和扇形统计图是根据七年级的调查

数据制作而成.(每组含最低值不含最高值,身高单位:cm,测量时精确到1cm):

14

年级七八九

x/cm157160169

520.80.60.9

(1)请根据以上信息,完成下列问题:

①七年级身高在160cm~165cm范围内的学生有人;并补全频数分布直方图.

②七年级样本的中位数所在范围是.

③由以上表格可知,年级的学生身高比较整齐,理由是.

(2)已知七年级共有1000名学生,若身高低于150cm,则认定该学生身高偏矮.请估计该校七年级身高偏矮

的共有多少人?

30.(22-23八年级下•安徽马鞍山•期末)某商场销售A、8两种型号的扫地机器人,为了解它们的扫地质

量,销售人员从某月销售出去的A、5型扫地机器人中各随机抽取10台进行跟踪调查其除尘量,得到的数

据如下:

A型扫地机器人的除尘量:95,89,84,88,89,95,83,95,84,98.

6型扫地机器人的除尘量:86,80,94,90,96,86,94,96,92,86.

(1)请根据上述数据填写下表:

型号平均数中位数众数

A

B

(2)请根据(1)的结果,选取一个统计量对两种型号的扫地机器人除尘效果进行评价;

15

(3)请通过计算说明哪种扫地机器人的除尘效果更稳定.

,过关检测

一、单选题

31.(22-23八年级下•安徽•期末)教师招聘考试,7位考生进入复试,他们的得分互不相同,最终录取3

位,某考生知道自己的分数后,要判断自己是否被录取,他应该关注的统计量是()

A.平均数B.众数C.中位数D.方差

32.(22-23八年级下•安徽芜湖•期末)八(1)班组织了一次经典诵读比赛,甲、乙两队各10人的比赛成

绩如下表:

甲789710109101010

乙10879810109109

(1)甲队成绩的中位数是分,乙队成绩的众数是分;

(2)已知甲队成绩的方差是1.4,乙队成绩的方差是1,则成绩较为整齐的是—队.

33.(22-23八年级下•安徽六安•期末)一组数最大值和最小值相差35,若组距为4,则应分()

A.10组B.9组C.8组D.7组

34.(22-23八年级下•安徽淮北•期末)若一组数据2,3,x,5,7的众数为3,则这组数据的中位数和平均

数分别为()

A.2、5B.5、4C.3、4D.7、5

35.(2024八年级下•安徽•专题练习)国家规定“中小学生每天在校体育活动时间不低于1小时”.为此,我

市就“你每天在校体育活动时间是多少”的问题随机调查了某区300名初中学生.根据调查结果绘制成的统计

图(部分)如图所示,其中分组情况是:A组:t<0.5h;8组:0.5hVr<lh;C组:lh<f<1.5h;。组:

r3L5h.根据上述信息,你认为本次调查数据的中位数落在()

16

C.。组D.A组

二、填空题

36.(2024八年级下.安徽.专题练习)一个容量为70的样本,最大值是137,最小值是50,取组距为10,

可以分成一组.

37.(2024八年级下.安徽•专题练习)已知数据4,*2,尤3的平均数是5,则数据3%+2,3%+2,3^+2

的平均数是—.

38.(22-23八年级下•安徽合肥・期末)为庆祝神舟十六号载人飞船发射成功,学校开展航天知识竞赛活动.经

过几轮筛选,八(2)班决定从甲、乙、丙、丁四名同学中选择一名同学代表班级参加比赛,经过统计,四

名同学成绩的平均数(单位:分)及方差(单位:分2)如表所示:

甲乙丙T

平均数98969698

方差0.20.31.21.8

如果要选一名成绩好且状态稳定的同学参赛,那么应该选择()

A.甲B.乙C.丙D.丁

39.(22-23八年级下•安徽安庆・期末)一组数据毛,々,…,孙)的方差是

Y=击[(否-2)2+(无2-2『+…+(/—],则该组数据的和为

三、解答题

40.(22-23八年级下•安徽六安•期末)数学小组为了了解我校同学对食堂就餐的评价,抽取部分同学参加

问卷评价调查,整理并制作出如下的统计表和统计图,如图所示,请根据图表信息解答下列问题:

组别评价得分频数频率

17

A组60<x<70300.1

8组70<x<8090n

C组80<x<90m0.4

。组90<x<100600.2

期故(人)

•八

120-

(1)本次问卷评价调查共抽取名同学参加;

(2)补全频数分布直方图;

(3)若全校共1200人,试估计评价得分不低于80分的人数.

41.(22-23八年级下•安徽合肥・期末)为了解某校八年级学生立定跳远水平,随机抽取该年级50名学生进

行测试,并把测试成绩(单位:m)绘制成不完整的频数分布表和频数分布直方图.

分组频数

1.2<x<1.68

1.6<x<2.012

2.0<x<2.4

2.4<x<2.810

18

学生立定跳远测试成绩的频数分布直方图

--------►

成绩(m)

请根据图表中所提供的信息,完成下列问题:

(1)请把频数分布直方图补充完整;

(2)跳远成绩大于等于2.0m为优秀,若该校八年级共有1300名学生,估计该年级学生立定跳远成绩优秀的学

生有多少人?

42.(22-23八年级下•安徽铜陵・期末)某校组织学生参加“防疫卫生知识竞赛”(满分为100分),竞赛结束

后,随机抽取甲、乙两班各40名学生的成绩,并对数据(成绩)进行了整理、描述和分析•下面给出部分信

19

乙班73.77485

根据以上信息,回答下列问题:

(1)。的值为;

(2)此次竞赛中,晓璐的成绩是73分,在他所属班级排在前20名,由表中数据可知晓璐是①班的

学生(填“甲”或“乙”),理由:②.

20

专题07数据初步分析

lUlhiJE

题型1由样本所占百分比估计总体的

专题07数据初步分

知识点1:全面调查与抽样调查

1、统计调查的方法:全面调查(即普查)和抽样调查.

2、全面调查与抽样调查的优缺点:

①全面调查收集的到数据全面、准确,但一般花费多、耗时长,而且某些调查不宜用全面调查.

②抽样调查具有花费少、省时的特点,但抽取的样本是否具有代表性,直接关系到对总体估计的准确程度.

21

3、选择调查方法:一般来讲:通过普查可以直接得到较为全面、可靠的信息,但花费的时间较长,耗费大,

且一些调查项目并不适合普查.其一,调查者能力有限,不能进行普查.如:个体调查者无法对全国中小

学生身高情况进行普查.其二,调查过程带有破坏性.如:调查一批灯泡的使用寿命就只能采取抽样调查,

而不能将整批灯泡全部用于实验.其三,有些被调查的对象无法进行普查.如:某一天,全国人均讲话的

次数,便无法进行普查.

知识点2:总体、个体、样本、样本容量

(1)定义

①总体:我们把所要考察的对象的全体叫做总体;

②个体:把组成总体的每一个考察对象叫做个体;

③样本:从总体中取出的一部分个体叫做这个总体的一个样本;

④样本容量:一个样本包括的个体数量叫做样本容量.

(2)关于样本容量

样本容量只是个数字,没有单位.

知识点3:用样本估计总体

用样本估计总体是统计的基本思想.

1.用样本的频率分布估计总体分布:

从一个总体得到一个包含大量数据的样本,我们很难从一个个数字中直接看出样本所包含的信息.这时,

我们用频率分布直方图来表示相应样本的频率分布,从而去估计总体的分布情况.

2.用样本的数字特征估计总体的数字特征

主要数据有众数、中位数、平均数、标准差与方差,一般来说,用样本去估计总体时,样本越具有代表性、

容量越大,这时对总体的估计也就越精确.

知识点4:频数与频率、频数(率)分布表

1.频数:是指每个对象出现的次数.

2.频率:是指每个对象出现的次数与总次数的比值(或者百分比).即频率=频数+总数

一般称落在不同小组中的数据个数为该组的频数,频数与数据总数的比值为频率.频率反映了各组频数的

大小在总数中所占的分量.

4.频数(率)分布表

(1)在统计数据时,经常把数据按照不同的范围分成几个组,分成的组的个数称为组数,每一组两个端点

的差称为组距,称这样画出的统计图表为频数分布表.

(2)列频率分布表的步骤:

第一步:计算极差,即计算最大值与最小值的差.

第二步:决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过

100时,按数据的多少,常分成5〜12组).

第三步:将数据分组.

22

第四步:列频率分布表.

知识点5:频数(率)分布直方图、频数(率)分布折线图、扇形统计图

1.频率分布直方图:

步骤:

(1)计算极差,即计算最大值与最小值的差.

(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100

时,按数据的多少,常分成5〜12组).

(3)确定分点,将数据分组.

(4)列频率分布表.

(5)绘制频率分布直方图.

注:①频率分布表列出的是在各个不同区间内取值的频率,频率分布直方图是用小长方形面积的大小

来表示在各个区间内取值的频率.直角坐标系中的纵轴表示频率与组距的比值,即小长方形面积=组距X

罂丁=频率.②各组频率的和等于1,即所有长方形面积的和等于1.③频率分布表在数量表示上比较确

组距

切,但不够直观、形象,不利于分析数据分布的总体态势.④从频率分布直方图可以清楚地看出数据分布

的总体态势,但是从直方图本身得不出原始的数据内容.

2.频数(率)分布折线图

一般利用直方图画频数分布折线图,在频数分布直方图中,把每个小长方形上面的一条边的中点顺次连接

起来,得到频数折线图.

注意:折线图要与横轴相交,方法是在直方图的左右两边各延伸一个假想组,并将频数折线两端连接到假

想组中点,它主要显示数据的变化趋势.

3.扇形统计图

(1)扇形统计图是用整个圆表示总数用圆内各个扇形的大小表示各部分数量占总数的百分数.通过扇形统

计图可以很清楚地表示出各部分数量同总数之间的关系.用整个圆的面积表示总数(单位1),用圆的扇形

面积表示各部分占总数的百分数.

(2)扇形图的特点:从扇形图上可以清楚地看出各部分数量和总数量之间的关系.

(3)制作扇形图的步骤

①根据有关数据先算出各部分在总体中所占的百分数,再算出各部分圆心角的度数,公式是各部分扇形圆

心角的度数=部分占总体的百分比X360。.—②按比例取适当半径画一个圆;按扇形圆心角的度数用量

角器在圆内量出各个扇形的圆心角的度数;

④在各扇形内写上相应的名称及百分数,并用不同的标记把各扇形区分开来.

知识点6:数据的集中趋势与离散程度

1.算术平均数

(1)平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.

23

(2)算术平均数:对于〃个数XI,X2,…,Xn,则7(X1+X2+…+初)就叫做这〃个数的算术平均数.

n

(3)算术平均数是加权平均数的一种特殊情况,加权平均数包含算术平均数,当加权平均数中的权相等时,

就是算术平均数.

2.加权平均数

(1)加权平均数:若〃个数XI,XI,尤3,…,X"的权分别是Wl,W2,W3,…,Wn,则W+*2H^+…+.明

叱+叫+吗+...+叱

叫做这n个数的加权平均数.

(2)权的表现形式,一种是比的形式,如4:3:2,另一种是百分比的形式,如创新占50%,综合知识占

30%,语言占20%,权的大小直接影响结果.

(3)数据的权能够反映数据的相对“重要程度”,要突出某个数据,只需要给它较大的“权”,权的差异

对结果会产生直接的影响.

(4)对于一组不同权重的数据,加权平均数更能反映数据的真实信息.

3.中位数

(1)中位数:

将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是

这组数据的中位数.

如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.

(2)中位数代表了这组数据值大小的“中点”,不易受极端值影响,但不能充分利用所有数据的信息.

(3)中位数仅与数据的排列位置有关,某些数据的移动对中位数没有影响,中位数可能出现在所给数据中

也可能不在所给的数据中出现,当一组数据中的个别数据变动较大时,可用中位数描述其趋势.

4.众数

(1)一组数据中出现次数最多的数据叫做众数.

(2)求一组数据的众数的方法:找出频数最多的那个数据,若几个数据频数都是最多且相同,此时众数就

是这多个数据.

(3)众数不易受数据中极端值的影响.众数也是数据的一种代表数,反映了一组数据的集中程度,众数可

作为描述一组数据集中趋势的量..

5.极差

(1)极差是指一组数据中最大数据与最小数据的差.

极差=最大值-最小值.

(2)极差是刻画数据离散程度的一个统计量.它只能反映数据的波动范围,不能衡量每个数据的变化情况.

(3)极差的优势在于计算简单,但它受极端值的影响较大.

6.方差

(1)方差:一组数据中各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差.

24

(2)用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结

果叫方差,通常用$2来表示,计算公式是:

222

?=(X1-x)+(X2-X)+-+(X«-X)](可简单记忆为“方差等于差方的平均数”)

n

(3)方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越大,稳定性也越小;反

之,则它与其平均值的离散程度越小,稳定性越好.

7.标准差

(1)标准差:样本方差的算术平方根表示样本的标准差,它也描述了数据对平均数的离散程度.

公式:s—sl—\n[(尤1-尤)2+(x2-x)2+…+(xn-x)2]

(2)标准差是反应一组数据离散程度最常用的一种量化形式,是表示精密确的最要指标.标准差越大,则

平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.

,题型归纳

【题型1由样本所占百分比估计总体的数量】

满分技法

在扇形统计图中,每部分占总部分的百分比等于该部分所对应的扇形圆心角的度数与的比.

1.(22-23八年级下•安徽合肥・期末)如图,为了了解某校学生的课外阅读情况,小明同学在全校随机抽取

40名学生进行调查,并将统计数据汇总,整理绘制成学生每周课外阅读时间频数分布直方图,(每组含前

一个边界值,不含后一个边界值)如图所示,若该校有学生2338人,估计阅读时长不低于6小时的人数约

有()人.

D.1520

【答案】B

【分析】用2338乘样本中阅读时长不低于6小时的所占比例即可.

25

【详解】解::2338*八士+?<=818.3,

9+17+8+6

估计阅读时长不低于6小时的人数约有818人,

故选:B.

【点睛】本题考查频数分布直方图,用样本估计总体,解题的关键是明确题意,利用数形结合的思想解答.

2.(2024八年级下•安徽・专题练习)学校开展“阳光体育”活动,学生会为了解学生最喜欢哪一种球类运动

项目,从A:足球、B-.乒乓球、C:篮球、D-.羽毛球等四个方面,随机抽取了一部分学生进行调查,

并将调查结果绘制成如下两个不完整的统计图,如图1,图2(要求每位同学只能选择一种喜欢的球类),

请你根据图中提供的信息解答下列问题:

(1)在这次调查中,一共调查了一名学生?

(2)在图1扇形统计图中,求出“£>”部分所对应的圆心角等于一度?

(3)补全频数分布折线统计图.

【答案】⑴100

⑵36

(3)见解析

【分析】本题考查扇形统计图及相关计算.在扇形统计图中,每部分占总部分的百分比等于该部分所对应

的扇形圆心角的度数与360。的比.

(1)根据A组有30人,对应的百分比是30%,据此即可求得总人数;

(2)利用总人数减去其它组的人数即可求得。组的人数,然后利用360。乘以对应的比例即可求得。组对应

的扇形的圆心角度数;

(3)把各组的人数在图2中表示出来,然后依次连接即可.

【详解】(1)调查的总人数是30+30%=100(名),

故答案为:100;

(2)部分的人数是100-30-20-40=10(人),

则所对应的圆心角等于360°x常=36。.

故答案为:36;

(3)如图,

26

3.(22-23八年级下•安徽合肥・期末)星空浩瀚无垠,探索永无止尽,某校在第八个中国航天日期间,举

办了名为“星空遐想”的太空绘画展,并根据分数x给画展上的作品评定等级,评定结果有

A(95<%<100),5(90<%<95),C(85<x<90),0(85分以下)四种,现从中随机抽取部分作品,对其结果进行整

理,制成如图所示两幅不完整的统计图,

画展评定结果频数分布直方图画展评定结果房形统计图

(1)本次共抽取了幅作品,扇形统计图中结果。所对应的扇形的圆心角为'

(2)请补全频数分布直方图;

(3)已知该校共有2400名学生参加了本次画展,请估计评定结果为A的绘画作品大约有多少幅.

【答案】⑴40,36°

(2)见解析

(3)720

【分析】(1)根据B(90Wx<95)组数据求总数,再根据D所占的百分比即可求出D所对应的扇形的圆心

角;

(2)求出C的人数即可补全频数分布直方图;

(3)根据A所占的百分比计算即可.

【详解】(1)本次共抽取作品总数:16+40%=40(幅),

4

扇形统计图中结果D所对应的扇形的圆心角为二、100%*360。=36。,

40

故答案为:40,36°;

27

(2)C的数量为40—16—12—4=8(幅),

故补全的频数分布直方图为:

(3)估计评定结果为A的绘画作品大约£X100%X2400=720(幅).

40

【点睛】此题考查了是条形统计图和扇形统计图的综合运用、用样本估计总体,读懂统计图,从不同的统

计图中得到必要的信息是解决问题的关键.

4.(22-23八年级下•安徽安庆・期末)2023年4月15日是全民国家安全教育日,某校为加强学生的安全意

识,组织了全校学生参加安全知识竞赛,从中抽取了部分学生成绩(得分取正整数,满分为100分)进行统

计,绘制了如下两幅不完整的统计图.

⑵分别求出B组,E组的频数

(3)该校共有2200名学生,若成绩在70

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论