13.3 统计与统计案例_第1页
13.3 统计与统计案例_第2页
13.3 统计与统计案例_第3页
13.3 统计与统计案例_第4页
13.3 统计与统计案例_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

/第三节统计与统计案例考纲解读1.理解随机抽样的必要性和重要性。2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。3.了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点。4.理解样本数据标准差的意义和作用,会计算数据标准差。5.能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。7.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。8.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。9.了解常见的统计方法,并能应用这些方法解决一些实际问题。(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。(2)回归分析了解回归分析的基本思想、方法及其简单应用。命题趋势探究1.本节内容是高考必考内容,以选择题、填空题为主。2.命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。(1)(2)有结合趋势,考题难度中下。3.统计案例为新课标教材新增内容,考查考生解决实际问题的能力。知识点精讲一、抽样方法三种抽样方式的对比,如表13-7所示。类型共同点各自特点相互关系使用范围简单随机抽样抽样过程都是不放回抽样,每个个体被抽到的机会均等,总体容量N,样本容量n,每个个体被抽到的概率从总体中随机逐个抽取总体容量较小系统抽样总体均分几段,每段T个,第一段取a1,第二段取a1+T,第三段取a1+2T,……第一段简单随机抽样总体中的个体个数较多分层抽样将总体分成n层,每层按比例抽取每层按简单随机抽样或系统抽样总体由差异明显的几部分组成二、样本分析(1)样本平均值:。(2)样本众数:样本数据中出现次数最多的那个数据。(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。(4)样本方差:。众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。三、频率分布直方图的解读(1)频率分布直方图的绘制①由频率分布表求出每组频数ni;②求出每组频率(n为样本容量);③列出样本频率分布表;④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。(2)样本估计总体步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。公式:,s2(aX+b)=a2s2(X)。四、线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为其中,,,(,)称为样本点的中心。步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,直线斜率k>0,称两个变量正相关;k<0,称两个变量负相关。五、独立性独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。步骤为列出22列联表(如表13-8所示),求出,并判断: 表13-8A1A2合计B1aca+cB2bdb+d合计a+bc+dn=a+b+c+d若K2>10.828,有99.9%把握称“A取A1或A2”对“B取B1,B2”有关系;若10.828K2>6.635,有99%把握称“A取A1或A2”对“B取B1,B2”有关系;若6.635K2>3.841,有95%把握称“A取A1或A2”对“B取B1,B2”有关系;若K23.841,没有把握称A与B相关。题型归纳及思路提示题型181抽样方式思路提示根据所抽取的对象与要求,若抽取的对象中有明显差异,考虑用分层抽样,否则选择简单随机抽样或系统抽样。当总体中的个体较少时,常采用简单随机抽样;当总体中的个体较多时,常采用系统抽样。例13.16(2012天津理9)某地区有小学150所,中学75所,大学25所。现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调査,应从小学中抽取所学校,中学中抽取所学校。解析:本地区共有学校150+75+25=250(所),所以从小学中应抽取(所),从中学中抽取(所)。变式1(2012山东理4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9。抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C。则抽到的人中,做问卷B的人数为()。A.7 B.9 C.10 D.15变式2某校共有学生2000名,各年级男、女生人数如表13-9所示,已知在全校学生中任取一名,抽到二年级女生的概率为0.19,现用分层抽样的方法,在全校抽取64名学生,则应在三年级抽取的学生人数为()。表13-9一年级二年级三年级女生373xy男生377370z变式3某企业三月中旬生产A,B,C三种产品其3000件,根据分层抽样的结果,企业统计员制作了统计表格,如表13-10所示,由于不小心,表格中的A,C产品的有的有关数据被污染看不清楚,统计员记得A产品样本容量比C产品的样本容量多10,由此可得C产品数量为_______。表13-10产品类型ABC产品数量(件)1300产品样本数量(件)130题型182样本分析——用样本估计总体思路提示对样本进行分析并用样本估计总体,包括用样本数字特征估计总体数字特征和用样本的频率分布估计总体的频率分布。在进行样本分析时,应从统计图表中获取数据。体现在以下几个方面:(1)在频率分布直方图中,长方形面积=组距eq\f(频率,组距)=频率,即随机变量的概率;(2)对于频数、频率、样本容量,已知其二必可求第三个;(3)随机变量在各组数据内的频数之和为样本容量。例13.17(2013广东理17)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图13-16所示,其中茎为十位数,叶为个位数。(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率。分析:阅读茎叶图得出样本数据,利用平均数公式计算出样本均值。(2)根据样本算出优秀工人的比例,再估计12人中优秀工人的个数。(3)用组合数公式求出所有可能的组合的个数和符合条件“恰有1名优秀工人”的组合的个数,利用古典概型概率公式进行计算。解析:(1)由茎叶图可知,样本数据为17,19,20,21,25,30,则样本均值,故样本均值为22。(2)日加工零件个数大于样本均值的工人有2名,故优秀工人的频率为,该车间12名工人中优秀工人大约有(名),故该车间约有4名优秀工人。(3)记“恰有1名优秀工人”为事件A,其包含的基本事件个数为CC=32,所有基本事件的总数为C=66,由古典概型概率公式,得。所以恰有1名优秀工人的概率为。变式1(2012陕西理6)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图13-17所示),设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则()。 A. 甲<乙,m甲>m乙 B.甲<乙,m甲<m乙C.甲>乙,m甲>m乙 D.甲>乙,m甲<m乙变式2某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验。选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙。(1)假设n=4,在第一大块地中,种植品种甲的小块地的数目记为X,求X的分布列和数学期望;(2)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:kg/hm2)如表13-11所示。表13-11品种甲403397390404388400412406品种乙419403412418408423400413分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果你认为应该种植哪一品种?附:样本数据x1,x2,…,xn的样本方差,其中为样本平均数。例13.18某次有1000人参加的数学摸底考试,其成绩的频率分布直方图如图13-18所示,规定85分及其以上为优秀。(1)表13-12所示的是这次考试成绩的频数分布表,求正整数a,b的值;表13-12区间[75,80)[80,85)[85,90)[90,95)[95,100]人数50a350300b(2)现在要用分层抽样的方法从这1000人中抽取40人的成绩进行分析,求其中成绩为优秀的学生人数;(3)在(2)中抽取的40名学生中,要随机选取2名学生参加座谈会,记“其中成绩为优秀的人数”为X,求X的分布列与数学期望。0.070.070.060.050.040.030.020.0107580859095100分数图13-18频率组距解析:(1)由频率分布直方图可知,a=0.451000=200,b=0.0251000=100。(2)设抽取的40人中成绩为优秀的学生人数为x,则,解得x=30,即其中成绩为优秀的学生人数为30名。(3)依题意,随机变量X的可能取值为:0,1,2。且,,,所以X的分布列为:X012P数学期望为。变式1某班50名同学在一次百米测试中的成绩全部介于13秒和19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18且小于19秒。如图13-19所示是由上述分组方法得到的频率分布直方图,设成绩小于17秒的学生占全班总人数的百分比为x,成绩大小等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()。 A.0.9,35 B.0.9,45 C.0.1,35 D.0.1,45频率/组距频率/组距0.360.340.180.060.040.02013141516171819(秒)图13-19变式2(2012安徽理5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图13-20所示,则()。0345678910环数0345678910环数(乙)3210345678910环数(甲)321图13-20频数频数A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差题型183线性回归方程思路提示首先通过对散点图观察分析是否为线性回归,若为线性回归则利用最小二乘法求出回归直线方程。具体步骤为:(1)求,,,;(2)求;(3);(4)代入公式,求;(5)代入公式求,,代入直线方程得。这里要注意的是回归直线恒过样本中心点(,)。例13.19如表13-13所示,其中提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产耗能y(吨)标准煤的几组对照数据。表13-13x3456y2.53.44.5(1)请画出表示数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3)已知该厂技改前100吨产品的生产耗能为90号标准煤,试根据(2)求得的回归方程,预测生产100吨甲产品耗能比技改前降低多少吨标准煤?(参考数值:32.5+43+54+64.5=66.5)。解析:(1)由题设所给数据,可得散点图(如图13-21所示)上的点基本在一条直线附近,数据正相关,存在回归方程。554.5432.521y(吨标准煤)O123456x(吨甲产品)图13-21(2)由表13-14所示可知,,=0.35,即x,y的回归方程为。表13-14xixi-(xi-)2(xi-)(yi-)yi-yi3-1.52.251.5-12.54-0.50.250.25-0.5350.50.250.250.5461.52.251.514.5=4.5=5=3.5=3.5(3)由(2)的回归方程及技改前生产100吨甲产品的生产耗能,得节省的生产耗能为90-(0.7100+0.35)=19.5(吨)标准煤。评注:(1)两个变量是否具有相关关系,主要依据散点图加以判断,看变量对应的点是否分布在一条直线附近,若是,则具有相关关系;否则不具有相关关系;(2)用公式计数为,,的值时,要先算的值,然后才能算。变式1某产品的广告费用x与销售额y的统计数据如表13-15所示。表13-15广告费用x(万元)4235销售额y(万元)49263954根据表13-15可得回归方程中的为9.4,据此模型预报首先费用为6万元时销售额为()。 A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元变式2调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并出调查数据得到y对x的回归直线方程:=0.254x_0.321。由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元。变式3(2012湖南理4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg题型184独立性检验思路提示独立性检验是判断两个分类变量是否存在相关关系的案例分析方法,它与概率中事件的独立性不同,具体步骤为:(1)列出22列联表;(2)求;(3)最后根据临界值作出判断。例13.20为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样调查了500位老人,结果如表13-16所示。男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者帮助与性别相关?(3)根据(2)的结论,能否提出更好的调查方法估计该地区老年人中,需要志愿者提供帮助的老年人的比例?说明理由。解析:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例估计值为。(2)列出22列联表(如表13-17所示)。表13-17男女合计需要403070不需要160270430合计200300500。由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要志愿者帮助与性别有关。(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出,该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查中,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好。变式1为比较注射A,B两种药物产生的皮肤疱疹的面积,选200只家兔作试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B。表13-18和表13-19所示的分别是注射药物A和药物B后皮肤疱疹面积的频率分布(疱疹面积单位:mm2)。表13-18疱疹[60,65)[65,70)[70,75)[75,80]频数30402010表13-19疱疹面积[60,65)[65,70)[70,75)[75,80][80,85)频数1025203015(1)完成图13-22和图13-23所示的分别注射药物A,B后皮肤疱疹面积的频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;0.080.080.070.060.050.040.030.020.01频率/组距0606570758085疱疹面积图13-220.080.070.060.050.040.030.020.01频率/组距0606570758085疱疹面积图13-23(2)完成表13-20所示的2×2列联表,并回答能否有99.9%的把握认为注射药物A后的疱疹面积与注射药物B的疱疹面积有差异.疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=b=注射药物Bc=d=合计附:.变式2(2012辽宁理19)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”(1)根据已知条件完成下面的列联表,并据此资料你是否认为“体育迷“与性别有关?非体育迷体育迷合计男女1055合计(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷“人数为.若每次抽取的结果是相互独立的,求的分布列,期望和方差附:,0.050.013.8416.635最有效训练55(限时40分钟)1.变量X与Y的卡方统计量K2的值,下列说法正确的是()A.K2越大,“X与Y有关系”可信度越小B.K2越小,“X与Y有关系”可信度越小C.K2越接近0,“X与Y无关”程度越小D.K2越大,“X与Y无关”程度越大2.甲乙两名同学在5次体育测试中的成绩如图13-25所示,则有()A.,乙比甲稳定 B.,甲比乙稳定C.,乙比甲稳定 D.,甲比乙稳定3.为了了解某地区高三学生的身体状况,抽查了该地区100名17.5~18岁的男生体重(千克),得到频率分布直方图(如图13-26所示).由图知这100名学生在的学生人数为()A.20 B.30 C.40 D.504.设两个变x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有()A.b与r符号相同 B.a与r符号相同 C.b与r符号相反 D.a与r符号相反5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到台表13-23所示的2×2列联表.表13-23男女总计爱好402060不爱好203050总计6050100由算得:.附表13-24:P()0.0500.0100.001k3.8416.63510.828参照表13-24,得到正确的结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”6.设是娈量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图13-27所示),以下结论中正确的是()

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论