



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、(1)(2)(3)(4)(5)统计1. 抽样方法:(1)简单随机抽样(抽签法、随 机数表法)常常用于总体个数较少时,它的特征 是从总体中逐个抽取;(2)系统抽样也叫等距离 抽样,常用于总体个数较多时,它的主要特征是 均衡成若干部分,每部分只取一个;(3)分层抽样,主要特征是分层按比例抽样,主要用于总体 中有明显差异,它们的 共同点:每个个体被抽到 的概率都相等,体现了抽样的客观性和平等N性。如(1)某社区有500个家庭,其中高收入家 庭125户,中等收入家庭 280户,低收入家庭95。 为了调查社会购买力的某项指标,要从中抽取一 个容量为100户的样本,把这种抽样记为 A;某中 学高中一年级有
2、12名女排运动员,要从中选取 3 人调查学习负担的情况,把这种抽样记为B,那么 完成上述两项调查应分别采用的抽样方法:A为, B为。(答:分层抽样,简单随机 抽样);(3)某中学有高一学生 400人,高二学生300 人,高三学生 300人,现通过分层抽样抽取一个 容量为n的样本,已知每个学生被抽到的概率为0.2 ,_则 n= (答:200);(4) 容量为100的样本拆分成10组,前7 组的频率之和为 0.79,而剩下的三组的频数组成 等比数列,且其公比不为1,则剩下的三组中频数 最大的一组的频率是 (答:0.16);(5) 用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为2的样本
3、,则某一个体a “第一次被抽到的概率”,“第一次未被抽 到,第二次被抽到的概率”,“在整个抽样过程中 被抽到的概率”分别是 (答:1 1 1,,);10 10 52. 总体分布的估计:用样本估计总体,是研 究统计问题的一个基本思想方法,即用样本平均 数估计总体平均数(即总体期望值一一描述一个 总体的平均水平);用样本方差估计总体方差(方 差和标准差是描述一个样本和总体的波动大小的 特征数,方差或标准差越小,表示这个样本或总 体的波动越小,即越稳定)。一般地,样本容量越 大,这种估计就越精确。总体估计要掌握:(1) “表” (频率分布表);(2) “图"(频率分布直方图)。频率分布直方
4、图的特征:(1)从频率分布直方图可以清楚的看出数据 分布的总体趋势。(2)从频率分布直方图得不出原始的数据内 容,把数据表示成直方图后,原有的具体数据信息 就被抹掉了。频率直方图的作法:算数据极差(Xmax - Xmin ;决定组距和组数; 决定分点; 列频率分布表; 画频率直方图。提醒:直方图的纵轴(小矩形的高)一般是频率 除以组距的商(而不是频率),横轴一般是数据的大 小,小矩形的面积表示频率。组数的决定方法是: 设数据总数目为n,n <50时,分为58组;50 < n<100时,分为 812组.如(1) 一个容量为20的样本数据,分组后 组距与频数如下:(10,20,2
5、 ; (20,30,3 ; (30,40,4 ; (40,50,5 ; (50,60,4 ; (60,70,2 ;则样本 在区间 (50,50上的频率为A . 5% B . 25% C . 50%D.70% (答:D);(2)已知样本:10 861013810121178911912910111212,那么频率为0.3的范围是A . 5.57.5B . 7.59.5C. 9.511.5D . 11.513.5(答:B);(3)观察新生儿的体重,其频率分布直方图 如图所示,则新生儿的体重在2700,3000的频率为 (答:0.3);(4)如图,是一次数学考试成绩的样本频率分布直方图(样本容量n=
6、200),若成绩不低于60分为及格,则样本中的及格人数是 (答:120);汽车每蚝油1L所行路程的情况,现从中随即抽出10辆在同一条件下进行蚝油 1L所行路程实验,得到如下样本数据(单位:km ):13.7,12.7,14.4,13.8,分组频数频率12.45,12.95)12.95,13.45)13.45,13.95)13.95,14.45)合计101.013.3,12.5,13.5,13.6,13.1,13.4,其分组如下:(1)完成上面频率分布表;(2)根据上表,在给定坐标系中画出频率分布直线图,并根据样本估计总体数据落在12.95,13.95)中的概率;(3) 根据样本,对总体的期望值
7、进行估计解:(1)频率分布表:分组频数频率12.45,12.95)20.212.95,13.45)30.313.45,13.95)40.413.95,14.45)10.10.S0. 710"心 3 *.7 卡-0.3) 41.4 40.8 刊.3+(_0.5) 40.5 刊.6 书.1 书.4=13.4因此,总体的期望值进行估计约为13.4.(6) 为了了解高一学生的体能情况,某校抽取部 分学生进行一分钟跳绳次数次测试,将所得数据整 理后,画出频率分布直方图(如图),图中从左到右 各小长方形面积之比为 2: 4: 17: 15: 9: 3,第 二小组频数为12.(1)第二小组的频率是
8、多少?样本容量是多少? 若次数在110以上(含110次)为达标,试估 计该学校全体高一学生的达标率是多少? 在这次测试中,学生跳绳次数的中位数落在哪 个小组内?请说明理由。0:2J2.4S 12朋孔临 以蝇路程/km合计101.0(2 ) 频率分布直方图:分析:在频率分布直方图中,各小长方形的面积等 于相应各组的频率,小长方形的高与频数成正比, 各组频数之和等于样本容量,频率之和等于1。解:(1)由于频率分布直方图以面积的形式反 映了数据落在各小组内的频率大小,因此第二小组的频率为: 42 +4 十17又因为= 0.08+15+9 +3频率=第二小组频数20.70.60.40.2样本容量样本容
9、量第二小组频数12= =15012.13.4& 13.95 1145 時趕/ka怙忡总怵數据落在13.SSJ3,95)中的率为0.7估计总体数据落在12.95,13.95 )中的概率为0.7(2) 由图可估计该学校高一学生的达标率约为17 +15 +9+3-_-_-X 100% = 88% 2+4+17 +15 +9+3(3) 由已知可得各小组的频数依次为6, 12, 51,45, 27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位 数落在第四小组内。3、样本平均数:-11 nX =(X1 +X2 +川 +Xn) = 2 X。nn y如有一组数据:X1,
10、X2,-,Xn(X1< X2<-< Xn), 它们的算术平均值为20,若去掉其中的Xn,余下 数据的算术平均值为18,则Xn关于n的表达式为俗:Xn =2 n +18) o4、样本方差:2 I 2 2 2S =(X1X)+(X2X)+ 川 +(XnX) n1 n_=-Z(X -x)2 ;n y样 本X)2+(X2X)+il2+(Xn-X)如(1)甲、乙两名射击运动员参加某大型运 动会的预选赛,他们分别射击了 5次,成绩如下表 (单位:环)甲108999乙1010799如果甲、乙两人中只有 1人入选,则入选的应是 (答:甲);(2)已知实数Xi , X2 , ,Xn(n >
11、;2)的期望值1 n 2=一送(Xi -a),若 n y为X,方差为S2,a H X,则一定有2A. S >mc. S2 =mB.S2 5S2与m无法比较大小(答:B);(3)某班40人随机平均分成两组,两组学生一计量组别统平均分方差第1组8016第2组9036次考试的成绩情况如下表:俗:,方差为则全班的平均分为85,51 )提醒:若X1,X2JH,Xn的平均数为X,方差为 s2,则 axj + b,ax2 +b,川,aXn +b 的平均数 为aX+b,方差为a2s2。如已知数据X1,x2 ,Xn的平均数x=5,方差 S2 = 4 ,则数据 3为 + 7,3X2 +7,,3Xn +7 的
12、 平均数和标准差分别为A. 15, 36 B. 22, 6 C. 15, 6 D. 22, 36 俗:B)5. 茎叶图(1)茎叶图的画法:将每个数据分为茎(高位)与叶(低位)两 部分,将最大茎和最小茎之间的数按大小顺序排 成一列,将各数据的叶依先后次序写在其茎的左(右)两侧.(2)茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是 从统计图上没有原始数据信息的损失,所有数据 信息都可以从茎叶图中得到;二是茎叶图中的数 据可以随时记录,随时添加,方便记录与表示。(22)茎叶图只便于表示两位有效数字的数 据,而且茎叶图只方便记录两组的数据,两个以 上的数据虽然能够记录,但是没有表示两个记录 那么
13、直观,清晰。6. 独立性检验独立性检验是检定两个事件间是否独立的统 计方法,是卡方检验的一个应用 .卡方检验是对样本的频数分布所来自的总体 分布是否服从某种理论分布或某种假设分布所作 的假设检验.即根据样本的频数分布来推断总体的 分布,卡方独立性检验的零假设是各事件之间相互 独立.卡方值永远大于零.x2的两个临界值分别是23.841,与6.635. X < 3.841时,接受假设即两事件 无关.相关系数是测定变量之间相关密切程度和相 关方向的代表性指标。相关系数用符号“r ”表示, 其特点表现在:参与相关分析的两个变量是对等 的,不分自变量和因变量,改变两变量的地位并不 影响相关系数的数
14、值,因此相关系数只有一个;相 关系数有正负号反映相关系数的方向,正号反映正 相关,负号反映负相关;回归和相关都是研究两个变量相互关系的分 析方法。相关分析研究两个变量之间相关的方向和 相关的密切程度。但是相关分析不能指出两变量相 互关系的具体形式,也无法从一个变量的变化来推 测另一个变量的变化关系。回归方程则是通过一定 的数学方程来反映变量之间相互关系的具体形式, 以便从一个已知量来推测另一个未知量。为估算预 测提供一个重要的方法。相关性检验的步骤 是:(1)做统计假设:X与Y 不具备线性相关关系.(2)根据小概率0.05与n-2 查出r的一个临界值.(3)根据样本相关系数公式 计算出r的值.
15、(4)作统计推断:如果|r| :>r0.05, 表明95%的把握认为X与Y之间具备线性相关关系,如果|r| <r0.05,接受假设.提醒:A与B有关并不意味着 A的发生必然导 致B的发生.7.回归分析回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一为估计预测提供一个重要的方法。在 由X推算Y与由Y推算X的回归方 不可混淆:,S (X -X)(yi -y)_b =_-2 a =y -bxZ(X X)S(X -X)(yy) _b = 2,a = X -byZ (yi -y)个相应的数学表达式,以便从一个已知量来推测另 一个未知量, 回归分析中, 程是不
16、同的,运转的速度而变化,下表为抽样试验的结果:转速X(转/秒)1614128每小时生产有缺点的零件数 y(件)11985(1)画出散点图(2)如果y对X有线性相关关系, 求回归直线方程; (3)若实际生产中,允许每小 时的产品中有缺点的零件最多为 10个,那么机器 的运转速度应控制在什么范围内?答案:(2)y=0.7286x-0.8571(3)X小于等于14.9013.与相关分析相比,回归分析的特点是:两个变量 是不对等的,只能用自变量来估计因变量,而不允许由因变量来推测自变量,必须区分自变量,一般 说,事物的原因作自变量 X.回归分析和相关分析是互相补充、密切联系的。 相关分析需要回归分析来表明现象数量相关的具 体形式,而回归分析则应该建立在相关分析的基础 上。依靠相关分析表明现象的数量变化具有密切相 关,进行回归分析求其相关的具体形式才有意义。如(1)在研究色盲与性别的关系调查中,调 查了男性480人,其中有38人患色盲,调查的520 个女性中6人患色盲,(1)根据以上的数据建立一个 2X2的列联表;(2)若认为“性别与患色盲有关系”,则出错的概 率会是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 染整行业绿色制造与环保法规执行考核试卷
- 玻璃纤维增强塑料在建筑外墙材料的应用考核试卷
- 人事行政培训人力资源战略考核试卷
- 木质装饰材料选购技巧考核试卷
- 皮革制品保养市场前景分析考核试卷
- 医院建筑安全与设施维护知识考核试卷
- 柑橘种植园生态环境保护考核试卷
- 生态保护与生态智慧城市建设考核试卷
- 财务报销票据粘贴规范
- 《上下前后左右》位置课件
- 学习课件铸牢中华民族共同体意识PPT
- 湖南省对口招生考试医卫专业十年真题(2010-2019年)
- 用Excel求解运筹学中最大流问题详细操作示例
- 民航客舱服务艺术案例分析全套PPT完整教学课件
- 全国大学生市场调查与分析大赛优秀报告一等奖
- CET46大学英语四六级单词EXCEL版
- 2022年南通市特殊教育岗位教师招聘考试笔试试题及答案解析
- GB/T 4857.7-2005包装运输包装件基本试验第7部分:正弦定频振动试验方法
- GB/T 3051-2000无机化工产品中氯化物含量测定的通用方法汞量法
- GB/T 13936-1992硫化橡胶与金属粘接拉伸剪切强度测定方法
- GB/T 13888-2009在开磁路中测量磁性材料矫顽力的方法
评论
0/150
提交评论