进入虚拟课堂_第1页
进入虚拟课堂_第2页
进入虚拟课堂_第3页
进入虚拟课堂_第4页
进入虚拟课堂_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PAGE 12PAGE 11 HYPERLINK 04/qaos/forum.aspx 进入虚拟课堂高三数学同步辅导教材(第1讲)一、本讲进度 1.111.4. 统计 课课本P4P27.二、学习指导统计就是通过对对样本的研究究来估计总体体的相关情况况。这种估计计的可靠性,取取决于两个方方面:一是对对样本恰当的的采集,二是是对样本进行行适当的分析析.1在可能的情情况下,样本本容量越大越越好在确定定样本容量后后,对样本的的采集的原则则只有一条:公平性即即使每个个体体被采入的概概率相等(即即若总体容量量为N,样本本容量为n,应应使每个个体体被采入的概概率均为)为此,我们们常用以下三三种样本采集集法:

2、(1)简单随机机抽样法传传统常用抽签签法和随机数数表法,一般般适用于样本本容量较小者者. 其中随机数数表法初学者者易产生一些些误解,故应应指出:第二步中“任任选一数”才能保证公公平性,不必必也不能每次次都仿课本中中例题那样选选“5”,课本例题中“向右”他是照顾阅阅读习惯而已已,从理论上上说,也可向向左、向上、向向下、向左下、向右上上等方向,甚甚至可以有规规律地“跳读”但这不意意味着“随意读”,如 之类类的读法,就就人为地破坏坏了“公平性”(前一句句话中“有规律”的说法也是是为了避免无无意间破坏了了这种“公平性”)不需以为随机机数表中两数数一节,只适适用于二位数数,这只是便便于你阅读的的一种印刷

3、方方式而已,一一位数,三位位数等也适用用;统计工作者现现在常用计算算机来产生随随机数,我们们这两年耳熟熟能详“计算机派位位”就是一例,又又快又方便。(2)分层抽样样当总体由由差异明显的的几部分构成成时,为了充充分利用已有有信息,同时时也是为了更更好地用样本本估计总体,应应采用分层抽抽样。但要注注意:每层中抽取取的样本数应应为n1(n1为该层总个个数,n为样本容量量,N为总体个数数); 在每层中应应采用简单随随机抽样。(3)系统抽样样当总体个个数较多,且且分成均衡的的几个部分时时,可采用系系统抽样,这这样省时省力力,但应注意意,在每个部部分中的抽取取规则必须对对每一个体“公平”.2用样本估计计总

4、体,一般般应做如下几几件事:(1)频率分布布先求样本本数据中最大大值与最小值值的差,(称称为极差),再再确定合适的的组数和组距距,决定分点点(每个分点点只能属于一一组,故一般般采用半开半半闭区间),然然后列出频率率分布表(准准确,查数据据容易),画画频率分布直直方图(直观观)(2)总体期望望值的估计,计计算样本平均均值=.(3)总体方差差(标准差)的的估计:方差= 标准差SS=方差(标准差)较较小者较稳定定。本章内容实践性性很强,建议议在弄清原理理和频率的基基础上从实习习作业为龙头头带动学习.三、典型例题讲讲评例1某学院有有四个饲养房房、分别养有有18、544、24、448只白鼠供供实验用某某

5、项实验需抽抽取24只,你你认为最合适适的抽样方法法为( )(A)在每个饲饲养房各抽取取6只;(B)把所有白白鼠都加上编编有不同号码码的颈圈,用用随机取样法法确定24只只;(C)在四个饲饲养房分别随随手提出3、99、4、8只只;(D)先确定这这四个饲养房房应分别抽取取3、9、44、8只样品品,再由各饲饲养房自己加加号码颈圈,用用简单随机取取样法确定各各自己捕出的的对象.依据公平性原则则,根据实际际情况确定适适当的取样方方法,是本题题的灵魂.(A)中对四个个饲养房平均均摊派,但由由于各饲养房房所养数量不不一,反而造造成了各个体体入选概率的的不均衡,是是错误的方法法;(B)中保证了了各个体入选选概率

6、的相等等,但由于没没有注意到处处在四个不同同环境会产生生不同差异,不不如采有分层层抽养可靠性性高,且统一一偏号统一选选择加大了工工作量;(C)中总体用用采了分层抽抽样,但在每每个层次中没没有考虑到个个体的差异(如如健壮程度,灵灵活程度)貌貌似随机,实实则各个体概概率不等。各饲养房必然会会造成不同的的差异,及同同一饲养房中中各个体的差差异是初学者者忽视的.例2对某种新新品电子元件件进行寿命终终极度实验.情况如下:寿命(h)10020002003000300400040050005006000个数2030804030(1)列出频率率分布表,画画出频率分布布直方图和累累积频率分布布图.(2)估计合格

7、格品(寿命1100400h者者)的概率和和优质品(寿寿命40h以以上者)的概概率.(3)估计总体体的数学期望望值.通过此题初步体体会统计在现现实生产,生生活中的作用用,并了解相相关步骤.例3设、分别别表示样本(x1,x2,xn)的平均值和方差,、分别表示样本(x1,x2,xn+1)的平均值和方差,求证:(n1)=n+本题是探求样本本容量由n增大到n+1时,平平均值及方差差的变化情况况寻求与关系中遇遇到的第一个个问题是,如如何把转换为?所以我们们应选探求与与间的关系。且且不难由=+知=+=+.或()+用哪一个形式好好?看要证结结论的形式便便知应用前一一种形式. 于是,()2=()2+()(),

8、(n+11)=n+()2+(n+11)+(n+11)(x1+xn+xn+1)=n+()2+()=n+ 前n项和和与平均值,前前n+1项和与与平均值的关关系虽然不复复杂,但对初初学者是生疏疏的,尝试着着推出结论,对对思维的发展展不无益处 例4某某市农科所为为寻找适合本本市的优良油油菜品种,在在本市5个乡乡各选了条件件相近的3块块地,试种AA、B、C三三种油菜.每每块试验田面面积均为0.7公顷,试试根据下表所所列产量情况况作一评选:(表中产量量单位为kgg) 12345A21.520.422.021.219.9B21.323.6918.921.419.8C17.823.321.419.720.8为

9、评定优劣,我我们只须每块块地(0.77公顷)的平平均产量以估估计产量的期期望值及计算算相应的标准准差,以估计计产量的稳定定性即可. 例5为为考察某地区区12个行政政村30000名适龄青年年的踽齿发病病情况,欲从从中抽取3000人为样本本进行分析,应应采用哪种抽抽样较为合理理?并简述抽抽样过程. 一般来说说,各行政村村人数差异是是不能忽略的的,为保证每每个适龄青年年等可能入选选,应采用分分层抽样法,对对每个村抽取取其适龄人数数的具体地地可用简单随随机抽样法产产生,先把每每个个青年编编号制签,抽抽取即可. 例6在在例5中,如如果我们决定定先从12个个村中选抽33个村再从这这三个村中抽抽取300个个

10、样本,为使使12个村的的每个适龄青青年被抽取的的概率相同,又又应怎样取样样? 在三个村选选定后,从这这三个村选样样本的情况应应与例5类似似(不过122改成了3而而已)关键在在于三个村怎怎样确定. 做12个个签,随意抽抽取3个显然然是不公平的的,设第m个村适龄人人数为mi,该村每个个适龄青年入入选概率为()=(mj、mk 为另两种签签的村的适龄龄个数)而不不再是(mi )=. 所以,为为了保证每个个适龄青年入入选概率相等等,选行政村村时就不能等等概率,而应应让其中签的的概率为=,这样每个个适龄青年入入围的概率仍仍是300=. 当然,具具体操作时,不不可能那样精精细,比方说说,如果这112个村的适

11、适龄人数大约约是1 :11 :1 :1 :2 :2 :22 :2 :2 :3 :3 :33,则可制114+25+33=23个个签,其中有有3个是“中”,其余200个是“不中”,让村长抽抽签,比例是是1的抽1个个.比例是22的抽2个,比比例是3的抽抽3个. 例7某次次考试,某班班的成绩写累累积频率分布布图如下,据据此图,你能能得到哪些结结论?巩固练习1A 教育育局督学组到到学校检查工工作,临时需需在每个班各各抽调二人参参加座谈;某班期中考考试有15人人在85分以以上,40人人在60884分,1人人不及格,现现欲从中抽出出八人研讨进进一步改进教教和学;某班元旦聚聚会,要产生生两者“幸运者”对这三件

12、事事,合适的抽抽样方法为( )(A)分层抽样样,分层抽样样,简单随机机抽样(B)系统抽样样,系统抽样样,简单随机机抽样(C)分层抽样样,简单随机机抽样,简单单随机抽样(D)系统抽样样,分层抽样样,简单随机机抽样2A 已知一个个样本:255、21、223、25、227、29、225、28、330、29、226、24、225、27、226、22、224、25、226、28、试试以2为组矩矩,列出频率率分布表,画画出频率分布布直方图和累累积频率分布布图,并由此此估计总体在在22288间的概率.3A 实习作业业,题目:我我校毕业班的的周作业量调调查.要求:写出样本本采集过程及及全部样本数数据,写出频频

13、率分布表,画画出频率分布布直方图和累累积频率分布布图,算出数数学期望.参考答案:1D2极差=30021=99。组矩2,故故分为5组。 频率分分布表频数频率累积频率20.5222.5244.530.150.2524.5266.580.40.6526.5288.540.20.8528.5300.530.151频率分布直与图图 累积频频率分布图2228间的的概率约为00.8500.1=0.75附录 例1总体体个数为188+54+224+48=144 = 18=3 54= 4 48=8 故各饲养房各各采集容量为为3、9、44、8的样本本,由于各个个体易捕捉程程度不一,故故不能随手抓抓捕.选(DD)例2 频率率分布表 寿命(h)频数频率累积频率1002000200.100.102003000300.150.253004000800.400.654005000400.200.855006000300.151合计2001寿命1004400h的频频率为0.665, 4006600h的频频率为0.335估计总体均值 0.01+0.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论