



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.3.3实习作业教学目标:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异。教学重点:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异。教学过程:1课本86页案例设计一个题目2尝试解决下面的问题。(1)下面是关于吸烟情况的20个国家的统计数字,其中第一行是国名,第二行是男性吸烟成员的百分数,第三行是女性吸烟成员的百分数。韩国拉脱维亚俄罗斯多米尼加汤加土耳其中国泰国斐济日本68
2、.267.067.066.365.063.061.060.059.359.06.312.030.013.614.024.07.015.030.614.8美国巴基斯坦芬兰土库曼尼日利亚巴拉圭巴林新西兰瑞典巴哈马28.127.427.026.624.424.124.024.020.019.323.54.419.01.56.75.56.022.024.03.8根据以上数据,试研究这些国家吸烟状况的类似程度。问题(1)的分析: 要根据数据研究这些国家吸烟状况的类似程度,我们可以仅讨论男性的吸烟情况,首先确定一个划分类似的标准,不妨取1%,即当两个国家男性吸烟人数百分比之差小于1%时,将这两个国家称为类
3、似的.则可分成下面九组:(1)韩国;(2)拉脱维亚,俄罗斯和多米尼加;(3)汤加;(4)土耳其;(5)中国,泰国,斐济和日本;(6)美国;(7)巴基斯坦,芬兰和土库曼;(8)尼日利亚,巴拉圭,巴林和新西兰;(9)瑞典和巴哈马。对于女性吸烟的情况也可做类似的分析。如果我们要整体地讨论吸烟情况,我们应当怎样做呢?一个直接的想法就是考虑下面的平面图:以女性吸烟者的百分数为横轴,男性吸烟者的百分数为纵轴。(如下图所示)从图中可以看出,基本上分成下面四组:(1)巴哈马,巴基斯坦,巴拉圭,巴林,尼日利亚和土库曼斯坦;(2)芬兰,新西兰,瑞典和美国;(3)中国,日本,泰国,韩国,拉脱维亚,多米尼加和汤加;(
4、4)土耳其,斐济和俄罗斯。这个过程叫做聚类分析,它的基本思想是:在一批样本数据中,定义能度量样本数据或类别间相近程度的统计量,在此基础上计算出个样本数据或类别之间的相近程度度量值;再按相近程度的大小,把样本逐一归类,关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有的样本数据都聚集完毕;最后把不同的类别一一划分出来,形成一个关系密疏图,并用以直观地显示分类对象的差异和联系。上例向我们展示了对数据进行的聚类分析的过程, 一般来说,进行聚类分析需要解决两个问题:一是如何确定度量两个数据的接近程度的方法;二是究竟分成多少类合适。这两个问题都需要根据实际问题的背景和数据本身的
5、意义来确定。统计上对此提出了一套程序化的方法:(1)选择一种确定接近程度的方法,最直接的就是点之间的距离,我们上面的分析即是基于此;(不同的方法将得到不同的分类结果)(2)设要分类的对象有n个;我们以这n个对象分成n类开始,按所选择的方法确定这n个对象两两的接近程度度量值,将最接近的两个对象合并为一类,如此我们得到了至多n-1类;(3)确定类与类之间接近程度的方法;(4)对n-1类重复步骤(2),如此下去到完全归为一类止。至于究竟分成多少类合适,需要分析者根据所讨论的问题来决定。在实际问题中,往往需要对几种分类方案进行比较后,再加以选择。(2)为了研究某种新药的副作用(如恶心等),给50位患者
6、服用此新药,另外50位患者服用安慰剂,得到下列实验数据: 副作用药物有无合计新药153550安慰剂44650合计1981100请问服用新药是否可产生副作用?问题(2)的分析:假定服用新药与产生副作用没有关联.那么,首先要给“没有关联”下一个“能够操作”的定义。根据直观的经验,在服用新药与产生副作用的情形下,这个定义可以是这样的:如果服用新药与产生副作用没有关联,就意味着,无论服用新药与否,产生副作用的概率都是一样的。就此例题而言:二者相差较大。由此可以推断,开始的假设是不成立的。也就是说,服用新药与产生副作用是有关联的。由统计的常识知道,要求等号成立是非常苛刻的条件,实际上一般也是办不到的,我
7、们所能追求的是在概率意义下的可靠性。对于上面的独立性问题,类比在聚类分析讨论中的想法,我们应当寻找一个适当的统计量,用它的大小来说明独立性是否成立。在统计中,我们引入下面的量 副作用B 药物A 有副作用B1无副作用B2合计新药A1安慰剂A2合计在前面的例子中a15,b35,c4,d46。注意到独立性要求:P(全体生实验者产生副作用)P(服用新药产生副作用)即 这等价于 因此,可以用的大小来衡量独立性的好坏。问题:(1)用是不是更好些?(2)用比用合理,你认为有道理吗?(3)为了得到统计量的近似的分布,统计学家最终选用了:Q2=用它的大小来衡量独立性的大小,你能把它化简得到下式吗?从上面的表达式可以直观地看出:的值越小,事件A与B之间的独立性将会越大(当的值为0时,事件A与B完全独立)。通过有关统计量分布的计算可知:当时,事件A与B在概率为95%的意义下是相关的;当时,事件A与B在概率为99%的意义下是相关的。我们来算一算本题中的值:于是得出结论:在概率为99%的意义下,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安徽省合肥四十二中中考物理一模试卷(含解析)
- 浙江省余杭区普通高中第二共同体2024-2025学年高考最后冲刺模拟(一)英语试题含解析
- 华南农业大学珠江学院《食品研发专题》2023-2024学年第二学期期末试卷
- 湖北省孝感市孝南区十校联谊2025年第二学期初三教学质量检测试题生物试题试卷含解析
- 山东省邹平县黄山中学2025年高三年级4月联考数学试题含解析
- 拉萨市堆龙德庆县2024-2025学年数学四年级第二学期期末学业质量监测试题含解析
- 辽宁地质工程职业学院《建筑给排水工程》2023-2024学年第二学期期末试卷
- 河南艺术职业学院《印度文化遗产赏析》2023-2024学年第一学期期末试卷
- 四川省遂宁市安居育才中学2024-2025学年初三5月考前适应性考试英语试题试卷含答案
- 周口理工职业学院《自然科学基础(4)》2023-2024学年第一学期期末试卷
- 固体表面的吸附
- (正式版)JBT 14581-2024 阀门用弹簧蓄能密封圈
- 医疗器械销售公司介绍
- (2024年)传染病培训课件
- 《中外学前教育史》课件-俄罗斯的学前教育
- 2023年山东高考政治试卷附答案
- 2023年中考地理会考模拟试卷(含答案)
- 胰腺癌一病一品
- 智能化浓缩机控制系统开发
- 第7课《提高警惕防拐骗》课件
- 刑事案件侦查程序中的监督与纠正措施
评论
0/150
提交评论