版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1应用统计学SPSS统计分析方法及应用主讲:冯运义 Email:rich_1698.2第四节 SPSS均数比较过程.3一、参数检验概述参数:描述总体的数字特征,如总体均数。统计量:描述样本的数字特征,如样本均数。置信度(1-):样本统计量推断总体特征的可靠性程度置信区间:概率保证下的总体参数的可能取值范围,如本地男性平均初婚年龄有95的可能性为252周岁。.4推断统计本节中的均数比较过程是典型的参数检验,参数检验是推断统计的重要组成部分。推断统计:由样本数据推断总体特征的方法。在对样本数据描述的基础上,以概率形式对总体的数量特征进行表述。总体数据无法获得搜集总体数据投入较大。推断统计包括参数估
2、计和假设检验两种形式,二者原理一致,仅表现形式不同。.51、参数估计定义:应用样本统计量去估计总体参数的统计推断过程。如果在估计中直接用样本统计量作为固定的数值对参数做出估计,就是参数的点估计。如初婚年龄为25周岁。如果在估计中要对参数做出带有某种可靠性的估计,就需要给出对应于这一可靠性或置信度的区间,即区间估计。如初婚年龄为252周岁。.6区间估计与置信度估计的区间越大,参数被包含在该区间的概率就越大,估计的可靠性即置信度也就越大。反之亦然。观测值的离散程度即方差越小(即观测值的精度越高),相同的置信度下,其区间越短。可见区间估计总是与一定的置信度相对应的。.72、假设检验假设检验的思想:首
3、先提出假设,然后利用样本数据来检验假设,支持,则接受假设;不支持,则推翻假设。假设检验的基本信条:小概率原理,即发生概率很小的随机事件,在一次实验中几乎不可能发生。假设检验分为两类:参数检验:总体分布已知时(如正态分布),根据样本数据对某些总体参数(如均值)进行推断。非参数检验:总体分布未知或不符合参数检验的假定分布时。.8假设检验的基本步骤提出无效(零)假设(H0)。选择检验统计量,给定显著性水平。计算检验统计量的发生概率。依据显著性水平,作出统计结论。.9区间估计与假设检验的对偶性在进行统计推断时,如果总体分布的形式是已知的,只是参数未知,则统计推断问题就可归结为推断总体参数的问题。例如在
4、产品质量检验中,通过随机抽取的样本不合格品率,以一定的概率把握程度估计总体不合格品率,这就是参数的区间估计问题;如果要以一定的概率判断这整批产品是否合格,这就是一个假设检验的问题。同一个样本-同一个统计量-同一种分布,因而两个问题可互相转换。这种互相转换形成了区间估计与假设检验的对偶性。.10假设检验的几个概念无效假设H0:关于总体参数的假设,必定包含等号H0 :某值; H0 :某值; H0 : 某值; 对立假设H1 : H1 : 某值; H1 : 某值;检验水平:即显著性水平,一般取005或001。第类错误:当无效假设为真时,却被否定,即“弃真”错误。 为第类错误的概率。第类错误:当无效假设
5、为假时,却被接受,即“取伪”错误。 为第 类错误的概率。.11假设检验的两类错误假设检验基于小概率原理:给定检验水平,如果零假设成立条件下出现现有统计量的概率等于或小于,则认为此事件可能性很小,因此就拒绝零假设。第一类错误和第二类错误又是一对矛盾:在其他条件不变下,减少犯第一类错误的可能性,势必增加犯第二类错误的可能性。要同时减少一、二两类错误的概率,只有增加样本量。弃真错误置信度取伪错误检验效能.12双侧检验检验样本均值与总体均值有没有显著性差异显著性水平005如:出生婴儿的平均体重是否为3公斤?阴影部分为拒绝域.13单侧检验左单侧检验拒绝域右单侧检验拒绝域显著性水平005.14二、均数比较
6、涉及的统计学原理1、正态分布:概率分布密度曲线呈钟型,两头低中间高,左右对称,近似于数学上的正态曲线。其性质和特点:决定于均数 和方差 2 。钟形曲线位置特征量均数、中位数、众数相等偏度和峰度均为零.15标准正态分布与标准化变换对于不同的与 ,范围内的概率不同,例如当=0,=1时,在(-1.96,1.96)范围内正态变量取值概率为0.95,而当=0, =1.96时,在 (-1.96, 1.96)范围内正态变量取值概率就不是0.95,而是0.68。为了制一张可供不同的、 共同使用的表,考虑引进标准正态分布与标准化变换标准正态分布:是一种特殊的正态分布,其均数为0,标准差为1。Z变换:即标准化变换
7、。若变量X服从正态分布,则Z变换后Z就服从标准正态分布。 .16 图 标准正态曲线下从 到u范围面积示意图.172、标准正态分布与t统计量正态分布N(,2)的资料,其样本均数服从正态分布N(,2/n),并且变换后的统计量 服从标准正态分布N(0,1) 。但在实际研究时,往往是未知的,因此只能用样本的标准差S作为的一个近似值(估计值)代替,得到变换后的统计量并记为 。对于Z而言,正态总体确定后,就已经确定了,但是对于统计量t,则样本标准差S随样本而变。因此统计量t变异程度要大于Z,故t不再服从标准正态分布。 .18N=5, t统计量的峰值比标准正态分布的峰值略小,双侧尾部的值则较标准正态分布略大
8、。N=100,接近标准正态分布在正态总体N(168.18,62)中随机抽样,样本量分别取n =5,n =100,均抽10000个样本,分别计算t值并作相应频数图如下:.193、 t分布英国统计学家W. S. Gosset(1908)给出了统计量t的分布规律,并称统计量t 服从自由度为 ( =n-1) 的t()分布。 v=1v=5v=.20 t分布的图形特征和t界值 分布特征: t分布曲线是单峰的,且关于t = 0对称。t分布与标准正态分布的关系: 自由度 较小时,t分布与标准正态分布相差较大,t分布曲线的尾部面积大于标准正态分布曲线的尾部面积。当自由度较大时,t分布逼近于标准正态分布。t分布的
9、界值:给定自由度,t分布曲线的双侧尾部面积为时对应的t值,记为 ,并称为t的双侧界值。统计意义?.214、 抽样分布抽样分布是所有可能的样本统计量和相应的概率构成的分布,以均值和方差为数字特征。正态分布再生定理:如果变量X 服从正态分布N ( ,2),则从这个总体中抽取容量为n 的样本,其样本均数也服从于正态分布N ( ,2/n )。 中心极限定理:对不服从正态分布的总体进行抽样,只要样本量n足够大,其样本均数也服从于正态分布N ( ,2/n )。 .225、 总体参数区间估计的一般步骤明确待估参数和置信度。用样本统计量导出总体参数的点估计值。 利用检验统计量的分布给出置信区间。.23总体均数
10、的区间估计样本量较大时,且总体标准差已知:总体均数的95%置信区间估计样本量较大时(如n =100 ),且总体标准差未知:总体均数的95%置信区间估计.24样本量较小时,且总体标准差未知:样本均数只能进行t变换,总体均数的95%置信区间估计.256、 均数比较的假设检验数据类型:服从正态分布的定距型变量拟解决:某样本均值是否来自某个已知的正态总体?两个样本所代表的总体均值是否相同?某样本所代表的总体均值是否发生了数量上的变化?区分两种可能性:如果两个样本均数不同,可能两个样本所来自的总体均数相同,差别来自抽样误差。总体均数确实不同.26均数比较的类型单个样本均数与总体均数比较配对样本的均数比较
11、两个样本均数的比较两样本方差齐:原始资料呈正态分布时:t检验原始资料不呈正态分布,但样本量较大时:t检验原始资料不呈正态分布,且样本量较小时:非参数检验两样本方差不齐:数据变换后方差齐:t检验数据变换后方差不齐:t检验.27三、SPSS均数比较过程单样本T 检验过程:One-Sample T test配对样本T 检验过程:Paried-Samples T test独立样本T 检验过程:Indepentdent-Samples T test.281、单样本T 检验过程统计思想:推断样本数据是否来自某一总体,即样本数据所代表的总体均值与指定的检验值是否存在统计学差异。仅涉及一个样本数据。前提条件:
12、样本所来自的总体为正态或近似正态分布例如:儿童1周岁时的平均身高是否为75厘米居民平均存(取)款金额是否为2000元.29检验步骤与统计量事先确定是否双侧检验,建立无效假设H0 :=0(双);对立假设?单侧检验?确定检验水准=0.05选择检验统计量进行检验(=n-1)结果判断与解释P0.05,不能拒绝H0,p=0.05,拒绝H0。.30SPSS基本操作操作:AnalyzeCompare Means One-Sample T Test 选定分析的变量输入待比较的总体参数0,确定单双侧检验水准选定需要输出的差异的置信区间.31例子:人口调查资料假设该市人口平均年龄去年为31.8岁,问今年人口平均年
13、龄是否发生了变化? H0 :318;有理由认定该市人口存在老龄化趋势,问今年人口平均年龄是否高于31.8岁? H0 :318;.32.33.34例子储户平均一次存款金额是否不高于2000元?根据全国保险公司人员构成数据,推断具有高等教育水平的员工比例是否不低于08?.352、配对样本T 检验统计思想:推断两个配对的样本数据是否来自同一总体,即每对观测值之差(差值样本)的总体均值是否为零。涉及两个配对的样本数据。转化为对差值是否为零进行单样本T检验前提条件:被比较的两个样本有配对关系;要求两个样本均来自正态或近似正态的总体。特征:两组样本的样本量相同;两组观测值存在一一对应的关系。.36检验步骤
14、与统计量事先确定是否双侧检验,建立无效假设H0 :12=0=0(双);确定检验水准选择检验统计量进行检验(=n-1) 计算差值x=x1-x2, 计算统计量t结果判断与解释.37SPSS基本操作按AnalyzeCompare Means Paired-Sample T Test 选定待分析的配对变量,成对选入。默认输出差异的95%置信区间.38例:比较饮用减肥茶前后体重是否发生变化.39.403、独立样本T 检验统计思想:推断两个样本数据是否来自同一总体,即样本数据所代表的两个总体均值是否存在统计学差异。涉及两个样本数据。前提条件:被比较的两个样本彼此独立;样本均来自正态或近似正态总体;方差齐性。例如:男生和女生的计算机平均成绩有显著差异吗? 城镇和农村的平均存款金额有显著差异吗?.41合并方差与自由度两总体方差相等(方差齐性)时,=n1+n2-1:两总体方差不相等(方差不齐)=f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地下室挡土墙防水施工风险控制方案
- 北京市劳动合同评估与优化
- 隧道工程大体积混凝土施工方案
- 猫微课程设计
- 合肥房地产估价课程设计
- 面粉螺旋输送机课程设计
- 桥梁课程设计详细
- 交通管理弱电系统建设方案
- 企业档案数字化管理方案
- 2024一般货物买卖合同范例
- 2024年新华社招聘笔试参考题库附带答案详解
- 2024年全国统一高考数学试卷(新高考Ⅱ)含答案
- 2024年中小学学生防范电信网络诈骗知识竞赛题库及答案
- 24春国家开放大学《学前儿童美术教育活动指导》期末大作业参考答案
- (正式版)QBT 8027-2024 家用和类似用途电动洗鞋烘鞋机
- 数字化时代背景下教师角色的思考
- 报童问题(至多成本分析法)ppt课件
- 乙炔的理化性质及危险特性表
- 汽车场地越野赛突发事件应急预案
- 神奇的世界文档
- 头痛的鉴别诊断--ppt课件完整版
评论
0/150
提交评论