




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、绪论(xln)随机抽样:保证总体中的每一个研究对象都有一个已知且相等并不为零的概率被选取作为(zuwi)样本的抽样方法。1统计(tngj)工作的基本步骤1设计:这是对整个统计工作的规划,具体规定做什么,怎么做,什么时候做,谁去做,预计可能需要什么资源以及可能取得的结果等。2搜集资料,就是按照设计的规定,及时取得完整而准确的数据资料;3整理资料,即按照设计指定的方式方法,审核校正资料,使资料系统化、条理化。4统计分析资料,即按照设计规定的方法,进行合理的归类总结,计算相应的统计指标,进行适合的统计检验和综合理论分析。2统计资料的类型和特点计量资料通过度量衡的方法测得的研究对象的研究指标的值,它是
2、有单位的,大多数计量资料是连续性资料,即可以有小数计数资料先将研究对象按照某种特性分成不同的组/类,然后清点各组/类所包含研究对象的个数而得到的资料,可以说没有单位,属于间断性资料,不能有小数等级资料介于计量资料和计数资料之间,尽管等级资料能部分反映量的变化,但不能具体说明每个研究对象的研究指标的数量值;虽然也是清点个数得到的,但能部分反映量的变化。3总体与样本总体是指根据研究目的而确定的研究对象的全体。更确切地说,总体是指同质的所有研究对象某项研究变量值的集合。因此,实际工作中,当有明确而具体的研究指标时,总体是指所有研究对象的该项研究指标值的集合;而没有明确而具体的研究指标时,总体则是所有
3、研究对象的集合。样本是指从总体中抽取的部分研究对象。4误差非抽样误差:1. 抽样框误差; 2. 无回答误差;3. 计量误差。抽样误差:是指抽样研究时由于抽样而造成的研究结果与真实值之间的误差。抽样研究时,由于只选择了部分研究对象进行研究,这部分研究对象所反映出来的研究结果肯定与全部研究对象的真实值之间会有误差,这是产生抽样误差的直接原因抽样;但从根本上说,研究对象之间存在变异,部分和全部是不一样的,即产生抽样误差的根本原因是变异。正因为这直接原因和根本原因,只要是抽样研究,就存在抽样误差。抽样误差是不可避免的。1. 改进抽样方法,使样本更具代表性;2. 增加样本量,使样本量达到一定水平;3.
4、选择变异程度小的指标作为研究指标。5小概率(gil)事件指在一次观察(gunch)/研究(ynji)中,只发生大概率事件,不发生小概率事件。或者说,在一次观察/研究中,小概率事件不发生。计量资料的描述性研究1频数表/频数图的绘制绘制频数表时,应根据样本量的大小合理确定所分的组数,其原则是能正确反映数据分布规律。分的组数太多,不方便以后的应用;分的组数太少,不能正确反映数据的规律。因此,绘制频数表时,所分的组数既不能太多也不能太少。一般以分815组为宜。2频数表/频数图的用途(1)揭示资料的分布特征和分布类型,据此判断资料的对称性;(2)便于发现可疑值;(3)便于进一步计算指标和统计分析处理。3
5、集中趋势(1)算术均数,简称均数。适合于对称分布资料,尤其是正态分布资料; (2)几何均数。适合于成倍变化的数据(数学上称等比级数),尤其是对数正态分布资料; (3)中位数。适合于偏态分布资料、不规则分布资料或说分布不清楚资料和开放性资料。中位数的适用范围比较广泛,即使是对称分布的资料,中位数也会接近或等于算术均数/几何均数。(4)百分数。4离散趋势(1)极差(2)四分位数间距(3)方差(variance)方差越大,变异越大;反之亦然。总体(或说理论)方差用符号2表示;样本(或说估计)方差用符号s2表示。优点:考虑了所有观察/测量值的变异,比较稳定。缺点:量纲(即单位)发生了改变,有时无法解释
6、。(4)标准差(无缺点)(5)变异系数1. 比较单位不同的多组资料的变异程度;2. 比较均数相差悬殊的多组资料的变异程度。5正态分布位置(wi zhi)参数均数;形状(xngzhun)参数标准差 总面积100%(1);几个(j )特殊数: -2.580.5% -1.962.5% -1.6455.0%正态变换标准正态分布正态分布资料的表示方法:N(,2) 6正常值范围通常把绝大多数(如90%、95%和99%)研究对象的某指标值范围称为该研究对象该指标的正常值范围。最常用的有95%正常值范围。估计方法 正态分布法/百分位数 (1)太大太小都不正常; / P2.5-P97.5 (2)太大不正常,越小
7、越好; /0-P95 (3)太小不正常,越大越好。 / P5-用途:评判某观察对象某指标是否正常。质量控制:在实验研究中,用来控制误差,保证数据质量。7标准误(standard error)概念:样本均数的标准差计算:理论 样本意义:说明样本均数的变异程度,反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。与样本量的关系:S 一定,n增大,标准误减小。也就是说,样本量越大,标准误越小(1)概念不一样:标准差是方差的平方根,而标准误是样本均数的标准差。(2)计算方法不一样。(3)意义不一样:标准差反映个体测量值的变异程度,而标准误反映样本均数(群体测量值)的变异程
8、度。(4)用途不同:标准差用于估计正常值范围,而标准误用于估计总体参数和假设检验。(5)特点不同:标准差还可以反映样本均数的代表性,而标准误还可以反映抽样误差的大小,衡量用样本均数估计总体参数的可靠性。8 t分布(fnb)概念(ginin):在作正态变换的过程中,如果用小样本的均数和标准差替代变换公式中的均数和标准差,得到的结果(ji gu)就不再是z值,我们用t值表示新的结果,该值的分布称为t分布。特点:与z分布相比,t分布曲线也是以0为中心、单峰、左右对称的曲线。但t分布曲线中点处比标准正态曲线低,两侧尾部比正态曲线翘得高; 曲线形状与样本量(严格地说是自由度)有关。自由度越小,与正态曲线
9、相差越大;自由度越大,越接近正态曲线。 是一组曲线。计量资料的统计推断1概念:由样本的信息来推论总体特征的过程,称为统计推断。2内容:参数估计(点估计,区间估计)和假设检验3可信区间:利用样本均数,按一定的可信程度(置信度)估计得到的总体均数所在的范围。估计方法:z分布法大样本100+ 理论标准差已知小样本可信区间vs正常值范围:(1)概念不同;(2)估计方法不同:估计正常值范围用标准差,而估计可信区间用标准误;(3)意义不同:正常值范围说明正常情况下绝大多数该指标的测量值所在的范围,而可信区间是按一定置信度估计得到的总体均数所在的范围。(4)用途不同:正常值范围用于评判某研究对象的该指标是否
10、正常,而可信区间用于推论总体的参数。(5)特点不同:由于指标的性质不同,其正常值范围常有单双侧之分,而其总体均数可信区间绝大多数情况下都是双侧的。4假设检验目的意义:两个样本均数或者一个样本均数和一个总体均数不相同的原因。判断/区分均数不同是哪一个原因造成的。前提条件:首先要满足统计推断的条件;其次要具有可比性,可比性是指除要研究/考察的因素外,其它可能影响结果的因素都相同或相近;此外要求均数具有良好的代表性和可靠性。一般步骤:1建立假设 检验(jinyn)假设,又称无效假设,用符号(fho)H0表示(biosh)。一般假设比较的样本来自相同的总体,或者说它们所代表的总体相同。备择假设,用符号
11、H1表示。与检验假设相对立。单侧检验和双侧检验有些不同。 单侧或双侧检验的确定2确定检验水准 又称显著性水平,用符号表示,是区分大小概率事件的标准/界限,是我们人为选择而确定的。一般定为0.05或者0.01。3选择检验方法,计算统计量 根据研究设计的类型、资料的特点/类型和比较研究的目的,选择检验方法。一旦确定了检验方法,计算什么样的统计量以及如何计算该统计量就可以确定。4确定概率值P 这里的概率P是指,如果比较的两个均数所代表的总体相同,那么在这个相同的总体中作随机抽样研究,得到均数差值至少是现在所观察到的这么大这一事件的概率。5进行统计学判断,进而作出推断结论P,差别无统计学意义,或者说差
12、别不显著P,差别有统计学意义,或者说差别显著 “差别”的含义 推断结论:所研究的总体有/无差别,是否相同。5 z检验z的绝对值越大,所对应的面积P越小。适用于大样本或理论标准差已知 两大样本均数比较6 t检验(jinyn)自由度()一定(ydng)时,t越大,p越小;概率(gil)(p)一定时,越大,t越小。小样本正态资料;两样本均数比较时,两总体方差齐(相同)配对t检验配对设计将受试对象按一定条件配成对子,再分别给予每对中的两个受试对象以不同的处理。优点增加了处理组间的均衡性,提高了实验效率形式1两组受试者分别接受两种不同的处理;2同一样品,用两种不同的方法测试;3同一受试者,在不同时间接受
13、同一种方法的处理和测试。解决配对资料的比较,先要求出各对测量值的差值的均数和标准差。从理论上讲,如果两组之间没有区别,那么差值的总体均数应该等于0。因此,可以将配对资料的t检验看成差值的样本均数与已知的总体均数0之间的比较。n是对子数 成组t检验 小样本正态资料;方差齐。先两样本的方差齐性检验再计算统计量 7两类错误(cuw)I类错误(cuw):拒绝(jju)了实际上成立的H0 。最大允许概率为显著性水平,是人为确定的,一般为0.05或者0.01。II类错误:不拒绝实际上不成立的H0概率为,一般很难确定。1-称为检验效能或把握度(power of test),是指两总体确有差别,按水准能发现它
14、们有差别的能力。两类错误 1不能同时发生;2样本量确定的情况下,越大,越小;3 越小,越大;4 确定的情况下,增加样本量,可减少。发生原因:抽样及抽样误差;人为确定的大小;小概率理论。方差分析1基本思想:根据研究设计方法和分析的需要,将全部观察值之间的变异总变异,按设计和需要分解为两个或多个部分再作分析。2适用条件:随机独立资料;服从正态分布;方差齐。3完全随机设计的单因素方差分析4区组设计(shj)的两因素方差分析方差分析:对于配伍(piw)因素 对于(duy)处理因素5多样本均数间的两两比较多个样本均数间每两个均数之间的比较,常用q检验,也称SNK法。式中 是误差或组内均方。其中(qzhn
15、g)是检验水准,a为比较(bjio)的两组间包含的组数,v为误差(wch)或组内自由度。最小显著差法,LSD相对数1常用指标:构成比(proportion):又称构成指标,表示事物或现象内部各组成部分的比重或分布。()总和等于或;()不能同时都增大或减小。一般要使结果保留两位小数。率(rate):又称频率指标,说明某现象发生的频率或强度。()分子是发生某现象的观察单位数,分母是可能发生该现象的观察单位总数。(2)观察单位。(3)比例基数K。相对比(ratio):反映指标间的相对水平。甲/乙2动态数列按照一定的时间(shjin)顺序,将一系列描述某事物的统计指标依次排列起来,以便观察和比较该事物
16、在时间上的变化和发展趋势。这些统计指标可以是绝对数、相对数或平均数等。动态数列分析是建立在相对比基础(jch)上的,采用定基比和环比两种方式。常用(chn yn)的分析指标有:绝对增长量、发展速度与增长速度、平均发展速度和平均增长速度。3应用相对数的注意事项分母不能太小比与率不能混用合并率(总率)的计算可比性抽样误差假设检验4标准化法(合在一起算出人数,再比较)条件:小组构成影响总率;小组构成各不相同;比较总率。(1)标化率不能反映实际水平,只能用于比较;(2)选用标准不同,标化率会改变,但比较结果只有一个,不能改变;(3)比较标化率,也要作显著性检验。5率的标准误和区间估计总体率的可信区间
17、标准误: 小样本时,可直接查相应的统计表而得到某阳性数时的可信区间。 样本量不太小,总体率既不太小,也不太大,接近0.5时,样本率近似正态分布。此时总体率的可信区间为6率的检验样本率与总体率比较 阳性数比较小时,可直接计算概率P,进而完成检验。 满足近似正态条件时,可用z检验。两样(lingyng)本率的比较近似(jn s)正态分布时,仍可用z检验(jinyn)。统计图表统计表种类:简单表:按一个研究特征/标志/标识分组复合/组合表:按二个或二个以上研究特征/标志/标识分组绘制原则:重点突出,简单明了;主谓分明,层次清楚绘制要求:标题,标目,线条,数字,备注统计图直条图(bar graph):
18、 适用于相互独立的、无连续关系的间断性资料的比较。种类:单式直条图和复式直条图圆图和百分条图: 适用于构成比资料。普通线图:用线段的上升和下降来表示某事物在时间上的发展变化或者某现象随另一现象变迁的情况。适用于连续性资料半对数线图:横轴是算术尺度,纵轴为对数尺度。因纵轴是对数尺度,所以不能为0和负数。反映的是相对速度,特别适用于绝对值相差悬殊的资料间比较。直方图: 常用于表示连续性资料的频数分布,故又称频数图。用矩形的面积表示频数分布数列中各组频数的多少,面积总和相当于各组频数的总和。散点图:用点的密集程度和趋势表示两种现象间的关系。适用于双变量资料,且变量均为连续性变量。直线回归与相关1回归
19、(hugu)分析目的(md):发现并描述(mio sh)两变量之间的依存关系2应用条件:自变量容易测定,容易控制;在各种自变量的情况下,应变量服从正态分布。3统计学意义:自变量x每变化一个单位,应变量y平均改变的单位数。4直线回归方程建立b是回归系数(regression coefficient):等于回归直线的斜率(slope),其统计学意义是自变量x每变化一个单位,应变量y平均改变的单位数。截距(a)和回归系数(b)的估计:最小二乘法(least square method)原理:保证各实测点至直线的纵向距离的平方和最小5直线回归方程的假设检验残差和剩余标准差残差(residual)是应变
20、量的实际观察值与估计值之间的差。 剩余标准差Sy.x,又称回归标准差,表示应变量的实际观察值对于回归直线的离散程度。应变量总离均差平方和(又称总平方和): 回归系数假设检验根据上述应变量总离均差的分解(fnji)可知,回归系数(方程)的检验可用方差分析方法(fngf)。也可用t检验(jinyn) Sb是回归系数的标准误6直线回归方程的应用预测(forecast)条件均值及其可信区间:当已知自变量的某一个取值时,将该取值代入回归方程中,便可求得对应的应变量估计值。该估计值是对给定自变量条件下的平均值的估计,是条件均值。要得到条件均值的可信区间,首先要计算该估计值的标准误。个体应变量值的容许区间
21、个体应变量值的标准误为控制:利用回归方程进行逆运算 7应用直线回归应注意的问题回归分析要有实际意义;应先绘制散点图,作初步判断;在自变量的变化范围内进行预测;自变量和应变量必须明确,不能混用。直线(zhxin)相关1直线(zhxin)相关的概念:双正态变量之间的直线(zhxin)相关关系2相关的几种情形:散点图 正相关;负相关;零相关(或称不相关)3相关程度:用直线相关系数客观地反映。相关系数的特点:没单位;在-11之间。4直线相关分析的步骤:绘制散点图,初步判断是否有可能存在直线相关关系;计算样本相关系数;对样本相关系数进行检验。5注意的事项:相关分析要有意义;结论只能局限在所测数据的范围内,不能任意外延;相关关系不是因果关系。6等级相关:适用的情形:非双正态资料;资料分布型未知;原始数据为等级资料。等级相关系数,和查表rs (n)比,得P和比非参数统计概念:对所统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025企业与个人之间的借款合同模板下载
- 2025公寓楼买卖合同(期房)
- 2025某某公司建筑拆除合同
- 上海烤鸭餐饮加盟合同标准文本
- 倒闭工厂转让合同标准文本
- 儿童拍摄合同标准文本
- 五证购房合同标准文本
- 化工工作者技能提升规划计划
- 兼职维修合同标准文本
- 如何通过培训提升年度工作绩效计划
- GB/T 8545-2012铝及铝合金模锻件的尺寸偏差及加工余量
- GB/T 6730.65-2009铁矿石全铁含量的测定三氯化钛还原重铬酸钾滴定法(常规方法)
- 威尼斯的小艇 省一等奖
- 企业人力资源管理师(四级)教材
- 教科版六年级下册科学第一单元测试卷(原卷版)
- 【教学课件】正确行使诉讼权利-示范课件
- 促进市级医院临床技能与临床创新三年行动计划
- 主观幸福感(GWB)量表
- 临床试验疑难问题解答
- Word版中国空白地图大全
- 玻璃纤维生产工艺流程培训
评论
0/150
提交评论