




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
连续变量的统计(tǒngjì)描述与参数估计第一页,共39页。基本概念复习(fùxí)总体(population)与样本(yàngběn)(sample)◆总体:根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。◆样本(yàngběn):是从总体中抽取的部分个体◆由于直接研究总体经常是不可能的,故而大多采用抽样研究,即通过抽取样本(yàngběn)来推断总体--统计推断第二页,共39页。参数和统计量◆参数:刻画总体特征的指标称为总体参数。用来确定某一分布的特征;如总体均数,总体分布往往是已知的◆统计量:刻画样本特征的统计描述(miáoshù)指标称为统计量。由观察资料计算出来的量;可以用来近似的反映总体参数◆统计的任务:由样本估计总体,由样本统计量估计总体参数第三页,共39页。一.连续变量的统计描述(miáoshù)的工具(一)频数表Frequency直观的方法:分布类型分布特征看出集中趋势与离散趋势发现特大与特小值便于进一步计算统计指标(zhǐbiāo)和做统计处理第四页,共39页。(二)统计指标(zhǐbiāo)集中趋势Centraltendency均数mean、中位数median、众数mode等离散趋势Dispersiontendency全距Range、方差Variance、标准差std.deviation、百分位数、变异系数CV等第五页,共39页。分布特征Distributiontendency偏度系数(xìshù)Skewness、峰度系数(xìshù)Kurtosis等其他在SPSS中出现的指标M统计量
第六页,共39页。(三)统计表(四)统计图直方图(Histogram)
箱式图(boxplot)
茎叶图(stem-and-leaf)
QQ图第七页,共39页。1.集中(jízhōng)趋势的描述指标算术平均数(arithmeticmean)◆简称均数(mean),有总体均数(PopulationMean,)和样本均数之分◆适用于对称分布,特别是正态分布的资料,不适用于偏态分布的资料。◆对于(duìyú)严重偏态分布的资料,均数将失去它应有的代表性。第八页,共39页。中位数(Median)◆是一组观察(guānchá)值的位置平均数,◆用于描述偏态分布资料的集中位置,它不受两端特大、特小值的影响,当分布末端无确切(quèqiè)数据时也可计算。◆对于没有分组的原始数据,必须先将标志值按大小(dàxiǎo)顺序排序,第九页,共39页。截尾均数(trimmedmean)◆数据排序后按照一定(yīdìng)比例去掉两端的数据求均数◆适用于两端有极端值的资料◆常用5%截尾均数第十页,共39页。几何均数(geometricmean,G)◆适用于呈倍数关系的等比资料或对数正态分布的资料,尤其是对数正态分布的计量资料◆应用中应注意(zhùyì)观察值不能同时有正有负◆同一资料算得的几何均数小于算术均数第十一页,共39页。(1)直接(zhíjiē)法第十二页,共39页。众数(mode)◆样本数据中出现频次(píncì)最高的数字◆适用于单峰对称的数据,反映出现频次(píncì)最高的数据情况调和均数(H)◆观察值倒数的均数的倒数,较少使用第十三页,共39页。3组同龄男孩体重(KG)如下◆甲组2628303234◆乙组2427303336◆丙组2629303134◆均数相等,但各组差异不同◆对连续变量的描述,需要将集中趋势和离散趋势结合起来(qǐlái),才能对其分布有全面的认识。2.离散趋势的描述(miáoshù)指标第十四页,共39页。全距(Range,R)◆又称极差,即最大和最小观察值之间的间距,◆用全距描述资料(zīliào)的离散程度简单明了,但它不能反映观察值的整个变异度,样本的例数越多,极差越大,越不够稳定。◆所以一般只用于预备性检查,大致了解数据的分布范围。第十五页,共39页。方差(fānɡchà)(variance)与标准差(standarddeviation)◆离均差平方和(sumofsquaresofdeviatonsfrommean,SS):可用来描述资料的离散程度。◆SS的均数(即方差(fānɡchà))不受观察值个数的影响,用来描述资料的离散程度更好。第十六页,共39页。◆实际中,得到的常是样本资料,总体(zǒngtǐ)均数未知,只能用样本均数代替,得到样本方差S2◆n-1为自由度(degreeoffreedom)第十七页,共39页。◆因方差(fānɡchà)的单位是原单位的平方,所以使用仍不方便。方差(fānɡchà)的算术平方根,即标准差(standarddeviation)是一个更好的指标。◆标准差也有总体标准差和样本标准差之分:第十八页,共39页。◆适用范围:◆方差和标准差适合于对称分布,特别是正态分布及近似正态分布资料◆标准差可用于描述变量值的离散程度,与均数结合还可描述资料的分布情况,此外(cǐwài)还可用于求参考值范围和计算标准误。第十九页,共39页。◆描述(miáoshù)分布偏离正态分布的程度,即偏离对称的程度。偏(斜)度(Skewness):偏度系数(xìshù)◆Skewness>0:正偏或右偏(长尾在右边(yòubian))Skewness<0:负偏离左偏(长尾在左边)第二十页,共39页。◆描述分布(fēnbù)变量取值分布(fēnbù)形态陡缓程度的统计量。峰(峭)度(Kurtosis)峰度系数(xìshù)◆Kurtosis>0分布(fēnbù)集中趋势强Kurtosis<0分布(fēnbù)离心趋势强第二十一页,共39页。百分位数(percentile)◆百分位数是一个位置指标,Px表示是资料分布数列的百等份分割值。◆中位数是特定的百分位数,即P50◆用于描述样本或总体观察值序列某百分位置的水平,应用(yìngyòng)中注意,样本例数不够多时,两端的百分位数不稳定。◆还用于确定参考值范围(referencerange)。第二十二页,共39页。四分位数间距(quartileinterval)◆四分位数是特定的百分位数,其中P25为下四分位数QL,P75为上四分位数Qu。◆Q=Qu-QL◆四分位数间距比极差稳定,但仍未考虑(kǎolǜ)每个观察值的变异度。◆更适用于偏态分布的资料,特别是末端无确切数据时第二十三页,共39页。基本(jīběn)分析结果:变异系数(coefficientofvariance,CV)◆百分位数是一个位置指标,Px表示是资料分布数列的百等份分割值。Outliers复选框:输出五个最大值与五个最小值。可以用来近似的反映总体参数百分位数(percentile)集中(jízhōng)趋势的描述指标◆同一资料算得的几何均数小于算术均数◆样本数据中出现频次(píncì)最高的数字◆同一资料算得的几何均数小于算术均数Skewness<0:负偏离左偏(长尾在左边)◆Q=Qu-QLPercentiles复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。◆用全距描述资料(zīliào)的离散程度简单明了,但它不能反映观察值的整个变异度,样本的例数越多,极差越大,越不够稳定。Kurtosis<0分布(fēnbù)离心趋势强变异系数(coefficientofvariance,CV)◆当比较多组资料的变异度,均数相差悬殊时使用(shǐyòng)◆资料的单位不同时使用(shǐyòng)◆实际上是标准差占均数的百分比例。第二十四页,共39页。二.连续变量的参数估计(90页)1.参数(cānshù)的点估计:◆用一个适当(shìdàng)的样本统计量作为参数的估计量,并计算出估计值;◆矩估计;◆极大似然估计法;◆稳健估计值:M估计(Explore过程会输出)第二十五页,共39页。◆标准误:描述(miáoshù)参数估计值与真实值的距离的统计量;◆总体均数的100(1-α)%可信区间;◆Explore过程会输出标准误和可信区间2.区间(qūjiān)估计第二十六页,共39页。三.SPSS统计描述(miáoshù)的模块用于两个(liǎnɡɡè)连续变量计算相对比指标分类(fēnlèi)变量资料的统计描述及一般的统计检验(卡方检验)第二十七页,共39页。例:以问卷调查数据(shùjù)student.sav为例来阐述各过程Explore过程分析统计描述指标参数估计百分位数和极端值统计图Frequencies过程Descriptive过程:生成Z值(将原变量变换为标准正态分布下的得分,选Descriptive左下角的Savestandardizedvalueasvariables)第二十八页,共39页。1.Explore过程主要用于对连续型资料的性质、分布特点等完全不清楚时的探索性分析;可计算许多描述统计量,给出各种(ɡèzhǒnɡ)统计图,并进行简单的参数估计。Statistics子对话框plot子对话框Option子对话框第二十九页,共39页。对男生和女生的身高进行(jìnxíng)描述需要分析(fēnxī)的变量分组变量(biànliàng)第三十页,共39页。第三十一页,共39页。Statistics子对话框Descriptives复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误及指定的均数可信区间。M-estimators复选框:作中心趋势的粗略最大似然稳健估计(gūjì),输出四个不同权重的最大似然估计(gūjì)值。Outliers复选框:输出五个最大值与五个最小值。Percentiles复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。第三十二页,共39页。plot子对话框◆Boxplots单选框组:确定箱式图的绘制方式按组别分组绘制(Factorlevelstogether),不分组绘制(Depentendstogether)不绘制(None)◆Descriptive复选框组:茎叶图(Stem-and-leaf)和直方图(Histogram)。◆Normalityplotswithtest复选框:正态分布图和正态分布的检验。◆Spreadvs.LevelwithLeveneTest单选框组:有分组变量(biànliàng)时,绘制水平图,设置变量(biànliàng
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年幼儿园秋季月工作方案
- 高三下学期《中等学生如何考上一本大学》主题班会课件
- 2025年电压隔离车专用互感器项目可行性研究报告
- 2025年燃重柴油燃烧器项目可行性研究报告
- 上海邦德职业技术学院《仪器分析实验》2023-2024学年第二学期期末试卷
- 林芝地区墨脱县2025届数学三下期末达标检测试题含解析
- 华东政法大学《无机合成化学》2023-2024学年第二学期期末试卷
- 江苏电子信息职业学院《物联网信息安全》2023-2024学年第二学期期末试卷
- 内蒙古呼和浩特实验中学2024-2025学年初三3月月考物理试题(解析版)含解析
- 晋中信息学院《钢结构设计原理D》2023-2024学年第二学期期末试卷
- 2024能源互联网智慧电力云服务平台建设规范及标准
- 静电喷涂培训
- 四年级下册道德与法治(教学设计+素材)第8课《这些东西哪里来》(第二课时)
- 高中英语外研版必修第二册Unit 3 Period 6 Writing-Writing a sports story
- 高职旅游专业《旅行社经营管理》说课稿
- DB65-T 4785-2024 耕地质量等级调查评价技术规范
- 心血管麻醉思考与实践读书随笔
- 2024年个人廉洁自律述职报告(三篇)
- 小学家长会-做好孩子手机管理主题班会课件
- 2023年桂林市临桂区增设特岗教师招聘笔试环节的考试真题
- 作家雨果课件
评论
0/150
提交评论