2、(第二章)数值变量统计描述.ppt_第1页
2、(第二章)数值变量统计描述.ppt_第2页
2、(第二章)数值变量统计描述.ppt_第3页
2、(第二章)数值变量统计描述.ppt_第4页
2、(第二章)数值变量统计描述.ppt_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、School of public health,Shandong University,数值变量资料的统一修订记述,Descriptive Statistics,Descriptive Statistics,变量关系,研究内容,统一修订,Descriptive Statistics 频数分布表(frequency table ),离散型数据(discrete data ) :指变量取值可以一个一个列举的数据。 例如,育儿年龄的妇女平均现有儿童的数量。 1998年某山地96名孕妇产前检查次数的资料如下: 0、3、2、0、1、5、6、3、2、4、1、0、6、5、1、3、3、4连续型数据(conti

2、nuity data):其变量取值为一个一个例如,人体的身高(cm )、体重(kg )等。 数值变量资料分类:Descriptive Statistics,表2-1 1998年某96名孕妇产前检查次数分布,离散型资料,Descriptive Statistics。 Descriptive Statistics,频率分布表,离散型资料,1998年某学校100名18岁健康女大学生(cm )资料连续型资料,1998年某学校100名18岁资料、描述性统计、频率分布表、频率表的制作:描述性统计、频率分布表、(1)极差(range ) :即最大值和最小值R84 57=27 (次/分) (2)确定组数、组距

3、:根据研究目的和样本含量n确定组数,通常分为1015组。 组距离=极差/组数,为方便起见,组距离为极差的十分之一,稍加调整。 27/10=2.7 3 (3)列出分组段。 第一个群组区段的下限必须略小于最小值,而最后一个群组区段的上限必须包含最大值。 (4)图像符号校正的数目:用图像符号方法将所有数据组合到每个段中,并且获得每个段的频率。Descriptive Statistics、频数分布表(frequency table )、频数表的制作:表2-3 130名健康成年男性脉搏(次/分)的频数分布表、Nf、descriics Descriptive Statistics、频数分布表(freque

4、ncy table ) 度数表的制作:表2-4 160名正常成年女性的血清甘油三酯(mmol/L ),descriptivestattive本例极差: R=1.770.51=1.26(mmol/L) (2)组数,确定组段和组距组距离=极差/组数,通常分为10-15个组,为方便起见,组距离参考极差的十分之一,稍加调整。 本例的i=R /10=1.26/10=0.1260.1。 (3)群段列表:第一个群段的下限应略小于最小值,最后一个群段的上限应包括最大值,而其他群段的上限应被忽略。 (4)标记计数:用标记法将全部数据汇总为各段,得到各段的频数。Descriptive Statistics、频率分

5、布表、频率表的创建:Descriptive Statistics、频率分布表、Descriptive Statistics 频数分布表(frequency table )、Descriptive Statistics、频数表的用途:记述1频数分布的类型和特征的descrippics (1)对称分布:如果各段的频数在中心位置的左右两侧大致对称,则认为该资料是对称分布描述1频数分布的类型和特征,是否是对称分布,Descriptive Statistics,频数分布表(frequency table ),(2)偏差分布:1)正态分布:右侧的分段数比左侧的分段数多,频数在右侧画尾。 2 )负偏差分布:

6、左侧的组段数比右侧的组段数多,频度向左侧拖尾。 度数表的用途:1度数分布的类型和特征、Descriptive Statistics、度数分布表(frequency table )、表23数据的度数分布特征:数据变异(离散)的范围为5784 (次/次),上下段的度数分布大致对称。 度数表的用途:1度数分布的类型和特征,Descriptive Statistics,度数分布表,度数表的用途:2容易找到一些特大或者特别小的可疑值,3更容易统一分析和处理, 描述性统计频率分布表、和数值变量数据的集中趋势指标,并且具体地使用平均指标体系描述一系列变量值的集中位置或平均级别一般平均为:算术平均(mean

7、)几何平均(geometric mean )中值(median )和百分位(percentile )最频值(mode )、desccd (cm )、描述性统计、描述数值变量数据的集中趋势、描述数值变量数据的集中趋势指标,例如测量、算术平均数Descriptive Statistics、数值变量数据的集中倾向(central tendency )、数值变量数据的与算术平均(arithmetic mean :简称平均(mean ) )、加权法:权重:各组次数(度数)的大小对应的标志值是平均如果每组的次数相同,即f1=f2=f3=fn,则加权算术平均值等于简单算术平均值。 描述数值变量数据的集中倾向

8、(central tendency )、Descriptive Statistics、数值变量数据的集中倾向(central tendency )指标、表2-2 130名健康成年男性脉搏(次)的Descriptive Statistics 简单算术平均:加权算术平均:特征:描述性统计,数值变量数据集中趋势,数值变量数据集中趋势指标对于任意两个变量x和y,它们代数和的算术平均数为两个描述Descriptive Statistics、数值变量数据的集中趋势、数值变量数据的集中趋势指标和算术平均数。 2 .平均数适用于描述单峰对称分布,特别是正态或近似正态分布数据的集中趋势。 意思:一组相同性质的观

9、察值的数量平均水平。 显示(整体) x (样本)校正:直接法、间接法、校正机特征: (X- X)=0估计误差之和为0。 应用:正态分布或近似正态分布注意:求平均值需要合理分组。 不那样做没有意义。 描述摘要:描述性统计、数值变量数据的集中趋势、数值变量数据的集中趋势指标、几何平均数,其中,在此示例中的算术平均数为22222 同一资料,Descriptive Statistics、数值变量数据的集中倾向、数值变量数据的集中倾向指标、几何平均数:记述变量对数值,其他对数(自然对数等)变换为相同的几何平均数, 描述几何平均数、描述统计、数值变量数据的集中趋势、数值变量的例子:血清8份的抗体效价分别为

10、133605、1:10、1336020、1336020 平均抗体价为:1:57、几何平均数、描述性统计、数值变量数据的集中趋势、数值变量数据的集中趋势、几何平均数、描述性统计描述“中心趋势”(central tendency )和“中心趋势”(central tendency )指数的“几何平均数”(geometric mean )、“应用条件:”(apply conditions:)变量值不能为0由于具有正值和负值注意事项:描述Descriptive Statistics,数值变量数据的集中倾向(central tendency ),数值变量数据的集中倾向(central tendency )指标,几何平均数(geomettics ),例如,抗体滴度,descriptics 数值变量资料的集中趋势(central tendency ),数值变量资料的集中趋势(central tendency )指标,例题:描述11个大鼠生存天数。中央值(median )和百分比(percentile )、中央值定义:按从小到大的顺序排列一组变量值,将位于顺序中央的变量值称为中央值(median,简称为m )。 1 .直接法:在例子数少的情况n是奇数的情况n是偶数的情况下,描述统计描述数值变量数据的集中倾向,描述数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论