单变量统计描述分析_第1页
单变量统计描述分析_第2页
单变量统计描述分析_第3页
单变量统计描述分析_第4页
单变量统计描述分析_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单变量统计描述分析第一节统计表与统计图什么就是分布?用统计表与统计图来表示分布。P21变量取值要注意得问题:1、取值要穷尽。2、取值要互斥。P22什么就是变量?变量就就是随时可以变化得量;变量意味着可以取不同得值。变量对应得就是常量;具体到调查中,可以把变量理解为问卷中得一道题目所获得得数据,如果就是常量得话,我们有没有必要去调查呢?统计表

(频数分布表、百分比分布表)制作统计表得要求?1、要有表号、表头、标识行、主体行、表尾2、表得两端不封口3、简单明了,中间不画线4、百分比分布表要有样本总数

一般用得比较多得就是百分比分布表,因为百分比分布表可以还原成频数分布表P25统计表

(频数分布表、百分比分布表)怎么样制作统计表?定类变量定序变量定距变量P24-29统计图怎么样制作统计图?用EXCEL定类变量:饼图(圆瓣图),条形图定序变量:条形图定距变量:直方图、折线图P30-33分布图得分析对一个分布图,我们应该关注哪些呢?峰点对称性:就是否就是正态分布U形曲线与J形曲线P37-39第二节集中趋势测量法集中趋势一组数据向其中心值靠拢得倾向与程度测度集中趋势就就是寻找数据一般水平得代表值或中心值不同类型得变量用不同得集中趋势测度值低层次数据得集中趋势测度值适用于高层次得测量数据,反过来,高层次数据得集中趋势测度值并不适用于低层次得测量数据选用哪一个测度值来反映数据得集中趋势,要根据所掌握得数据得类型来确定集中趋势测量法一般情况下:定类变量:众数Mo定序变量:中位值Md定距变量:平均值大家有疑问的,可以询问和交流可以互相讨论下,但要小声点众数众数(概念要点)集中趋势得测度值之一出现次数最多得变量值不受极端值得影响可能没有众数或有几个众数主要用于定类变量,也可用于定序变量与定距变量众数(计算方法)P40众数

(众数得不唯一性)无众数

原始数据:10591268一个众数

原始数据:659855多于一个众数

原始数据:252828364242中位值中位值(概念要点)集中趋势得测度值之一排序后处于中间位置上得值Me50%50%不受极端值得影响主要用于定序变量,也可用定距变量,但不能用于定类变量中位值(位置得确定)未分组数据:组距分组数据:21+=N中位值位置2N=中位值位置中位值得计算公式(计算公式)未分组数据得计算公式分组数据得计算公式P44均值均值(概念要点)1、 集中趋势得测度值之一2、 最常用得测度值3、 一组数据得均衡点所在4、 易受极端值得影响5、用于定距变量,不能用于定类变量与定序变量均值(计算公式)设一组数据为:X1,X2,…,XN简单均值得计算公式为设分组后得数据为:X1,X2,…,XK(组中值)相应得频数为:n1,n2,…,ni分组均值得计算公式为åå===++++++=KiiKiiiNNNnnXnnnnXnXnXX11212211LL&均值(数学性质)1、 各变量值与均值得离差之与等于零

2、各变量值与均值得离差平方与最小众数、中位数与均值得比较变量类型与集中趋势测度值表

变量类型与所适用得集中趋势测度值变量类型定类变量定序变量定距变量适用得测度值※众数※中位数※均值—众数众数——中位数分布得形状与

众数、中位数与均值得关系对称分布

均值=中位数=众数左偏分布均值

中位数

众数右偏分布众数

中位数

均值高层次变量可以用低层次变量得测量方法但统计分析中,更多得就是用均值。对于偏态得分布,应使用中位值作为集中趋势。只有单峰与基本对称得图形,用均值作为集中趋势才就是合理得。P47第三节离散趋势测量法离散趋势数据分布得另一个重要特征离散趋势得各测度值就是对数据离散程度所作得描述反映各变量值远离其中心值得程度,因此也称为离中趋势从另一个侧面说明了集中趋势测度值得代表程度不同类型得数据有不同得离散程度测度值离散趋势测量法一般情况下:1、定类变量:异众比率2、定序变量:四分位差3、定距变量:方差及标准差(重点就是未分组数据得求法)异众比率异众比率1、 离散程度得测度值之一2、 非众数组得频数占总频数得比率3、 计算公式为P49

4、用于衡量众数得代表性四分位差四分位差四分位差1、 上四分位数与下四分位数之差

Q

=Q75–Q252、 离散程度得测度值之一3、 反映了中间50%数据得离散程度4、不受极端值得影响5、用于衡量中位数得代表性四分位值:排序后处于25%与75%位置上得值Q25Q50Q7525%25%25%25%方差与标准差方差与标准差(概念要点)1、 离散程度得测度值之一2、 最常用得测度值3、 反映了数据得分布4、反映了各变量值与均值得平均差异5、根据总体数据计算得,称为总体方差或标准差;根据样本数据计算得,称为样本方差或标准差、总体方差与标准差(计算公式)组距分组数据:未分组数据:组距分组数据:方差得计算公式标准差得计算公式åå==-=KiiKiiinnXX1122)(&såå==-=KiiKiiinnXX112)(&s方差就是观察值与其均值之差得平方与除以全部观察总数N。未分组数据:异众比率、四分位差与方差/标准差得比较变量类型与离散趋势测度值表

变量类型与所适用得离散趋势测度值变量类型定类变量定序变量定距变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论