




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三讲 统计描述与常用统计图Part I 数值变量的统计描述一、数值变量统计描述的内容数值变量(Numerical variable),数理统计里常被称为连续型随机变量,它的特点是有单位,其可能取值充满某个区间。对数值变量作描述性统计(Descriptive statistics)内容主要包括:1. 作频数表(frequency table)和直方图(histogram),了解资料的分布特征(对称or 偏态)2. 根据分布特征,选择适合的平均数指标,反映其集中趋势(Central tendency)3. 根据分布特征,选择适合的变异度指标,反映其离散趋势(Dispersion)例1 某校100
2、名健康男生的血清总蛋白含量(g/L),血清总蛋白.sav74.379.575.073.575.874.073.567.275.873.578.875.673.575.075.872.079.576.573.579.568.875.078.872.068.876.573.572.775.070.478.078.874.364.376.574.374.770.472.776.570.472.075.875.870.476.565.077.273.572.780.572.065.080.371.277.676.568.873.577.280.572.074.369.781.267.381.667.3
3、72.784.369.774.371.274.375.072.075.467.381.675.071.271.269.773.570.475.072.767.370.376.573.572.068.073.568.074.372.772.774.370.4例2 某年某地200名正常成人的血铅含量(g/100g),正常成人血铅含量.sav34444455555555556666666777777777777788888888888999999910101010101010101011111111111212121212121213131313131313131313131314141414141
4、41414141415151515151515161616161616171717171717171717171717181818181819191919191920202020202020202121212121222222222222232323242424242424252526262626262727282829293030313131313232323232323333363838394041414347505360三、SPSS编制频数表的方法1. 打开血清总蛋白.sav,里面有编号id、总蛋白x两列变量,有100个观测值,最小值为64.3,最大值为84.3,全距R =84.3-64
5、.3=20,如果频数表的组数为10的话,组距i=2。2. Transform->visual bander(可视化分组) -> variable to band:x -> banded variable: xx upper endpoints: exclude 3. 进入make cutpoints界面,first cutpoint location: 66,width: 2,则可知会有11个组段4. 选make labels,OK运行,SPSS提示会新产生一个分组变量5. 列频数表:Analyze -> Descriptive statistics -> fre
6、quencies -> xx,得以下结果 FrequencyPercentValid PercentCumulative PercentValid<66.033.03.03.066.0 - 67.955.05.08.068.0 - 69.988.08.016.070.0 - 71.91111.011.027.072.0 - 73.92525.025.052.074.0 - 75.92424.024.076.076.0 - 77.91010.010.086.078.0 - 79.977.07.093.080.0 - 81.966.06.099.084.0+11.01.0100.0To
7、tal100100.0100.0 6. 整理为符合规范的统计表表3.1 100名健康男生的血清总蛋白(g/L)的频数分布组段(1)频数(2)频率(3)累计频率(4)64.0 33.03.066.0 55.08.068.0 88.016.070.0 1111.027.072.0 2525.052.074.0 2424.076.076.0 1010.086.078.0 77.093.080.0 66.099.082.0 84.011.0100.0合计100100.0四、SPSS作直方图的方法Graphs -> histogram -> variable: xx -> displa
8、y normal curve,得出图3.1。注意该图的横轴取值为0到12,实际它代表的是表3.1的组段(1),Mean等计算结果也无实际意义。需要对该图作进一步编辑,得到符合规范的直方图(图3.2)。图3.1 SPSS结果总蛋白(g/L)频数图3.2 符合统计要求的直方图从频数表和直方图看出,健康男生的血清总蛋白资料属于对称分布资料,中间位置在7276g/L处,越往两侧,频数逐渐减少。练习1 用频数表和直方图描述例2的某年某地200名正常成人的血铅资料的分布特征。表3.2 200名正常成人的血铅值(g/100g)的频数分布组段(1)频数(2)频率(3)累计频率(4)3 8 13 18 23 2
9、8 33 3843 48 53 58 62合计200100.0二、反映集中趋势、离散趋势的常用指标英文中文含义计算公式适用资料Mean均数(期望)X / n对称分布,尤其是正态分布Median中位数M偏态分布Range全距R =Xmax-Xmin末端有确定值Interquartile Range四分位数间距Q = P75-P25偏态分布Variance 方差S2对称分布,尤其是正态分布Standard deviation标准差S对称分布,尤其是正态分布总体方差 样本方差 总体标准差 样本标准差 练习2对血清总蛋白资料,用Analyze-> Descriptive statistics -
10、>frequencies命令,计算均数、中位数、第25分位数、第75分位数、方差、标准差、四分位间距等指标。(注:不列频数表)练习3对血清总蛋白资料,用Analyze-> Descriptive statistics ->descriptives命令作分析,在假定X服从均数为,标准差为的正态分布的情况下,对X进行标准化处理,得出ZX,ZX将服从均数为0,标准差为1的标准正态分布。如果和值已知,如果样本量n较大,练习4对雇员数据employee data.sav,用Analyze-> Descriptive statistics ->explore命令作分析,描述不
11、同性别雇员的平均受教育年数educ和标准差。 某公司雇员的受教育情况性别人数均数(年)标准差(年)男25814.43.0女21612.42.3合计47413.52.9Part II 分类变量的统计描述一、分类变量的概念分类变量(Categorical variable),数理统计里被称为离散型随机变量。根据取值个数分为二分类、多分类变量。多分类变量又可进一步分为无序、有序多分类变量。举例:employee data.sav,性别、种族、职业类别、年龄组、按受教育年数分组。二、SPSS描述分类变量资料1. 用Descriptive statistics -> frequencies描述单个
12、变量2. 用Descriptive statistics -> crosstabs描述两个变量,得出二维列联表,如四格表、R×C表。如果要同时描述三个及以上的变量,对应的就是三维甚至高维列联表。3. 对构成比资料作圆图(pie),对两组或多组率比较的资料作直条图(bar),对随时间连续变化的资料作线图(line)。练习5 描述474名观测的性别构成,并输出统计表和统计图步骤:analyze ->descriptive statistics -> frequencies->gender 某公司雇员的性别构成性别人数构成(%)男25854.4女21645.6合计474100.0练习6 对全部观测按性别gender与工作类别jobcat作交叉表crosstabs步骤:analyze ->des
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 展示自己职业风采课件
- 2023年广东省初中地理中考试题及答案
- 试卷教学课件
- 车辆无偿支持公益项目使用合同
- 股票市场投资策略研究及定制化服务协议
- 金属矿产资源采矿权质押借款合同范本
- DJ音乐活动策划艺人聘用合同
- BPMF教学课件模板
- 田字格竖弯钩教学课件
- 2024-2025学年湖南师大附中高一下学期第二次大练习生物试题及答案
- 2024年安徽普通高中学业水平选择性考试化学试题及答案
- 江苏省淮安市淮安中学2025届数学高一下期末教学质量检测试题含解析2
- 《取水许可核验报告编制导则(试行)(征求意见稿)》
- 水质检测员年终总结
- 老年消防知识讲座
- Filemaker数据库使用指南知识分享
- 国开《Windows网络操作系统管理》形考任务四
- 铁道概论(第八版)佟立本主编
- 2024年海关与报关行业培训资料
- 《运动生理学》期末考试复习题库(含答案)
- 学生人力资源(董克用)复习题汇总
评论
0/150
提交评论