




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章:数据类型与描画统计第四章:数据类型与描画统计第一节:数据的类型数据的计量尺度: 1、定类尺度 2、定序尺度 3、定距尺度 4、定比尺度定类尺度n类别尺度、列名尺度是最粗略、计量层次最低的尺度;n只能区别事物是同类或不同类;n必需符合穷尽和互斥的要求。n 例:0表示女性,1表示男性定序尺度n顺序尺度,是对事物之间等级差或顺序差别的一种测度;n不仅有类别,这些类别之间是可以比较的;n不能进展加减乘除运算。n 例:一等品、二等品、三等品n 小学、初中、高中、大学及以上n 非常不赞同、不赞同、中立、赞同、非常赞同定距尺度n间隔尺度,不仅区分类型和排序,而且可以准确地指出类别之间的差距是多少;n
2、通常可以运用自然或度量衡单位作为计量尺度;n定距尺度的计量结果表现为数值;n可以进展加减运算。n 例:考试成果相差10分n 今天武汉的温度比广州的温度低6摄氏度定比尺度n比率尺度,与定距尺度属于同一层次,普通可不作区分,计量结果也表现为数值;n要求有一个绝对固定的“零点;n可以进展加减乘除运算。n 例:甲月薪3000,乙月薪1000,甲为乙的三倍数据的类型n定性数据质量数据:包括定类数据和定序数据。不能用数值表示,其结果表现为类别。n定量数据数量数据:包括定距数据和定比数据。可以用数值来表现,反映数量特征。n横截面数据:如2021武汉“8+1城市圈GDP增速;n时间序列数据:如2000-202
3、1武汉市GDP增速;n面板数据: 2000-2021武汉“8+1城市圈GDP增速。数据的预处置 数据对于原始数据,从完好性和准确性两方面加以审核。对于异常值的处置:假设是记录错误,那么予以纠正;假设是准确,那么保管。对于二手数据,弄清数据来源,审核时效性。n数据挑选:一些不符合要求的数据或有数据挑选:一些不符合要求的数据或有明显错误的数据剔除;将符合某种特定明显错误的数据剔除;将符合某种特定条件的数据挑选出来。条件的数据挑选出来。n例题:见例题:见Excel例数据挑选例数据挑选数据的显示n统计图:集中常用统计图引见n统计表:表头、行标题、列标题、数字资料。3W要求。表外附加数据来源变量的类型n
4、定类变量n定序变量n数字变量离散变量、延续变量n 多数情况下,变量指的是数字变量。第二节:目的和指数统计目的 包括总量目的、相对目的、平均目的总量目的:反映总体规模,如人口总数、GDP。相对目的:经济增长率、股价指数。平均目的:人均消费程度、某股票的10日均价统计指数n广义:凡是可以阐明景象变动的相对数都是指数;如方案完成相对数n狭义:用来阐明不能直接相加和不能直接对比的景象在不同时期的变动程度。如价钱指数统计指数的分类n反映对象范围的不同:个体指数、总指数;n按性质不同:数量目的指数产量指数、质量目的指数劳动消费率指数n按所采用基期的不同:定基指数、环比指数n按研讨的目的不同:动态指数、静态
5、指数。第三节第三节: :描画统计描画统计Topicsn集中趋势的度量nMean(均值),median(中位数),mode众数n离散的度量nRange变动幅度,variance and standard deviation规范差,coefficient of variation离散系数n外形n对称与不对称描画统计 集中趋势集中趋势均值均值中位数中位数众数众数几何平均数几何平均数 描画统计描画统计 离散程度离散程度 方差方差 规范差规范差离散系数离散系数均值 (算术平均)n数据的算术均值n样本均值n总体均值112niinXXXXXnn112NiiNXXXXNN样本规模总体规模n度量集中趋势的最常用
6、变量n遭到异常值的影响 0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 均值均值 = 5均值均值 = 6(continued)中位数n主要用于测度定序数据的集中趋势n不受异常值的影响n n n在一个排好序的数列中,中位数就是这个序列中间的数值:n假设N为奇数,中位数就是中间那个数的数值n假设N为偶数,中位数就是中间那两个数的平均值0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 中位数中位数= 5中位数中位数 = 5众数众数的值就是出现次数最多的数值不受异常数据的影响可用于数字型和定类型数
7、据能够没有众数也能够有多个众数0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 众数众数 = 90 1 2 3 4 5 6无众数无众数221NiiXNn是离散程度的最重要的度量目的n反映的是对均值的离散程度n样本方差: n总体方差:2211niiXXSn方差规范差n是最重要的分散程度度量目的是最重要的分散程度度量目的n表示对均值的分散程度表示对均值的分散程度n与原始数据是同一量纲与原始数据是同一量纲n样本规范差样本规范差:n总体规范差总体规范差:211niiXXSn21NiiXN规范差比较规范差比较均值均值 = 15.5 s = 3.338 11 12 13 14 15 1
8、6 17 18 19 20 2111 12 13 14 15 16 17 18 19 20 21Data BData A均值均值 = 15.5 s = .925811 12 13 14 15 16 17 18 19 20 21均值均值 = 15.5 s = 4.57Data CCoefficient of Variation离散系数n调查现对离散程度n普通用百分比表示(%)n表示相对于均值的离散情况n比较不同度量单位多组数据的离散程度n 100%SCVX离散系数比较n股票 A:n去年的均价 = $50n规范差 = $5n股票 B:n去年的均价 = $100n规范差 = $5n离散系数:n股票 A:n股票 B:$5100%100%10%$50SCVX$5100%100%5%$100S
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论