R软件 数据的统计量描述_第1页
R软件 数据的统计量描述_第2页
R软件 数据的统计量描述_第3页
R软件 数据的统计量描述_第4页
R软件 数据的统计量描述_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验一数据的统计量描述实验目的初步了解数据的特点、分布形状;熟悉R软件的程序结构;学会使用R软件 计算数据的描述统计量。二、实验内容通过R软件读入或输入数据,并能够计算数据集的均值、中位数、分位数、 方差、标准差、变异系数、偏度系数以及峰度系数。三、准备知识位置的度量所谓位置的度量就是那些用来描述数据集中趋势的统计量。常用的有均值、 众数、中位数、百分位数等。平均数(Mean):、=祝中位数(Median): 一组数据按从小到大(或从大到小)的顺序依次排列, 处在中间位置的一个数,即当n为奇数时当n为偶数时中位数描述的是数据的中心位置不受数据分布的影响,具有稳健性,是数据分析 中相当重要的统计

2、量。众数(Mode):在一组数据中,出现次数最多的那个数据。百分位数:百分位数是中位数的推广。将数据按从小到大排序后,对 于OWpVL它的分位点定义为lX(np + D侦(X(np) +X(np + 1)当np不是整数时当n是整数时其中np为np的整数部分。离散趋势度量表示数据分散或变异程度的特征统计量,常用的有方差、标准差、变异系数 等样本方差s (Sample Variance):描述数据取值分散性的一个度量,即、2 =如毋_幻顶_1)1=1 /样本标准差S (Standard Devi at ion):样本方差的开方,即s = Vs7变异系数(CV):变异系数是刻画数据相对分散性的一种度

3、量CV = 100 X z (%)X是一个无量纲的量,用百分数表示。分布形状的度量数据分布形状的度量包括偏度系数和峰度系数。偏度系数:计算公式为n281 = (nl)(n2)s3Xi -x)3 =(n-l)(n-2)s3i = ls是标准差,P3是样本三阶中心矩,即R3=;S1=l(Xi-X)3.偏度系数是刻画数 据的对称性指标。关于均值对称的数据偏度系数为0.数据左偏时,对称系数为 正,右偏时为负。峰度系数:计算公式= n(n + l 寸._ -)4 _ 3 (n - 贵跋 (n 1)(n 2)(n 3)s42Lj X1 X (n 2)(n 3)/(n+Dm o (n-1)2(n l)(n

4、2)(n 3)s4 (n 2)(n 3)s是标准差,回是样本四阶中心矩,即P3=;SP=l(Xi-X)4.来自正态总体的数 据峰度近似为0;如果样本数据的峰度大于0,则该数据的总体分布比正太分布 的尾部更分散;如果一个样本数据的峰度小于0,则总体分布较正太分布更集中。四、实验背景某灯泡生产厂商测试某种新型灯泡的燃烧寿命,如下数据表格列出了 200个灯泡样本的可使用小时数。10773689776799459985779986365666279866874647978797786897674859278887710388636888817470856165817562947193616562926

5、5646683707866669477636675687661717791967564767277817185995992946268728567878084936976897573815465718084886261618265986371621166588738068788972586982726473759062897171747085848363926881627983708177728467595873837376907871101784359677465828679746686968977608784757751456310259778368726792898296计算数据集的均值

6、、中位数、分位数、方差、标准差、变异系数、偏度系数 以及峰度系数?五、实验过程1.读入数据x sort(x,decreasing=F)14345515457585859196262626262626262376565656565656565556868686868686868737171717172727272917474747475757575109777777777777777812779798080808181811458383848484848485163888888888889898918192939394949494965959596061616161616363636363646

7、46464666666666667676767697070707071717171727373737373737474757676767676767777787878787979797979818182828282838383858585868686868787898990909192929292969798989899 101102 103199 107 116求中位数median(x)1 75.5求分位数quantile(x)0%25%50%75%100%43.00 66.75 75.50 84.00116.00quantile(x,0.05)5% 59方差、标准差var(x)1 145.

8、4548sd(x)1 12.06046cv=100*sd(x)/mean(x); cv1 15.8586data_outline(x)N Mean VI std_dev Median std_mean CV CSS USS R1 200 76.05 145.4548 12.0604675.5 0.8528035 15.8586 28945.5 1185666 73R1 Skewness Kurtosis117.25 0.2770275 0.03557146六、实验总结七、练习实验附录:dataoutline -fiinction(x)(n- length(x)m - mean(x)v - var(x)s - sd(x)me - median(x)cv- 100*s/mcss v sum(xm)/2)uss - siun(xA2)R - max(x)-niin(x)R1 - quantile(x,3/4)quantile(x,l/4)sm - s/sqrt(n)gl - n/(n-l)*(n-2)*sum(x-m)A3)/sA3g2 - (n*(n+1 )/(n-1)*(n-2)*(n-3)*sum(x-m)A4)/sA4-(3*(n-1)A2)/(n-2)*(n-3)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论