版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九讲基本(jīběn)统计分析第一页,共17页。我们利用(lìyòng)MATLAB中的函数来计算正态分布的分布函数、概率密度函数值、做出密度函数曲线、分位数.在MATLAB中计算上述(shàngshù)分布函数的命令为:P=NORMCDF(x,mu,sigma)DefaultvaluesforMUandSIGMAare0and1respectively.例1已知试求:解:normcdf(3,2,0.5)=0.9772;normcdf(2,2,0.5)-normcdf(1,2,0.5)=0.47721.计算(jìsuàn)分布函数与概率密度函数值:2.做出密度函数曲线、求分位数第二页,共17页。已知X的均值和标准差及概率(gàilǜ)p=P{X<x},求x的命令为:X=NORMINV(P,MU,SIGMA)例2.X~N(1,0.04),p{X<x}=0.6827求x解:x=norminv(0.6827,1,0.2)=
1.0951NORMSPEC([a,b],MU,SIGMA)用于做出随机变量在区间[a,b]上的正态密度(mìdù)曲线例3.若X~N(2,4),作出X在[-1,3]上的曲线(qūxiàn)解:normspec([-1,3],2,2)图形如右图所示(图7.1)第三页,共17页。二.数据(shùjù)特征设是取自总体X的一个简单随机样本,在n次抽样以后得到样本的一组观测值我们通过对数据的分析研究可以得到总体X的有关信息,在MATLAB中有专门的函数分析数据特征,如下表所示.位置特征MATLAB函数变异特征MATLAB函数算术平均mean极差range中位数median方差var切尾平均trimmean标准差std几何平均geomean四分位极差iqr调和平均harmmean平均绝对偏差mad第四页,共17页。例4.已知数据:4593626245425095844337488155056124524349826407425657065936809266531644877346084281153593844527552513781474388824538862659775859755649697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851计算(jìsuàn)该数据特征.解:a=[4593626245425095844337488155056124524349826407425657065936809266531644877346084281153593844527552513781474388824538862659775859755649697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851];b=a(:);%将矩阵(jǔzhèn)变成数列T=[mean(b),median(b),trimmean(b,10),geomean(b),harmmean(b),range(b),var(b),std(b),iqr(b),mad(b)]第五页,共17页。位置特征计算结果变异特征计算结果算术平均600极差1069中位数599.5方差38663.03切尾平均600.64标准差196.629几何平均559.68四分位极差243.5调和平均499.06平均绝对偏差150.86计算结果如下(rúxià):例5.已知数据:1,1,1,1,1,1,100;计算(jìsuàn)其数据特征,由此你有何发现?解:x=[1,1,1,1,1,1,100];y=[mean(x),median(x),geomean(x),harmmean(x),trimmean(x,25);range(x),var(x),std(x),iqr(x),mad(x)]第六页,共17页。二者峰度都小于3属于平阔峰.从图7.Q1=(x(25)+x(26))/2=485.y=[42,54,60,42,1.或[n,x]=hist(data,nb),变异系数用于刻画数据的变化大小,不同(bùtónɡ)指标的变异系数常用来计算客观性权重.或[n,x]=hist(data,k),直方图与概率(gàilǜ)纸检验函数偏度系数s等于3阶中心矩与标准差的3次幂的比,用于刻画数据分布的对称性,当s>0时称正偏,当s<0时称负偏,当s接近于零时,可以认为分布是对称的.位于(wèiyú)以外的点第九讲基本(jīběn)统计分析P=NORMCDF(x,mu,sigma)normcdf(2,2,0.计算结果如下(rúxià):b=a(:);%将矩阵(jǔzhèn)变成数列为了直观地了解随机变量的分布(fēnbù)特征,如对称性,峰值等,直方图是广泛使用的方法.计算结果为:y=15.14311.93071.16471991400.137.418024.245如果例5的数据全部为1,则各种(ɡèzhǒnɡ)平均值都应等于1,所有的变异特征全部为零,由于有一个异常值100,于是导致上述的一些特征受影响(不稳健),但是中位数、切尾平均与四分位极差没有改变,它们对异常值是稳健的.三.异常(yìcháng)值的判别在探索性数据分析时,有一种(yīzhǒnɡ)判别异常值的简单方法,首先计算数据的下、上截断点,数据中小于下截断点的数据为特小值,大于上截断点的数据为特大值,二者都是异常值.1.数据的下、上截断点第七页,共17页。计算上、下截断点的公式(gōngshì)如下:其中,R为四分位极差,分别称为下四分位数与上四分位数.对于0≤p<1,和样本容量为n的样本其次序(cìxù)统计量记为:于是计算样本的P分位数的公式为:显然(xiǎnrán)第八页,共17页。例6.判别(pànbié)例4中的数据有无异常值.解:由x=sort(a(:))得到(dédào)原数据从小到大的次序统计量,因为np为整数,故有:Q1=(x(25)+x(26))/2=485.5,Q3=(x(75)+x(76))/2=729,R=243.5于是,Q1-1.5R=120.25,Q3+1.5R=1094.25,由此可知:80,120,1153是异常值.2.位于(wèiyú)以外的点若数据服从正态分布,则称位于以外的点
为异常点.第九页,共17页。四.矩统计(tǒngjì)量在MATLAB中给出了计算矩统计量、峰度、偏度和变异系数的函数命令(mìnglìng),如下表所示:名称n阶中心矩峰度系数偏度系数变异系数命令moment(x,n)kurtosis(x)Skewness(x)Std(x)./abs(mean(x))其中,x为数据,n为阶数,若x为矩阵可得矩阵各列的矩、峰度、偏度和变异系数,注意(zhùyì)计算变异系数的公式应为:Std(x)./abs(mean(x))(同维向量应该点除).偏度系数s等于3阶中心矩与标准差的3次幂的比,用于刻画数据分布的对称性,当s>0时称正偏,当s<0时称负偏,当s接近于零时,可以认为分布是对称的.峰度系数k等于4阶中心矩与标准差的4次幂的比,它反映了分布曲线的陡缓程度,正态分布的峰度为3,若k>3则表明数据分布有较厚的尾部.第十页,共17页。变异系数用于刻画数据的变化大小,不同(bùtónɡ)指标的变异系数常用来计算客观性权重.例7.下表给出了15种资产的收益率ri(%)和风险(fēngxiǎn)损失率qi(%),计算峰度与偏度.Siri(%)qi(%)Siri(%)qi(%)S19.642S933.653.3S218.554S1036.840S349.460S1111.831S423.942S1295.5S58.11.2S133546S61439S149.45.3S740.768S151523S831.233.4第十一页,共17页。解:x=[9.6,18.5,49.4,23.9,8.1,14,40.7,31.2,33.6,36.8,11.8,9,35,9.4,15];y=[42,54,60,42,1.2,39,68,33.4,53.3,40,31,5.5,46,5.3,23];sx=skewness(x)=0.4624,kx=kurtosis(x)=1.8547,sy=skewness(y)=-0.4215,ky=kurtosis(y)=2.2506从计算结果可知(kězhī):收益率是正偏,而风险损失率为负偏;二者峰度都小于3属于平阔峰.五.直方图与概率(gàilǜ)纸检验函数1.直方图:为了直观地了解随机变量的分布(fēnbù)特征,如对称性,峰值等,直方图是广泛使用的方法.格式:hist(data,k).说明:data是原始数据,该命令将区间(min(data),max(data))分成k等份,并描绘出频数直方图,k的缺省值为10.第十二页,共17页。如果需要(xūyào)事先给出小区间,则将区间的中点存放在向量nb然后用命令:[n,x]=hist(data),或[n,x]=hist(data,k),或[n,x]=hist(data,nb),其中,n返回k个小区间的频数,x返回小区间的中点.2.MATLAB中的概率(gàilǜ)纸检验函数.格式:normplot(data)%如果数据data服从正态分布,则做出的图形基本上都位于一条直线上.weibplot(data)%如果数据data服从威布尔分布,则做出的图形基本上都位于一条直线上,例8.作出例4数据的直方图,该数据服从正态分布还是(háishi)威布尔分布?第十三页,共17页。解:输入(shūrù)命令hist(a(:),30)得到图7.2从图7.2所示的直方图发现数据(shùjù)比较接近于正态分布,我们用命令normplot(a(:))进行检验.从图7.3中可见数据点基本上都位于(wèiyú)直线上,故可认为该数据服从正态分布,由于已经计算出该数据的均值为600,标准差为196.629,所以数据服从图7.2图7.3第十四页,共17页。正态分布的检验(jiǎnyàn):1.大样本(yàngběn)h=jbtest(x),h=0,接受(jiēshòu)正态分布,h=1拒绝正态分布2.小样本h=lillietest(x),h=0,接受正态分布,h=1拒绝正态分布第十五页,共17页。作业:1.根据(gēnjù)下表计算七项指标的均值、方差、偏度与峰度表7.6各地区“三资”工业企业主要经济效益指标(2001年)工业增加值率总资产贡献率资产负债率流动资产周转次数成本费用全员劳动生产率产品
销售率(次/年)利润率(元/人/年)全国26.199.8354.871.895.857591397.64北京22.4212.2359.972.015.6313288797.94天津23.7511.1750.531.898.159734299.01河北28.808.1962.901.675.505080198.07山西34.554.7568.801.480.507291094.50内蒙古30.528.2343.410.887.2562099100.88辽宁26.708.3250.321.915.028277996.70吉林29.4625.2952.292.6513.7516123396.52黑龙江31.946.5570.181.003.407514392.41上海26.2310.4348.391.687.0912231099.16江苏25.0710.0657.532.055.238888397.66浙江23.8011.2555.092.006.685601697.01安徽31.659.2756.431.735.648146098.97福建26.927.2454.601.983.935581696.79江西27.539.2758.141.604.095225698.03山东29.6311.2357.062.046.236375597.36湖南33.089.4755.591.248.298028796.43第十六页,共17页。工
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版冷链物流车辆租赁合作协议2篇
- 安徽事业单位二零二五年度聘用合同范本3篇
- 2025年度个人股权质押股权分割合同(公平版)4篇
- 2025版房地产开发商逾期交房违约责任担保合同4篇
- 二零二五版绿色家居墙面涂料采购与应用合同3篇
- 二零二五版毛竹林资源承包与加工利用合同2篇
- 2025年度宅基地使用权流转纠纷处理服务合同4篇
- 2025年度电子商务平台运营维护外包服务合同协议2篇
- 2025年度别墅铜门定制与市场推广活动合同3篇
- 2025年度轮胎销售区域保护与市场垄断协议4篇
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 2024年城市轨道交通设备维保及安全检查合同3篇
- 【教案】+同一直线上二力的合成(教学设计)(人教版2024)八年级物理下册
- 湖北省武汉市青山区2023-2024学年七年级上学期期末质量检测数学试卷(含解析)
- 单位往个人转账的合同(2篇)
- 科研伦理审查与违规处理考核试卷
- GB/T 44101-2024中国式摔跤课程学生运动能力测评规范
- 高危妊娠的评估和护理
- 2024年山东铁投集团招聘笔试参考题库含答案解析
- 2023年高考全国甲卷数学(理)试卷【含答案】
- 数独题目A4打印版无答案
评论
0/150
提交评论