大学应用统计学经典课件04-数据分布特征的测度_第1页
大学应用统计学经典课件04-数据分布特征的测度_第2页
大学应用统计学经典课件04-数据分布特征的测度_第3页
大学应用统计学经典课件04-数据分布特征的测度_第4页
大学应用统计学经典课件04-数据分布特征的测度_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用统计学-4集中在某个位置标准分数标准分数定义4.1一组数据中出现次数最多的变量值,称为众数(mode),用M0表示。定义4.2一组数据排序后,处于中间位置的变量值,称为中位数(median),用Me表示。定义4.3一组数据排序后处于25%和75%位置上的值,称为四分位数,也称四分点。定义4.4一组数据相加后除以数据的个数而得的结果,称为均值(mean),也称平均值。定义4.5各变量值倒数的平均倒数,称为调和平均数(harmonicmean),它是均值的另一种表现形式,用Hm表示。定义4.6n个变量值乘积n次方根,称为几何平均数(geometricmean)。集中在某个位置众数后一组的频数众数的组距众数前一组的频数众数组的下限值众数组的频数搞清楚众数值与众数频数的区别??p72对比课本P72对定序数据如何办?除分组数据外搞清楚中位数的值与中位数的位置的区别。对比课本P73、例题4.4√中位数所在组的次(频)数中位数所在组的组距中位数所在组前一组距的累积频数中位数所在组的下限中位数的位置N/2+1搞清楚中位数的值、中位数的位置、中位数的频数的区别。25(300+1)/4=72.253*(300+1)/4=225.75搞清楚四分位数的值与四分位数的位置的区别0.752123121.750.252830565.253Q所在组的下限值Q所在组以前各组的累积频数Q所在组的组距Q所在组的频数数据个数3(50+1)/43*(50+1)/4P78(未分组数据)(已分组数据)权(频数)组中值?单变量或未分组数据分组数据尝试计算这两组数据的众数和中值例:科目成绩与学分。这样的性质表明均值是集中趋势最好的代表值(数据中心)把均值(X)换成中值(Me)看看!权(频数)组中值已知资料总成交额=总成交量平均价格已知资料平均价格=?成交额=成交量价格∑XiFi/Xi成交额=成交量价格成交额=成交量价格成交额=成交量价格全部成交额=平均价格全部成交量∑单项成交量全部成交量=全部成交额=平均价格单项批发价格单项成交额∑单项批发价格单项成交额=单项成交量成交额=成交量价格∑XiFi/Xi数据中出现“0”值时不宜计算调和平均数几何平均值这是平均增长率吗?2000年产量=100+100X9%=100(1+9%)2001年产量=2000年产量+2000年产量X16%=2000年产量(1+16%)2002年产量=2001年产量+2001年产量X20%=2001年产量(1+20%)2002年产量=100(1+9%)(1+16%)(1+20%)2002年产量=100(1+G1)(1+G2)(1+G3)100(1+9%)100(1+9%)(1+16%)假设:G1=G2=G32002年产量=100(1+G)3=100∏(1+G)3只适合于定比数据,对于定距数据不宜使用。这是平均增长率吗?平均收益率=103.84%-100%=3.84%平均发展速度平均增长率=平均发展速度-1MeMoX<<MeMoX>>MeMoX==(例:99个女生和1个男生;51个女生和49个男生)什么叫“不受极端值影响”?众数什么叫“左偏”和“右偏”?中位数服装尺寸、商品价格水平、判别抄袭中间收入、房价有极端值存在时,不宜用均值。标准分数非众数组的频数占总频数的比率,称为异众比率(variationratio),用Vr表示。定义4.8定义4.7定义4.9上四分位数与下四分位数之差,称为四分位差(quartiledeviation),也称为内距或四分间距(inter-quartilerange),用Qd表示。一组数据的最大值与最小值之差,称为极差(range),也称全距,用R表示。定义4.10各变量值与其均值离差绝对值(之和)的平均数,称为平均差(meandeviation),也称平均离差,用Md表示。定义4.11各变量值与其均值离差平方和的平均数,称为方差(variance)。定义4.12方差的平方根,称为标准差(standarddeviation)。定义4.13变量值与其平均数的离差除以标准差后的值,称为标准分数(standardscore)

,也称标准化值或z分数。一组数据的标准差与其相应的均值之比,称为离散系数(coefficientofvariation),也称变异系数。定义4.14变量值总频数众数组频数什么是非众数?异重比越大,代表性越差!四分位差相差2个等级,中位数“一般”两侧共有50%的家庭在“满意”和“不满意”之间。如果:QL=不满意;QU=一般QD=3-2≠2注意:与标准差或方差对比注意:平均差有量纲!注意:标准差也有量纲!标准差可以有单位为何用总体计算时自由度为N?与平均差有何区别?平均值的方差多出的部分均值=34标准差=6均值=0标准差=1标准差均值68%的数据在此范围内例4.15有几个家庭落在平均数加减2个标准差范围内?2个标准差均值75%的数据在此范围内什么是异常值与离群点?均值异常点异常点3个标准差3个标准差如何解释第2点?不能为0在此题中离散程度不同说明了什么问题?销售额销售利润企业1,2,3,……标准分数数据分布的不对称,成为偏态(skewness)。定义4.16定义4.15对数据分布不对称性的度量值,称为偏态系数。定义4.17数据分布的平峰或尖蜂程度,成为蜂态(kurtosis)。定义4.18对数据分布峰态的度量值,称为峰态系数。正离差部分较大负离差部分较大正负离差相等收入偏高还是偏低?什么是正偏分布和负偏分布?

偏态系数Cs﹥0,说明随机变量x[______]。

a、出现大于均值的机会比出现小于均值的机会多;

b、出现大于均值的机会比出现小于均值的机会少;

c、出现大于均值的机会和出现小于均值机会相等;

d、出现小于均值的机会为0。

答:偏态系数Cs﹥0,说明随机变量x出现大于均值的机会比出现小于均值的机会少。

问:水文现象中,大洪水出现机会比中、小洪水出现机会小,其频率密度曲线为[____]。

a、负偏;b、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论