数据分布特征的测度_第1页
数据分布特征的测度_第2页
数据分布特征的测度_第3页
数据分布特征的测度_第4页
数据分布特征的测度_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分布特征的测度管理统计学

第四章数据分布特征的测度Summarizing&DescribingNumericalData

学习目标

LearningObjectives1. 解释数值数据的特征

ExplainNumericalDataProperties2. 综合度量描述DescribeSummaryMeasures集中趋势CentralTendency变异程度Variation分布形状Shape3. 数值数据的综合度量分析数值数据的特征和度量

Properties&Measures数值数据的特征均值中位数众数值域中点

中轴数集中趋势全距四分位间距方差标准差变异系数变异程度偏态分布形状均值(平均数)Mean1. 用于度量数据的集中趋势(CentralTendency)2. 是最常见的集中趋势的度量3. 如同平衡点(BalancePoint)4. 易受极端数值(ExtremeValues)影响5. 公式(样本均值)(SleMean)XXnXXXniinn

112...众数 Mode1. 用于度量数据的集中趋势CentralTendency2. 为出现次数最多的数值

ValueThatoccursMostOften3. 不受极值的影响4. 可能会出现没有众数或多个众数的情形5. 对数值数据和类型数据均适用值域中点 Midrange1. 用于度量数据的集中趋势(CentralTendency)2. 是最小和最大观测值的中点3. 易受极值影响 AffectedbyExtremeValues值域中点

XX最小值最大值2四分位数 Quartiles1. 用于度量数据的非集中趋势

MeasureofNoncentralTendency2. 把排序数据等分为四个区间Quarters3. 第i个四分位数的位置25%25%25%25%Q1Q2Q3定位点

Qi(ni

1)4中轴数Midhinge1. 用于度量数据的集中趋势(CentralTendency)2. 是第一和第三四分位数的中点3. 不受极值的影响

NotAffectedbyExtremeValues中轴数

QQ132集中趋势题解均值(Mean)XXnXXXiin

1128817162118131612118155....集中趋势题解中位数(Median)原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21位置: 1 2 3 4 5 6 7 8定位点中位数

n12812451616216.集中趋势题解众数(Mode)原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21值域中点(Midrange)值域中点

XX最小值最大值21121216Q1原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21位置: 1 2 3 4 5 6 7 8集中趋势题解Q位置Q1

11)41(81)425121(n.2

2集中趋势题解Q3原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21位置: 1 2 3 4 5 6 7 8Q位置Q3

31)43(81)46757183(n.集中趋势题解中轴数(Midhinge)原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18

21位置: 1 2 3 4 5 6 7 8中轴数

QQ1321218215数值数据的特征和度量数值数据的特征均值中位数众数值域中点

中轴数集中趋势全距四分位间距方差标准差变异系数变异程度偏态分布形状四分位间距

InterquartileRange1. 度量数据的离散程度MeasureofDispersion2. 也称为伸展中心Midspread3. 为第三和第一四分位数之差4. 此间距包括中间50%的数据5. 不受极值影响 四分位间距

QQ31方差和标准差

Variance&StandardDeviation1. 度量数据的离散程度MeasuresofDispersion2. 是最为常见的度量3. 考虑数据是如何分布的4. 表现了相对于均值(或者

)的变异4681012

X=8.3样本方差公式

SleVarianceFormula分母是(n-1)!(如果是总体方差就用N)S(XX)n(XX)(XX)(XX)niinn2211222211

...样本标准差公式

SleStandardDeviationSS(XX)n(XX)(XX)(XX)niinn

2211222211...思考题

ThinkingChallenge你是Prudential-Bache证券公司的金融分析员.你已经收集了新发行股票的下列收盘价:17,16,21,18,13,16,12,11.描述股票价格的不稳定性(volatility).变异程度题解

VariationSolution全距和四分位间距(Range&InterquartileRange)原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21位置: 1 2 3 4 5 6 7 8四分位间距

QQ3118126全距

XX最大值最小值211110变异程度题解样本方差(SleVariance)原始数据: 17 16 21 18 13 16 12 11S(XX)nXXnSiiniin221122221155(17155)(16155)(11155)811114

其中........变异程度题解样本标准差(SleStandardDeviation)变异系数(CoefficientofVariation)SS(XX)niin

22111114334..探测性数据分析

ExploratoryDataAnalysis筛选原始数据的技术:TechniquestoScreenRawData1.检查关于形状的假设Assumptions2.确定数据中的极端值的位置LocateOutlier

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论