版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分布特征的测度管理统计学
第四章数据分布特征的测度Summarizing&DescribingNumericalData
学习目标
LearningObjectives1. 解释数值数据的特征
ExplainNumericalDataProperties2. 综合度量描述DescribeSummaryMeasures集中趋势CentralTendency变异程度Variation分布形状Shape3. 数值数据的综合度量分析数值数据的特征和度量
Properties&Measures数值数据的特征均值中位数众数值域中点
中轴数集中趋势全距四分位间距方差标准差变异系数变异程度偏态分布形状均值(平均数)Mean1. 用于度量数据的集中趋势(CentralTendency)2. 是最常见的集中趋势的度量3. 如同平衡点(BalancePoint)4. 易受极端数值(ExtremeValues)影响5. 公式(样本均值)(SleMean)XXnXXXniinn
112...众数 Mode1. 用于度量数据的集中趋势CentralTendency2. 为出现次数最多的数值
ValueThatoccursMostOften3. 不受极值的影响4. 可能会出现没有众数或多个众数的情形5. 对数值数据和类型数据均适用值域中点 Midrange1. 用于度量数据的集中趋势(CentralTendency)2. 是最小和最大观测值的中点3. 易受极值影响 AffectedbyExtremeValues值域中点
XX最小值最大值2四分位数 Quartiles1. 用于度量数据的非集中趋势
MeasureofNoncentralTendency2. 把排序数据等分为四个区间Quarters3. 第i个四分位数的位置25%25%25%25%Q1Q2Q3定位点
Qi(ni
1)4中轴数Midhinge1. 用于度量数据的集中趋势(CentralTendency)2. 是第一和第三四分位数的中点3. 不受极值的影响
NotAffectedbyExtremeValues中轴数
QQ132集中趋势题解均值(Mean)XXnXXXiin
1128817162118131612118155....集中趋势题解中位数(Median)原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21位置: 1 2 3 4 5 6 7 8定位点中位数
n12812451616216.集中趋势题解众数(Mode)原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21值域中点(Midrange)值域中点
XX最小值最大值21121216Q1原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21位置: 1 2 3 4 5 6 7 8集中趋势题解Q位置Q1
11)41(81)425121(n.2
2集中趋势题解Q3原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21位置: 1 2 3 4 5 6 7 8Q位置Q3
31)43(81)46757183(n.集中趋势题解中轴数(Midhinge)原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18
21位置: 1 2 3 4 5 6 7 8中轴数
QQ1321218215数值数据的特征和度量数值数据的特征均值中位数众数值域中点
中轴数集中趋势全距四分位间距方差标准差变异系数变异程度偏态分布形状四分位间距
InterquartileRange1. 度量数据的离散程度MeasureofDispersion2. 也称为伸展中心Midspread3. 为第三和第一四分位数之差4. 此间距包括中间50%的数据5. 不受极值影响 四分位间距
QQ31方差和标准差
Variance&StandardDeviation1. 度量数据的离散程度MeasuresofDispersion2. 是最为常见的度量3. 考虑数据是如何分布的4. 表现了相对于均值(或者
)的变异4681012
X=8.3样本方差公式
SleVarianceFormula分母是(n-1)!(如果是总体方差就用N)S(XX)n(XX)(XX)(XX)niinn2211222211
...样本标准差公式
SleStandardDeviationSS(XX)n(XX)(XX)(XX)niinn
2211222211...思考题
ThinkingChallenge你是Prudential-Bache证券公司的金融分析员.你已经收集了新发行股票的下列收盘价:17,16,21,18,13,16,12,11.描述股票价格的不稳定性(volatility).变异程度题解
VariationSolution全距和四分位间距(Range&InterquartileRange)原始数据: 17 16 21 18 13 16 12 11排序之后: 11 12 13 16 16 17 18 21位置: 1 2 3 4 5 6 7 8四分位间距
QQ3118126全距
XX最大值最小值211110变异程度题解样本方差(SleVariance)原始数据: 17 16 21 18 13 16 12 11S(XX)nXXnSiiniin221122221155(17155)(16155)(11155)811114
其中........变异程度题解样本标准差(SleStandardDeviation)变异系数(CoefficientofVariation)SS(XX)niin
22111114334..探测性数据分析
ExploratoryDataAnalysis筛选原始数据的技术:TechniquestoScreenRawData1.检查关于形状的假设Assumptions2.确定数据中的极端值的位置LocateOutlier
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考物理复习主题单元10第24课时电路识别、连接与设计课件
- 第三章第二节节分子和原子(教案)
- 洛阳市城乡居民基本医疗保险
- 电力行业运维队伍管理办法
- 环保企业法定代表人聘用协议
- 农村公路建设施工安全规范
- 生态环境治理招投标资料清单
- 家庭舞蹈室施工协议
- 企业内部口腔科护士招聘合同
- KTV服务员录用协议书
- 陕西中考物理备考策略课件
- 美国博物馆教育研究
- 9F燃机燃机规程
- 部编版五年级上册《我的长生果》公开课一等奖优秀课件
- 人民调解培训课件(共32张PPT)
- 小学部编版五年级语文上册教案(全)
- 绿化养护报价表
- 《工业革命与工厂制度》
- 课程领导力-资料教学课件
- 老人租房免责协议书
- 特灵中央空调机组RTHD详细介绍
评论
0/150
提交评论