统计技术应用课件_第1页
统计技术应用课件_第2页
统计技术应用课件_第3页
统计技术应用课件_第4页
统计技术应用课件_第5页
已阅读5页,还剩130页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计技术应用什么是统计收集数据展示数据刻画数据决策数据分析应用领域财务管理市场营销会计统计分类描述性统计目的:描述数据人口分布、地质条件、销售量、产量等推论性统计目的:针对总体特性作决策成果评价及假设检验包装不良的原因、销售状况分析等术语总体样本参数统计参数数据来源数据来源第一手数据第二手数据试验文献资料调查观察数据类型数据数字(定量)文字描述(定性)离散型连续型数据类型数字离散型:几本杂志、几个人、几台机器连续型:时间、投资额、重量、高度文字描述喜欢的口味、投资的愿望、性别、学历数据计量定称法:性别、党派、婚姻状况排序法:由大到小、由高到低区间法:温度范围、时间范围比例法:高度(以同一单位比较)考虑要点是否可以直接描述?是否可以量化?合理的区间?统计应用步骤明确目标设计调查表(问卷)设计调查样本:型式、样本大小采集数据准备数据:编辑、编码分析数据解释发现报告调查表(问卷)设计问题目录反应形式问题描述问题顺序调查表(问卷)初稿调查表(问卷)测试调查为什么要抽样对实验样本的破坏精确的及可信的结果基于时间与成本的考量抽样形式抽样形式概率型非概率型随机抽样分层抽样系统抽样分部抽样大数法经验配额随机抽样每个总体元素有同等机会对一个元素的选择不会影响其它元素出现的机会©1984-1994T/MakerCo.系统抽样10000个总体欲提取100个样本将10000个总体分成10000/100=100个组每组中随机抽取一个样本多用于电话调查分层抽样将总体分成互斥的、无遗漏的、至少有一个共同特点的若干个子集以随机抽样的方式在每一个子集中提取一定的样本数分部抽样对集团公司所有经理的调查可以先随机抽取一定数量的分公司再在所抽取的分公司中随机抽取一定数量的经理非概率型抽样经验法以经验确定样本(行销中的目标市场)配额法类似于分层统计在最终样本确定时不使用随机抽样大数法用可以获得的所有数据抽样误区总体学生样本结构计划样本实际样本结构覆盖错误抽样错误测量错误谁对谁错3639421234560204060123456企划部:销售变化太大!销售部:销售很平稳!?数据处理排列法累积曲线折线图直方图频次分布法数据要因图频率分布应用步骤1. 确定范围2. 确定区间数通常以5-15为一个间隔3. 估算区间间隔4. 确定区间边界5. 确定区间中值6. 统计实例原始数据:

24,26,24,21,27,27,30,41,32,38边界(上边界+下边界)/2区间中值频次15but<2520325but<3530535but<45402频率0.30.30.3实例原始数据:24,26,24,21,27,27,30,41,32,38下边界30%+50%80%+20%区间累计频率15but<250.025but<3530.035but<4580.045but<55100.0低于下边界的比例直方图0123450 15 25 35 45 55区间频次15but<25325but<35535but<452折线图012345区间中值虚边界0 10 20 30 40 50 60区间频次15but<25325but<35535but<452散布图02040600204060XY针对双变量时变图(管制图)时间重量02468919293949596如何表示分类数据单变量数据用一览表汇总图形表示:柱状图饼图伯拉图双变量数据用统计表汇总图形表示:直方图

一览表1. 列出统计明细2. 记录统计数据3. 尽可能列出所占比例(%)专业人数财务130经济20管理50合计200比例%651025100柱状图050100150财务经济管理等宽、比例合适、柱间距为1/2至1个柱宽饼图经济10%管理25%财务65%1. 列出明细2. 显示相对差异3. 角面积360°*所占比例

360°*10%=36°36°伯拉图0%33%67%100%财务管理经济递减排列累计曲线统计汇总(相依)表居住地:

C

C O O C C O O C O

性别:

M

F F M M M F M M F

(C=校内,O=校外;M=男,F=女)4 12 3性别居住地男女总数校内5校外5总数6410对比柱状图居住地0123456校内男女

校外男女

表述数据误区滥用图例无对比性纵坐标变量选择不当纵坐标无零点滥用图例正确表述不良表述1960:1.001970:1.601980:3.101990:3.80最低工资最低工资0241960197019801990无对比性正确表述不良表述成绩》90成绩》9001002003001234人数0%10%20%30%1234%纵坐标选择不当正确表述季度销售季度销售不良表述02550Q1Q2Q3Q40100200Q1Q2Q3Q4纵坐标无零点月销量月销量不良表述0204060JMMJSN36394245JMMJSN正确表述数字数据数字数据平均值中点值众数中值

四分位数平均中值中心趋向区间四分区间偏差标准偏差偏差系数离散偏差倾斜图形平均值XXnXXXniinn112中点值中点位置n121.数据依大小顺次排列2. 确定序列中间位置若是奇数n,既为中点数据值若是偶数n,既为两个中点数据值的平均值3.中点位置确定

众数在所有数据中出现最多的数中值中点值XXsmallestlestarg2四分位数25%25%25%25%Q1Q2Q3平均中值平均中值QQ132离散偏差区间XXlestsmallestarg四分区间QQ31标准偏差S(XX)n(XX)(XX)(XX)niinn2211222211标准偏差SS(XX)n(XX)(XX)(XX)niinn2211222211偏差系数实例原始数据: 17 16 21 18 13 16 12 11排序后: 11 12 13 16 16 17 18 21位置: 1 2 3 4 5 6 7 8四分区间QQ3117.512.55.区间XXlestsmallestarg211110实例原始数据: 17 16 21 18 13 16 12 11S(XX)nXXnSiiniin221122221155(17155)(16155)(11155)811114

.....实例标准差(S)S(XX)niin22111114334..偏差系数连续随机变量事件随机变量可能值100个人的重量重量45.1,78,...闲置时间小时900,875.9,...食品上的费用元54.12,42,...时间间隔秒0,1.3,2.78,...连续概率分步模型连续概率分布正态指数正态分布平均值众数中值Xf(X)1.钟型对称2.平均值、众数、中值相等3.随机变量无穷正态分布函数f(X) = 变量X出现的频率 = 3.14159;e=2.71828 = 总体标准偏差

X = 随机变量(-<X<) = 总体平均值正态分布的概率表述概率是曲线下的面积f(X)PcXd()?cd正态分布转化为Z分布Z=0z=1Z

同样的平台!正态分布标准正态(Z)分布X标准正态分布实例ZZ=0Z=1.12正态分布标准正态分布X=5=106.2概率获得ZZ=0Z=10.12Z.00.010.0.0000.0040.0080.0398.04380.2.0793.0832.08710.3.1179.1217.12550.0478.020.1.0478标准正态分布概率表概率ZZ=0Z=1-0.12正态分布0.0478标准正态分布X=5=103.8P3.8X5()P2.9X7.1()X295.0Z=1-.21Z.21正态分布.1664.0832.0832标准正态分布5=102.97.1XZZX10217151021...

P7.1X8()715.z=0Z=1.30Z.21正态分布.0832.1179 .0347标准正态分布ZXZX1021851030..

=5=1087.1X由已知概率判断Z值Z.000.20.0.0000.0040.00800.1.0398.0438.04780.2.0793.0832.0871.1179.1255ZZ=0Z=1.31.1217.010.3.1217标准正态分布概率表Z是多少?

P(Z)=0.1217?指数分布e= 2.71828P<X()X1-e

=总体平均值

X=随机变量标准差抽样数量的不同,会造成标准差标准差校正:不同抽样数对比集中趋势离散趋势总体分布抽样分布n=16

X=2.5

=10

n=4

X=5实例长途电话平均通话时间

=8

min.=2

min.如随机抽取

25

次通话平均通话时间在7.8至8.2

minutes的概率有多大?实例抽样分布.3830.1915.1915标准正态分布ZXnZXn7882255082822550....

8X=.47.88.20Z=1-.50Z.50中心极限趋势当抽样数足够大

(n

30)...抽样分布趋向正态分布统计方法统计方法描述性推论性估计假设检验推论性统计内容:估计假设检验目的:由样本特性-总体特性-总体决策样本与总体估计参数对比总体估计参数样本参数平均值比例p

ps偏差

s2差异121

2估计的置信区间置信区间样本统计值置信区间下限置信区间上限总体参数落在样本估计设定区间的概率总体平均值的置信区间限置信区间90%置信度95%置信度99%置信度x_置信等级1. 总体参数落在设定区间的概率2. 设定(1-=

置信等级为总体参数未落在该区间的概率3. 通常选择的置信等级为99%,95%,90%确定置信区间抽样平均值区间上下限(1-)%置信度

x=1-/2/2X_x_影响置信区间的因素1. 数据的离散性

2. 样本大小X=X/n3. 置信等级(1-)影响Z置信区间估计平均值

未知置信区间比例有限总体

已知X

已知XZnXZn//22X

未知XtSnXtSnnn/,/,2121必须考虑自由度:n-1有限总体XtSnNnNXtSnNnNnXn/,/,212111当n/N>.05时比例pZppnppZppnssssss()()11当n·p

5&n·(1-p)5时确定样本大小实例nZError22222216454552192220..希望90%的置信度、偏差在5、标准差为45样本大小修正因子nn0n0N+

(N-1)班组对比

班组A

班组B

抽样数 21 25平均值 3.27 2.53标准差 1.30 1.16相同的总体平均情况下,班组平均值有差异吗?

(=0.05)?应用tXXS(nS(nSnnP1212211222212221)1)11(211)130(251)1162112511510()...dfnn122分析结论t02.0154-2.0154.025.025t

=+2.03结论:两个班组平均值有差异(95%的置信度)问题如果总体平均不同?并且每班抽样数有差异?会不会这样的对比有不同的结果?校正计算方法而自由度计算分析结论t02.0211-2.0211.025.025t'+2.01结论:两者没有平均值差异(95%置信度)应用讨论后一种方式方式应当是应用于同一班组不同工作日的对比但对于设备的对比应当可以使用前一种方法思考:统计中是否应当将影响因素减至最低?效果t检验n样本平均值DDnii1自由度dfn1tDSnnDD1样本标准差实例培训效果检验:姓名

培训前

培训后S 85 94T 94 87B 78 79M 87 88培训有效吗(90%置信度)?计算分析样本培训前培训后差异S8594-9T94877B7879-1M8788-1合计-4结论分析t0-1.6377.10tSnDD6534306..D10结论:样本对比无差异,培训无效!管理统计应用什么是质量?与标准的差异最小材料时间表现可靠性其他全面质量管理1. 管理哲学2. 关注持续改进3. 聚焦顾客团对协作快速反应4. 统计技术应用

5. W.EdwardDeming---先驱管制图02040601357911XTimeUCLLCL特别差异点随机波动过程平均±3管制图作用1. 显示数据变化趋势在失控前加以校正2. 显示数据变化原因特殊原因或非随机原因代表有问题需要纠正在图中会显示超出关键限值偶发或一般原因随机波动控制图流程生产停止YesNo特殊原因取样检测样本找出原因绘制管制图AA开始p

图1. 概率控制图2. 显示不相容事件概率如:抽验样本中的不良比例样本或者是良品或者是不良品3. 可以是等样本数或不等样本数不等样本数随时间推移不应有超过25%的偏差p

图控制限值不良数UCLppp)nLCLppp)nnnkpXnppiikiikiik3(13(1111

抽样次数样本数实例500间客房的宾馆在不同的7天,每天收集200间客房准备情况数据.客房准备情况在可控程度内吗?实例

房间数

未准备好

比例 1 200 16 0.080

2 200 7 0.035

3 200 21 0.105

4 200 17 0.085

5 200 25 0.125

6 200 19 0.095

7 200 16 0.080实例nnkpXniikiikiik1111400720012114000864086405961460....

&.026816+7+...+16结论分析UCLLCL0.000.050.100.151234567PDay最低:2.68%最高:14.6%平均:8.6%的不良你能接受吗?要不要改善?成本会增加多少?c

图ShowsNumberofNonconformities(Defects)inaUnitUnitmaybechair,steelsheet,caretc.e.g.,Count#defects(scratches,chips)ineachchairofasampleof100chairsSizeofUnitMustBeConstante.g.,Squareyardofcloth#DefectsinUniti#UnitsSampledUCLccLCLcccckcciik331c

图控制限值实例You’reoperationsmanagerofabakery.Youwanttoensurethattheproductionprocessisputtingenoughchipsintocupcakes.Youinspect14cupcakesastheyareproduced.Isthechipprocess

incontrol?实例

No.

No.

Cupcake

Chips

Cupcake

Chips 1 11 8 5

2 8 9 8

3 7 10 6

4 8 11 7

5 6 12 5

6 7 13 5

7 7 14 4实例不存在cckUCLLCLiikcc111841494146716713671671777144867136.71671777.........结论分析UCL051015135791113No.ChipsTimeOrder平均人数:6.71还在减少?能接受吗?要不要改善?问题出在哪里?R图1. ShowsSampleRangesOverTimeDifferencebetweensmallest&largestvaluesininspectionsamplee.g.,Weigh16oz.cansofcoffee&computerangeofsample2. MonitorsVariabilityinProcessUCLDRLCLDRRRkRRiik431SampleRangeatTimei#Samples查表E.11R

图控制限值实例You’remanagerofa500-roomhotel.Youwanttoanalyzethetimeittakestodeliverluggagetotheroom.For7days,youcollectdataon5deliveriesperday.Istheprocessincontrol?实例 Sample Sample

Day

Average

Range 1 5.32 3.85

2 6.59 4.27

3 4.88 3.28

4 5.70 2.99

5 4.07 3.61

6 7.34 5.04

7 6.79 4.22实例RRkUCLDRLCLDRiikRR14338542742273894(2.114)(3.894)8232(0)(3.894)0.....FromTable(n=5)结论分析UCL024681234567MinutesDay平均值管制图1. ShowsSampleMeansOverTimeComputemeanofinspectionsamplee.g.,Weigh16oz.cansofcoffee&computemeanofsample2. MonitorsProcessAverage平均值管制图UCLXARLCLXARXXkRRkXXiikiik2211andSampleRangeatTimei#Sampl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论