




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 应用统计方法电子教案开课系:数理系对象:工科研究生学时:48授课教师:李晓童Email:电话:897345919/24/20221 应用统计方法电子教案开课系:数理系9/24/20221参考书:吴翊等 国防大学出版社1995高惠璇,北京大学出版社 2001梅长林等 西安交通大学出版社 20029/24/20222参考书:吴翊等 国防大学出版社19959/2考核方式 闭卷考试(50%)+课程论文(40%)+考勤(10%)9/24/20223考核方式 闭卷考试(50%)+课程论文(40%)+考勤(10主要内容数理统计基础-抽样分布,参数估计,假设检验回归分析方差分析多元分析的基本概念多元正态的参
2、数估计与假设检验主成分分析判别分析聚类分析因子分析9/24/20224主要内容数理统计基础-抽样分布,参数估计,假设检验9/24 chapter1 数理统计基本概念 (Basic Concept of Mathematical Statistics) 9/24/20225 chapter1 数理统计基本概念 (Basic 数理统计学是数学的重要分支它研究怎样有效得收集,整理和分析带有随机性的数据,以对所考察的问题作出推断和预测,直到采取一定的决策和行动提供依据和建议统计学:去掉带有随机性也是数据科学数理统计和统计学的区别:9/24/20226数理统计学是数学的重要分支它研究怎样有效得收集,整理
3、和分析那里有受随机性影响的数据,那里就有数理统计的问题教育学医学环境科学气象,地质,考古,服装工业经济学社会学,心理学农业文学9/24/20227那里有受随机性影响的数据,那里就有数理统计的问题教育学9/2例如何估计产品的寿命?工业管理极重要的问题,因为寿命实验是破坏性的,只能抽取少量产品做试验为评价这批电子产品的使用寿命,随机抽取台作试验,测得寿命数据为(小时):,问整批电子设备中寿命超过小时的占多大比例?(参数估计问题)9/24/20228例如何估计产品的寿命?工业管理极重要的问题,因为寿命实例某针织厂进行技术革新,漂白工艺过程中,要考虑温度对针织品断裂强力(主要质量指标)的影响,为了比较
4、70C,80C 影响有无差异,在两个温度下做了次试验:70:20.5,18.8,19.8,20.9,21.5,19.5,21.0,21.280:17.7,20.3,20.0,18.8,19.0,20.1,20.2,19.1.问这两种温度下强力有无差别?(假设检验问题)这1公斤差别是由什么引起?随机误差?温度的不同?9/24/20229例某针织厂进行技术革新,漂白工艺过程中,要考虑温度对针织例3.为探讨吸烟与慢性支气管炎是否有关,调查了339人问从这批数据能否判定患慢性支气管炎与吸烟有关?(列联表的独立性)人数患未患合计吸烟43162205不吸烟13121134合计562833399/24/20
5、2210例3.为探讨吸烟与慢性支气管炎是否有关,调查了339人人数患1.1 样本和总体(Sample and Population)1.2 直方图与经验分布函数(Histogram and Empirical Distribution Function)1.3 统计量及其分布(Statistic and Distribution)9/24/2022111.1 样本和总体(Sample and Populati1.1 样本和总体 (Sample and Population)9/24/2022121.1 样本和总体9/24/2022129/24/2022139/24/2022139/24/202
6、2149/24/2022149/24/2022159/24/2022159/24/2022169/24/2022169/24/2022179/24/2022179/24/2022189/24/2022189/24/2022199/24/2022199/24/2022209/24/2022209/24/2022219/24/2022219/24/2022229/24/2022229/24/2022239/24/2022239/24/2022249/24/2022249/24/2022259/24/2022259/24/2022269/24/2022261.2 直方图与经验分布函数Histogra
7、m and Empirical Distribution Function)9/24/2022271.2 直方图与经验分布函数9/24/2022279/24/2022289/24/2022289/24/2022299/24/2022299/24/2022309/24/2022309/24/2022319/24/2022319/24/2022329/24/2022329/24/2022339/24/202233data wh100; input h w ; if w=50.3 then wc= 50.3 and w54.1 and w57.9 and w61.7 and w65.5 and w6
8、9.3 and w=73.2; wgroup=int(w-46.5)*8/(77-46.5)-0.001)+1; cards;9/24/202234data wh100; input h w ;172.4 75.0 169.3 54.8 169.3 64.0 171.4 64.8 166.5 47.4 171.4 62.2168.2 66.9 165.1 52.0 168.8 62.2 167.8 65.0 165.8 62.2 167.8 65.0164.4 58.7 169.9 57.5 164.9 63.5 160.3 55.2 175.0 66.6 172.5 73.5172.0 64
9、.0 168.4 57.0 155.0 57.0 175.5 63.9 172.3 69.0 168.6 58.0176.4 56.9 173.2 57.5 167.5 50.0 169.4 52.2 166.7 72.0 169.5 57.0165.7 55.4 161.2 48.5 172.8 57.0 175.1 75.5 157.5 50.5 169.8 62.9168.6 63.4 172.6 61.0 163.8 58.5 165.1 61.5 166.7 52.5 170.9 61.0166.1 69.5 166.2 62.5 172.4 52.6 172.8 60.0 177.
10、8 63.9 162.7 56.8168.8 54.0 169.1 66.2 177.5 60.0 177.0 66.2 169.9 55.9 167.4 54.4169.3 58.4 172.8 72.8 169.8 58.0 160.0 65.3 179.1 62.2 172.3 49.8163.3 46.5 172.9 66.7 165.4 58.0 175.8 63.2 162.3 52.2 165.4 65.7171.5 59.3 176.6 66.3 181.7 68.6 175.2 74.9 169.5 59.5 169.6 61.5169.1 63.1 185.5 77.0 1
11、73.9 65.5 162.5 50.0 171.5 58.5 175.6 59.8166.0 75.5 167.2 63.3 171.9 57.0 176.6 58.4 177.3 67.0 169.2 71.8166.2 49.8 181.7 63.0 175.8 68.3 172.3 55.5 172.7 58.5 174.3 64.0171.2 59.0 174.8 68.0 165.4 55.5 169.1 64.8 167.9 62.0 176.8 64.0183.5 69.9 165.5 48.6 171.0 70.5 170.3 58.59/24/202235172.4 75.
12、0 169.3 54.8 169.3 64proc print data=wh100;run;proc freq data=wh100; tables wc ; /* tables wgroup; */ title 100名学生的体重分为8个组的频数表;run;proc chart data=wh100; vbar w / midpoints=48 to 76 by 4; title 对学生体重数据使用选项MIDPOINT=产生的条形图;run;proc chart data=wh100; vbar wgroup / discrete; /* vbar wc / discrete; */ ti
13、tle 把输出1.2.1的频数表用条形图表示;run;proc univariate data=wh100 plot; var w;run;9/24/202236proc print data=wh100;run;pr100名学生的体重分为8个组的频数表 3 12:45 Thursday, February 18, 2009 The FREQ Procedure Cumulative Cumulative wc Frequency Percent Frequency Percent - =73.2 6 6.00 100 100.009/24/202237100名学生的体重分为8个组的频数表 T
14、he UNIVARIATE Procedure Variable: w Stem Leaf # Boxplot 76 0 1 | 74 9055 4 | 72 085 3 | 70 58 2 | 68 036059 6 | 66 2236790 7 | 64 00008800357 11 +- - -+ 62 022225901234599 15 | | 60 000055 6 *- + -* 58 00044555570358 14 | | 56 890000055 9 +- - -+ 54 04824559 8 | 52 02256 5 | 50 005 3 | 48 5688 4 | 4
15、6 54 2 | - -+- -+- - -+- -+9/24/2022389/24/202238五数概括与箱线图-次序统计量的应用之一9/24/202239五数概括与箱线图-次序统计量的应用之一9/24/202做法做法:1 画一个箱子,其两侧恰为第一4分位数和第三4分位数,在中位数位置上画一竖线,它在箱子内,这个箱子包含了样本中50%的数据.2 在箱子左右两侧各引一条水平线,分别至最小值和最大值为止.个线段包含了样本的25%的数据.9/24/202240做法做法:1 画一个箱子,其两侧恰为第一4分位数和第三4分位二 茎叶图:每个数值分为两部分,前面一部分(百位,十位)称为茎,后面部分(个位)
16、称为叶. 如: 数值 分开 茎 叶 112 12|2 11 2 然后画一竖线,在竖线的左侧写上茎,右侧写上叶.就形成了茎叶图. 647 7024669 8012333566779 91123333566779100024667881122468991223568133 9/24/202241二 茎叶图:每个数值分为两部分,前面一部分(百位,十位)称为 要比较两组样本时,可画出它们的背靠背的茎叶图.这是简单,直观而有效的对比方法.例2.下面的数据是某厂车间某天40名员工生产的产品的数量. 甲车间 62056 乙车间 87775554211667788 8776644217224555566688
17、9 8766532801133344466778 73210922358 53001079/24/202242 要比较两组样本时,可画出它们的背靠背的茎叶图.这是简单9/24/2022439/24/2022439/24/2022449/24/2022449/24/2022459/24/2022459/24/2022469/24/2022469/24/2022479/24/2022471.3 统计量及其分布(Statistic and Distribution)9/24/2022481.3 统计量及其分布9/24/2022489/24/2022499/24/202249data Money50;
18、input w ;cards;924 800 916 704 870 1040 824 690 574 490 972 988 1266 684 764 940 408 804 610 892 602 754 788 962 704 712 854 888 768 848 882 1192 820 878 614 846 746 828 792 872 696 644 926 808 1010 728 742 850 864 738;proc print data=Money50; var w;proc means data=Money50; var w;proc univariate dat
19、a=Money50 plot;var w;run;9/24/202250data Money50;9/24/202250 The MEANS Procedure Analysis Variable : w N Mean Std Dev Minimum Maximum - 50 810.3200000 156.1738226 408.0000000 1266.00 - Stem Leaf # Boxplot 12 7 1 0 12 11 9 1 0 11 10 10 14 2 | 9 679 3 | 9 2234 4 | 8 55556778899 11 +-+ 8 001223 6 *-+-*
20、 7 556799 6 | | 7 0001344 7 +-+ 6 89 2 | 6 0114 4 | 5 7 1 | 5 | 4 9 1 | 4 1 1 0 -+-+-+-+ Multiply Stem.Leaf by 10*+29/24/2022519/24/202251 Stem Leaf # Boxplot 12 7 1 0 12 11 9 1 0 11 10 10 14 2 | 9 679 3 | 9 2234 4 | 8 55556778899 11 +-+ 8 001223 6 *-+-* 7 556799 6 | | 7 0001344 7 +-+ 6 89 2 | 6 011
21、4 4 | 5 7 1 | 5 | 4 9 1 | 4 1 1 0 -+-+-+-+ Multiply Stem.Leaf by 10*+29/24/2022529/24/202252 The SAS System 13:47 Saturday, February 20, 2009 22 The UNIVARIATE Procedure Variable: w Moments N 50 Sum Weights 50 Mean 810.32 Sum Observations 40516 Std Deviation 156.173823 Variance 24390.2629 Skewness 0.2322891 Kurtosis 1.40426379 Uncorrected SS 34026048 Corrected SS 1195122.88 Coeff Variation 19.2731048 Std Error Mean 22.0863138 Basic Statistical Measures Location Variability Mean 810.3200 Std Deviation 156.17382 Median 814.0000 Va
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025标准合同协议书范本
- 2025年美容师初级技能水平测试卷:美容师美容护肤产品知识与应用技巧试题
- 2025年注册会计师《会计》新准则深度解读模拟试题集
- 2025年CFA特许金融分析师考试金融风险管理模拟试题
- 2025年舞蹈教师资格证考试模拟试卷:舞蹈教师专业素养与技能提升
- 2025年专升本艺术概论考试模拟卷(艺术教育实践案例解析)
- 2025年教师资格考试《综合素质》教育反思与教学实践试题库
- 石家庄铁道大学《高级环境流体力学》2023-2024学年第二学期期末试卷
- 2025隧道掘进工程承包合同
- 湖南环境生物职业技术学院《工程创造学》2023-2024学年第二学期期末试卷
- 危险化学品出入库管理制度
- 医学课件新生儿黄疸5
- 2025年呼和浩特市重点中学中考领航2020大二轮复习数学试题模拟含解析
- 水泥搅拌桩施工记录-自动计算
- 2022年全国职业院校技能大赛赛项-ZZ-2022024 工业产品设计与创客实践赛项题目-模块1
- 珠宝加工合伙人协议书正式
- 黑龙江省龙东地区2024年中考语文真题试卷【附真题答案】
- 2024年广东省南海区中考一模数学试题(解析版)
- 煤炭开采单位产品能源消耗限额-编辑说明
- 技术标标书范本
- MOOC 思辨式英文写作-南开大学 中国大学慕课答案
评论
0/150
提交评论