《概率论与数理统计及其Python实现》课件 第8、9章 假设检验、回归分析_第1页
《概率论与数理统计及其Python实现》课件 第8、9章 假设检验、回归分析_第2页
《概率论与数理统计及其Python实现》课件 第8、9章 假设检验、回归分析_第3页
《概率论与数理统计及其Python实现》课件 第8、9章 假设检验、回归分析_第4页
《概率论与数理统计及其Python实现》课件 第8、9章 假设检验、回归分析_第5页
已阅读5页,还剩108页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章

假设检验学习目标理解假设检验的基本思想。了解假设检验的基本概念。掌握假设检验的基本步骤。掌握单个及两个正态总体的均值和方差的假设检验。一、假设检验的基本思想假设检验是统计推断中的一种方法。这是在总体的分布函数完全未知,或只知其形式但不知其参数的形式的情况下,根据样本中的信息来对总体的分布参数或分布类型做出分析论断。即从统计的角度来判断假设是否成立。女士品茶实验据说有一次英国统计学家Fisher参加一个聚会。当时主人提供这样一种饮料,由Tea和Milk混合而成。按照加入顺序的不同,分别称为TM与MT。与会的一位女士声称她能分辨出任一杯这样的饮料是到底是TM还是MT。为检验她是否真的有这种辨别力,请人拿来杯饮料让她品尝,其中TM与MT各占一半,并把这一点告诉了她。结果,她指对了全部的杯TM(当然MT也都指对了)。那么,这位女士是否真的有真的有这种辨别力?例子分析•例子分析•正确鉴别错误鉴别概率例子分析•例子分析当鉴别杯数‘足够多’时,能全部正确鉴别的概率趋向于0,这为小概率事件。在一次实验中出现小概率事件,根据小概率原理,我们有证据认为该女士能有效区别奶茶的配置顺序。二、假设检验的基本概念•二、假设检验的基本概念(3)检验统计量检验统计量的构造原理与区间估计的构造原理类似。一个好的检验统计量通常具有明确的抽样分布,借助该统计量的分布特征和样本取值,我们可以作出判断是接受原假设还是拒绝原假设。二、假设检验的基本概念•二、假设检验的基本概念•二、假设检验的基本概念(6)接受域和拒绝域有了检验统计量之后,我们需要确定一个界限,这个界限可以将检

验统计的取值空间划分为两个区域。其中一个区域是原假设为真时,样本通常会落入的区域。如果检验统计量的样本值落在这个区域里,我们就判断接受原假设,所以该区间称为接受域,即接受原假设的

区域。另一个区域是原假设为真时,样本落入该区域的概率非常小,小到可以认为这种情况几乎不会发生。而在备择假设成立时,样本落入这个区域的概率就很大。如果检验统计量落入这个区域里,我们将决绝原假设,认为备择假设成立,所以该区间称为拒绝域,即拒绝原假设的区域。三、假设检验的四个步骤•四、正态总体的均值和方差的假设检验••••假设双侧检验左侧检验右侧检验假设形式H0

m

=m0

H1

m

m0统计量拒绝域P值决策•假设双侧检验左侧检验右侧检验假设形式H0

m

=m0

H1

m

m0统计量拒绝域P值决策••假设双侧检验左侧检验右侧检验假设形式统计量拒绝域P值决策••假设双侧检验左侧检验右侧检验假设形式统计量拒绝域P值决策••假设双侧检验左侧检验右侧检验假设形式H0

:H1

:2=22020H0

:H1

:22

<2020H0

:H1

:22

>2020统计量拒绝域P值决策••假设双侧检验左侧检验右侧检验假设形式统计量拒绝域P值决策典型题型及例题(A)检验结果为接受

(B)检验结果为接受

(C)检验结果为拒绝

(D)检验结果为拒绝时,只可能犯第一类错误时,既可能犯第一类错误也可能犯第二类错误时,只可能犯第一类错误时,既可能犯第一类错误也可能犯第二类错误类型1

假设检验的基本概念例8.1

在假设检验中,原假设为

备择假设为

则(

C

)典型题型及例题均重量类型2

假设检验的步骤例8.2

某洗衣粉厂用自动包装机进行包装,正常情况下包装量现随机抽取25袋洗衣粉,测得平样本标准差s=2.5g,问:可否认为可否认为典型题型及例题解:(1)典型题型及例题(2)练习题一、选择题1.在假设检验中,显著性水平的意义是(

A

)被拒绝的概率不能被拒绝的概率被拒绝的概率不能被拒绝的概率原假设原假设原假设原假设成立,经检验

成立,经检验

不成立,经检验不成立,经检验练习题,那么在(A)必接受(C)必拒绝(B)可能接受,也可能拒绝

(D)不接受,也不拒绝一、选择题2.假设检验时,如果在显著性水平0.05下接受原假设显著性水平0.01下,下列结论中正确的是(A

)练习题一、选择题

3.已知总体的均值,则应做检验(D

)(A)(C)为检验总体X的均值是否大于Y(B)(D)练习题二、填空题1.设总体测得样本方差由来自总体X的容量为10的简单随机样本,则检验假设使用的统计量下接受

的值等于

1_5

,在显著性水平()2.设未知,记使是取自正态总体的一个样本,其中则假设 的t检验用统计量T=

.练习题三、简答题1.

设总体

假设检验问题为(1)现从总体中抽取容量为25的样本,测得下,可否接受

(

)问在显著性水平(2)从总体中抽取样本为

,若拒绝域求犯第一类错误概率的最大值,若使该最大值不超过0.023,问n至少应该取多少?(

)练习题三、简答题2.测定某种溶液中的水分,由其10个测定值得已知测定值(1)(2)(试当

时,检验下列假设:)第九章回归分析概率论与数理统计1回归分析的概述2参数估计3假设检验4预测第一节

回归分析的概述概率论与数理统计回归分析方法是数理统计中常用的方法之一,是处理多个变量自检关系的一种数学方法.在实际生产实践中,我们常常要研究一些变量之间的关系.通常这些变量之间的关系可以分成两大类.概率论与数理统计另一类为非确定性的关系,指的是变量之间虽然存在一定的依赖关系,但这种关系没有达到能由其中一个或多个来准确地决定另一个的程度.如:人的血压与年龄有一定关系,但不能用一个确定的函数关系式表达出来.人的身高与体重之间的关系也是如此.我们称这种变量之间的关系为相关关系.概率论与数理统计回归分析是研究相关关系的一种有力工具.具有相关关系的变量之间虽然具有某种不确定性,但通过对它们不断观察,可以研究它们之间的统计规律.回归分析就是研究这种统计规律的一种数学方法,它主要解决以下问题:1

从一组观察数据出发,确定这些变量之间的回归方程;2

对回归方程进行假设检验;3

利用回归方程进行预测和控制.概率论与数理统计本书主要讨论线性回归方程.这是最简单同时也是研究最完善的回归方程.许多实际问题可以取这种模型作为真实模型的近似.这是因为,在实际中许多变量的关系确实是线性的,而且即使这些变量的关系是非线性的,当自变量变化范围不大时,我们也可以用线性关系来近似.再者,在数理统计中,对于线性回归模型已经有了完善的理论和方法,所有的统计软件包都有线性回归模型的计算程序,只要按程序代入数据,可以快速得到所需要的计算结果.所以,线性回归模型得到了广泛的应用.概率论与数理统计概率论与数理统计图9.1概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计谢谢大家第二节

参数估计概率论与数理统计一元线性回归的参数估计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计表9-1时间段1234567891012.08.011.513.015.014.08.510.511.513.311.68.511.412.213.013.28.910.511.312.0概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计多元线性回归的参数估计概率论与数理统计概率论与数理统计概率论与数理统计谢谢大家第三节

假设检验概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计表9-2一元回归的方差分析表方差源平方和自由度

均方

F比回归1剩余总和n-2n-1概率论与数理统计概率论与数理统计概率论与数理统计谢谢大家第四节

预测概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计图9-3所以,预测区间与置信区间意义相似,只不过前者是对随机变量而言,后者是对未知参数而言.概率论与数理统计概率论与数理统计概率论与数理统计数学实验九——利用Sklearn实现线性拟合并进行预测Python代码如下:#创建数据import

numpy

as

npimport

matplotlib.pyplot

as

plt

rng

=

np.random.RandomState(20)

x=10*rng.rand(50)Y=2*x-1+rng.rand(50)plt.scatter(x,y)#构建线性回归模型from

sklearn.linear_model

import

LinearRegressionmodel

=

LinearRegression(fit_intercept=True)#模型拟合x

=

x[:,np.newaxis]model.fit(x,y)#查看模型参数model.coef_#输出为2.01889877ercept_#输出为-0.5721372229186237#模型预测xfit

=

np.linspace(-1,11)xfit

=

xfit[:,np.newaxis]yfit

=

model.predict(xfit)plt.scatter(x,y)plt.plot(xfit,yfit)知识纵横——回归分析的由来概率论与数理统计回归分析最早是19世纪末期高尔顿(Sir

Francis

Galton)所发展.高尔顿是生物统计学派的奠基人,他的表哥达尔文的巨著《物种起源》问世以后,触动他用统计方法研究智力进化问题,统计学上的“相关”和“回归”的概念也是高尔顿第一次使用的.1855年,他发表了一篇“遗传的身高向平均数方向的回归”文章,分析儿童身高与父母身高之间的关系,发现父母的身高可以预测子女的身高,当父母越高或越矮时,子女的身高会比一般儿童高或矮,他将儿子与父母身高的这种现象拟合出一种线形关系.但是有趣的是:通过观察他注意到,尽管这是一种拟合较好的线形关系,但仍然存在例外现象:矮个的人的儿子比其父要高,身材较高的父母所生子女的身高将回降到人的平均身高.换句话说,当父母身高走向极端(或者非常高,或者非常矮)的人的子女,子女的身高不会像父母身高那样极端化,其身高要比父母们的身高更接近平均身高.高尔顿选用“回归”一词,把这一现象叫做“向平均数方向的回归”(regression

towardmediocrity).虽然这是一种特殊情况,与线形关系拟合的一般规则无关,但“线形回归”的术语仍被沿用下来.作为根据一种变量(父母身高)预测另一种变量(子女身高)的一般名称沿用至今,后被引用到对多种变量关系的描述.概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计谢谢大家习题九概率论与数理统计概率论与数理统计表9-30

4

10

15

21

29

36

51

6866.7

71.0

76.3

80.6

85.7

92.9

99.4

113.6

125.1概率论与数理统计表9-460

62

64

66

67

68

70

72

7463.6

65.2

66

66.9

67.1

67.4

68.3

70.1

70概率论与数理统计表9-58.37010.311.18018.212.98533.816.37742.68.66510.311.27522.613.38627.417.38155.48.86310.211.37919.913.77125.717.58255.710.57210.411.47624.213.86424.917.98058.310.78116.811.47621.014.07834.518.08051.510.88318.811.76921.414.28031.718.08051.011.06619.712.07521.315.57436.320.68777.011.07515.612.97419.116.07238.3概率论与数理统计概率论与数理统计表9-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论