数学基础课件_第1页
数学基础课件_第2页
数学基础课件_第3页
数学基础课件_第4页
数学基础课件_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章实验设计的数学基础简介第一节统计学基础第二节线性代数基础第三节回归与分析第一节统计学基础一、平均数、标准差与变异系数二、显著性检验三、方差分析四、协方差分析一、平均数、标准差与变异系数(一)平均数:算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。平均数的基本性质:(1)样本各观测值与平均数之差的和为零,即离均差之和等于零。(2)样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。<对于总体而言,通常用μ表示总体平均数,有限总体的平均数为:式中,N表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数作为总体平均数(μ)的估计量,并已证明样本平均数是总体平均数μ的无偏估计量。1、算术平均数(arithmeticmean):直接求算法和加权平均值法2、中位数(median):将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为Md。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。中位数简称中数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。(二)标准差及变异系数平均值只能反映效应的平均高低,而变异程度是另一个衡量效应的重要指标。极差和离均差不能全面反映变异程度,后者有正负号,离均差之和为0。离均差平方和除以自由度得到均方(meansquare缩写为MS),又称样本方差,记为S2。S2=相应的总体参数叫总体方差,记为σ2。对于有限总体而言,

统计学上把样本方差S2的平方根叫做样本标准差,记为S

:相应的总体参数叫总体标准差,记为σ

。在统计学中,常用样本标准差S估计总体标准差σ。

在样本服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差(±S)范围内;约有95.43%的观测值在平均数左右两倍标准差(±2S)范围内;约有99.73%的观测值在平均数左右三倍标准差(±3S)范围内。也就是说全距近似地等于6倍标准差变异系数:变异系数是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。标准差与平均数的比值称为变异系数,记为CV。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。变异系数的计算公式为:二、假设(显著性)检验对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,检验这种假设是否成立,这一统计推断过程,称为假设检验。(1)待检验假设或零假设记为H0,正在被检验的与相对立的假设H1称为备选假设或对立假设。(2)

假设检验的依据——小概率原理:小概率事件在一次试验中实际上不会发生。(3)

假设检验的思路是概率性质的反证法。即首先假设成立,然后根据一次抽样所得的样本值得信息,若导致小概率事件发生,则拒绝原假设,否则接受原假设。t-检验以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。(一)t-检验的基本步骤:1)首先对试验样本所在的总体作假设,无效假设(nullhypothesis),记作H0:m1=m2或m1-m2=0。无效假设是被检验的假设,通过检验可能被接受,也可能被否定。否定时可提出备择假设(alternativehypothesis),记作HA:m1≠m2或m1-m2≠0;2)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率,继而查表找出其概率。3)根据“小概率事件实际不可能性原理”否定或接受无效假设,根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设:m1=m2,接受备择假设:m1≠m2,即认为:试验的处理效应是存在的。在t-检验中,备择假设包括了m1>或<m2两种可能。双侧t-检验:在水平上否定域为和,对称地分配在t分布曲线的两侧尾部,每侧的概率为a/2,这种利用两尾概率进行的检验叫双侧检验(two-sidedtest),也叫双尾检验(two-tailedtest),为双侧检验的临界t值。单侧t-检验:这种利用一侧概率进行的检验叫单侧检验(one-sidedtest)也叫单尾检验(one-tailedtest)。此时为单侧检验的临界t值。显然,单侧检验的=双侧检验的。图5-3双侧检验

图5-4单侧检验方差分析的基本原理与步骤线性模型与基本假定设想每一个处理的观察响应值是一个随机变量,m是总均值,ai是第i个处理的唯一的参数(第i个处理效应),ei是随机误差,则:是第i个处理的效应表示处理i对试验结果产生的影响。效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)假设模型误差是独立的正态分布的随机变量,其均值为零,方差为s2方差分析的基本步骤(一)计算各项平方和与自由度。(二)列出方差分析表,计算F值,与临界值比较,进行F检验。(三)若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下:矫正数总平方和处理间平方和处理内平方和总自由度处理间自由度处理内自由度用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方MseF=MSt/MSe=38.09/5.34=7.13**;根据df1=dft=3,df2=dfe=16查F表,得F>F0.01(3,16)=5.29,P<0.01,表明四种不同增溶剂的效果差异极显著

方差分析表多重比较F值显著或极显著,否定了无效假设,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。有必要进行两两处理平均数间的比较,即多重比较(multiplecomparisons)。以具体判断两两处理平均数间的差异显著性多重比较的方法甚多,常用的有最小显著差数法(LSD法)例3的LSD法比较单一自由度的正交比较事先按照一定的原则设计好(k-1)个正交比较,将处理间平方和根据设计要求剖分成有意义的各具一个自由度的比较项,然后用F检验(此时df1=1),这就是所谓单一自由度的正交比较(orthogonalcomparisonofsingledegreeoffreedom),也叫单一自由度的独立比较(independentcomparisonofsingledegreeoffreedom)。单一自由度的正交比较有成组比较和趋势比较两种情况,后者要涉及到回归分析。例4某试验研究不同药物对腹水癌的治疗效果,将患腹水癌的25只小白鼠随机分为5组,每组5只。其中A1组不用药作为对照,A2、A3为用两个不同的中药组,A4、A5为用两个不同的西药组,各组小白鼠的存活天数如下表所示。这是一个单因素试验,其中k=5,n=5,按照前面介绍的方法进行方差分析,可以得到方差分析表,说明组间有显著差异。试验者还想了解:(1)不用药物治疗与用药物治疗;(2)中药与西药;(3)中药A2与中药A3;(4)西药A4与西药A5;相比结果如何?

首先将表中各处理的总存活天数抄于下表,然后写出各预定比较的正交系数Ci(orthogonalcoefficient)。各个比较的正交系数确定后,便可获得每一比较的总和数的差数Di,其通式为:进而可求得各比较的平方和SSi,式中的n为各处理的重复数,本例n=5。SS1+SS2+SS3+SS4正是处理间平方和SSt。这也就是说,利用上面的方法我们已将处理间具4个自由度的平方和再度分解为各具一个自由度的4个正交比较的平方和

查F值表,df1=1,df2=20时,F0.05(1,20)=4.35,F0.01(1,20)=8.10。所以,在这一试验的上述4个比较差异都极显著二、估计协方差组分

在两个相关变量线性相关性质与程度的相关系数的计算公式:若将公式右端的分子分母同除以自由度(n-1),得

下一张

主页

退出

上一张

其中是x的均方MSx,它是x的方差的无偏估计量;是y的均方MSy,它是y的方差的无偏估计量;

称为x与y的平均的离均差的乘积和,简称均积,记为MPxy,即

与均积相应的总体参数叫协方差(covariance),记为COV(x,y)或。统计学证明了,均积MPxy是总体协方差COV(x,y)的无偏估计量,即EMPxy=COV(x,y)。于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示为:

相应的总体相关系数ρ可用x与y的总体标准差、,总体协方差COV(x,y)或表示如下:

均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分析。

在随机模型的方差分析中,根据均方MS和期望均方EMS的关系,可以得到不同变异来源的方差组分的估计值。同样,在随机模型的协方差分析中,根据均积MP和期望均积EMP的关系,可得到不同变异来源的协方差组分的估计值。有了这些估计值,就可进行相应的总体相关分析。

协方差分析的计算步骤如下:

(一)求x变量的各项平方和与自由度

1、总平方和与自由度

dfT(x)=kn-1=4×12-1=47

2、处理间平方和与自由度

=k-1=4-1=3

3、处理内平方和与自由度

(二)求y变量各项平方和与自由度

1、总平方和与自由度

2、处理间平方和与自由度

3、处理内平方和与自由度(三)求x和y两变量的各项离均差乘积和与自由度

1、总乘积和与自由度=kn-1=4×12-1=472、处理间乘积和与自由度

=1.64=k-1=4-1=3

3、处理内乘积和与自由度

平方和、乘积和与自由度的计算结果列于表10—3。

表10—3x与y的平方和与乘积和表

(四)对x和y各作方差分析协方差分析表

(五)协方差分析1、误差项回归关系的分析误差项回归关系分析的意义是要从剔除处理间差异的影响的误差变异中找出y与x之间是否存在线性回归关系。计算出误差项的回归系数并对线性回归关系进行显著性检验,若显著则说明两者间存在回归关系。这时就可应用线性回归关系来校正y值以消去x不同对它的影响。然后根据校正后的y值来进行方差分析。如线性回归关系不显著,则无需继续进行分析。

回归分析的步骤如下:

(1)计算误差项回归系数,回归平方和,离回归平方和与相应的自由度从误差项的平方和与乘积和求误差项回归系数:

误差项回归平方和与自由度

dfR(e)=1

误差项离回归平方和与自由度

=85.08-47.49=37.59

(2)检验回归关系的显著性表回归关系显著性检验表F检验表明,误差项回归关系极显著,因此,可以利用线性回归关系来校正y,并对校正后的y进行方差分析。

2、对校正后的y作方差分析

(1)求校正后的y的各项平方和及自由度利用线性回归关系对y作校正,并由校正后的y计算各项平方和是相当麻烦的,统计学已证明,校正后的总平方和、误差平方和及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平方和及自由度可直接由下述公式计算。①校正y的总平方和与自由度,即总离回归平方和与自由度

=-=47-1=46②校正y的误差项平方和与自由度,即误差离回归平方和与自由度

=-=44-1=43上述回归自由度均为1,因仅有一个自变量x。③校正y的处理间平方和与自由度

=57.87-37.59=20.28(10-15)=k-1=4-1=3(2)列出协方差分析表,对校正后的y进行方差分析查F值:=4.275(由线性内插法计算),由于F=7.63>,P<0.01,表明对于校正后的y不同处理间存在极显著的差异。故须进一步检验不同处理间的差异显著性,即进行多重比较。

表协方差分析表第二节线性代数基础1.矩阵的定义定义1由m×n个数(I=1,2,…,m;j=1,2,…,n)排成的m行n列数表称为m行n列矩阵,简称为m×n矩阵.记为矩阵通常用大写的英文字母A,B,C等表示。称为矩阵A的第i行第j列元素。(1)当m=1时,矩阵只有一行,称为行矩阵,即(2)当n=1时,矩阵只有一列,称为列矩阵,即(3)当m=n时,称A为n阶矩阵或n阶方阵。例1.设则A是一个2×3矩阵,B是一个2阶方阵,A的(2,3)元是1。下面介绍几种常用的特殊矩阵:(1)元素全为零的矩阵称为零矩阵,记作O;以外元素全为零的方阵,即形如(2)主对角线上的元素不全为零,而主对角线的矩阵称为对角矩阵记为例如(3)对角线上元素全为1的n阶对角矩阵:称为n阶单位矩阵。记为I(4)形如的方阵,称为上三角阵.(5)形如的方阵,称为下三角矩阵。(6)逆矩阵(或反矩阵):当矩阵A×B的积为单位矩阵时,B称为A的逆矩阵,记做A-1A可逆的条件是:A为方阵;A的行列式非0;(7)矩阵的转置把矩阵A的行相应转换为列,即xij转置为xji,得到的矩阵称之为A的转置矩阵,记为A’。在实验设计中,模型矩阵X,则X’X称之为信息矩阵(informationmatrix)。为方阵,对主对角线对称。(8)矩阵的行列式(Determinant)矩阵的行列式只是当矩阵为方阵时存在,是一个数,通常记做,对于2×2和3×3矩阵的行列式:(9)正交矩阵:当矩阵A的转置矩阵与逆矩阵相等时,称为正交矩阵。

A’=A-12.两个矩阵相等定义2.若矩阵A与矩阵B的所有对应的元素相等,则A=B。3.矩阵的初等变换定义3

下列三种变换称为矩阵的初等变换1.对调矩阵的任意两行元素,记作2.用数k乘矩阵的某行所有元素,记作3.用数k乘矩阵中某行的每个元素后加到另一行的对应元素上去,记作将定义中的“行”换成“列”,就得到矩阵的初等列变换的定义,将“r”换成“c”,就得到列变换的表示方法.矩阵的初等行变换与初等列变换,统称为矩阵的初等变换.如果矩阵A经过有限次初等变换变成矩阵B,则称矩阵A与B等价,记作上述两个矩阵具有如下特点:(1)每个台阶上只有一行;(2)每个台阶的第一个数不等于零;(3)台阶左下方的元素全为零。具有以上三个特点的矩阵称为行阶梯形矩阵。再观察以下两个阶梯形矩阵:这两个阶梯形矩阵都具有如下特点:(4)每个台阶上的第一个数都是1,并且这些1所在列的其它元素全为零。具有特点(4)的行阶梯形矩阵称为行最简阶梯形矩阵。定理1.1.1每个矩阵都可以经过有限次初等行变换化为行阶梯形矩阵,进而化为行最简阶梯形矩阵。例2试用初等行变换将化为行阶梯形,进而化为行最简阶梯形矩阵。解继续使用初等行变换,将B化为行最简阶梯形矩阵:注:矩阵的初等变换是可逆的4、矩阵的运算加法和减法:行、列一致的矩阵可以进行加、减运算。矩阵的乘法:A×B两个矩阵相乘的条件是前者的列数与后者的行数相等,得到矩阵AB的行数为A的行数,列数为B的列数。其中新矩阵中的元素cij为A矩阵中第i行与B矩阵中第j列相应的元素的乘积之和:矩阵的乘法有结合律,无交换律:(AB)C=A(BC)

AB≠BA第三节回归分析一、回归分析简介二、线性回归三、多元回归一、回归分析简介解析实验结果RSM分析:通常是多项式通常采用最小二乘法(Leastsquaresregression)例1表面活性剂对药物溶解度的影响胆酸盐如胆酸钠、脱氧胆酸钠、甘胆酸钠等常可以在溶液中形成胶束,用于增溶。长链磷脂酰胆碱尽管不能自身形成胶束,但可以嵌合于胆酸盐胶束中形成混合胶束,这种混合胶束可以用于静脉注射,耐受性好。为了考察胆酸盐和卵磷脂对安定溶解度的影响,有人设计了一个析因设计。表1因素-水平表因素-11胆酸盐的浓度(M)X10.0750.125卵磷脂/胆酸摩尔比X20.6/11.4/1表2析因设计表(10次结果)实验No因素、水平表溶解度结果mg/mlX1X2121-1-16.586.3021-110.189.93-119.4110.0341114.1514.7550011.7011.04数学模型2×2析因设计,一个中心对照点数学模型:二、线性回归

y与x之间是一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论