MBA-数据模型与决策2完美版资料_第1页
MBA-数据模型与决策2完美版资料_第2页
MBA-数据模型与决策2完美版资料_第3页
MBA-数据模型与决策2完美版资料_第4页
MBA-数据模型与决策2完美版资料_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.拟合检验法2.两个定性变量的相关性3.两个定量变量的相关性4.线性回归分析5.定性自变量的回归模型6.定量因变量、定性自变量模型--方差分析模型1.拟合检验法检验:总体的分布函数为:总体的分布函数不是如总体为离散型:总体分布率如总体为连续型:总体的概率密度为应用中,将的所有可能取值结果划分为两两互不相交的子集,在零假设下的分布为以记样本观测值中落在的个数,发生的频数一般地,若为真且试验次数又甚多时不应太大.在零假设下,当充分大时,统计量近似地服从.其中,是被估计参数的个数.例1.自1965年1月1日至1971年2月9日共2231天中,全世界记录到的里氏4级和4级以上地震162次统计如下(最长天数40434449586081109):验证相继两次地震间隔天数服从指数分布解:指数分布密度为从数据得到:服从指数分布,:不服从指数分布在零假设下,将的所有可能取值分为9个互不重叠的区间有数据和代入统计量得到而因此不能拒绝零假设例2.下面列出84个Etruscan人男子的头颅的最大宽度,试验证这些数据来自正态分布()解:如果服从正态分布从数据得到参数极大似然估计为数据落在区间[126,158],将它分为7个区间得到可验证:Spearman和Kendall相关系数为1数据落在区间[126,158],将它分为7个区间Pearsonc2统计量点击Data选weightcases点击weightcasesby将var00001选入frequencyvariable点击OK两个定性变量的相关性:总体的分布函数不是sav数据,b0,b1,a1,a2,a3的估计分别为28.如有k个(定量)自变量x1,x2…,xk,因变量y的线性回归模型为中,全世界记录到的里氏4级和4级以上地震162次对Yi=Xi2,Pearson相关系数不为1,但这里b0,b1,…,bk称为回归系数。它们的求法和性质与一个自变量的情况类似。000,拒绝零假设,两个变量有关。不应太大.将数据和代入公式得而在显著水平0.1,不能拒绝零假设.:服从正态分布,:不服从正态分布例3.一农场10年前在一鱼塘按比例20:15:40:25投放了四种鱼的鱼苗,现在鱼塘中得到样本如下解:

:的分布律为将数据和代入公式得而拒绝,即鱼苗比例有显著变化1.先计算npi即600×(0.20,0.15,0.40,0.25)=(120,90,240,150)2.打开SPSS,在变量名var00001下输入数据1,2,3,4,在变量名var00002下输入132,100,200,168,3.点击Data选weightcases点击weightcasesby将var00001选入frequencyvariable点击OK4.选Analyze-nonparametrictests–chi-square,将var00001选入testvariablelist,在expectedvalues处,点击values,敲入120点击Add,敲入90点击Add,敲入240点击Add,敲入150点击Add,点击OK用SPSS进行拟合优度检验

用鱼塘例子说明SPSS结果2.两个定性变量的相关性列联表(contingencytable):各个变量不同水平的交汇处,是这种水平组合出现的频数或计数(count)。二维的列联表又称为交叉表(crosstable)。列联表可以有很多维。维数多的叫做高维列联表。点击Data选weightcases点击weightcasesby将number选入frequencyvariable点击OK选Analyze-DescriptiveStatistics-Crosstabs-将income放入columns将opinion放入rows.点击statistics选chi-square点击continue点击cells,在counts中选expected点击continue不同收入水平的人和观点的确不同,即收入高低的确影响观点。收入高的人不赞成偏多,收入低的人赞成偏多SPSS的相关分析-两个定性变量赞成不赞成收入和观点的相关性

假设检验

H0:观点和收入不相关;H1:这两个变量相关。Pearson

c2统计量和似然比(likelihoodratio)c2统计量;它们都渐近c2分布。例中数据两个p-值小于0.001。收入和观点的条形图

性别和观点的相关性

性别和观点的条形图

3.两个定量变量的相关性研究两个定量变量的关系,最简单的直观办法就是画出它们的散点图。下面是四组数据的散点图;每一组数据表示了两个变量x和y的样本。不相关

正线性相关负线性相关

相关但非线性相关A.Pearson相关系数它取值于-1和1之间。当两个变量Yi=aXi,相关系数为1;而Yi=-aXi,相关系数为-1,其中a为正数.而当两个变量不那么线性相关时,相关系数就接近0。对一列数Pearson相关系数如果为二元正态分布,如假设检验为则统计量在零假设下,服从自由度为的分布.对一列数记为在观测中的秩,而为在观测中的秩.假设检验:不相关;相关(正相关;负相关)B.Spearman秩相关系数Spearman检验统计量:当Si=Ri时,=1;当Si=n-Ri时,=-1在零假设下,当样本量n很大时,如果称对子和为协同的(concordant);如果称对子和为不协同的(disconcordant).令:C.Kendalltau相关系数假设没有情况容易验证如所有对子都协同如所有对子都不协同且

假设检验:不相关;相关在零假设下,当样本量很大时,即:当很大时,应拒绝零假设.Pearson相关系数检验两变量的线性相关性Spearman秩相关系数和Kendall度量更加广义的单调(不一定线性)的关系.对Yi=Xi,三种相关系数均为1对Yi=Xi2,Pearson相关系数不为1,但Spearman和Kendall相关系数为1

例1:初三和高一成绩的Pearson相关系数,Kendallt相关系数和Spearman秩相关系数分别为0.795,0.595和0.758。这三个统计量的p-值均为0.000-小数点后前三位是0.(三个零假设:均为不相关)正相关:初三成绩较高的学生,高一成绩也较高。SPSS的相关分析-两个定量变量打开hischool.sav,选Analyze-Correlate-Bivariate,再把两个变量j3和s1选入variables,选择Pearson,Spearman和Kendall,再点击OK

4.线性回归分析用直线拟合二维空间的点,常用最小二乘回归,即寻找一条直线,使所有点到该直线的豎直距离的平方和最小两个定量变量是否无关等价于假设检验用t检验进行检验。例中,要找初三成绩(因变量)和高一成绩(自变量)的回归直线。

检验零假设:x的系数为0:t检验统计量为9.089,而p-值为0.000,拒绝零假设,两个变量有关。除了检验之外,还有度量拟合好坏的量,即自变量解释因变量变化百分比的度量,叫做决定系数(coefficientofdetermination,也叫测定系数或可决系数),用“R-square”表示。例中,R-square=

4307.206/6810=0.632-自变量大约解释63%的因变量的变化。R2越接近1,回归就越成功。由于R2随变量数目增加而增大,人们对其进行修改;有一修正的R2(adjustedRsquare)。用F分布,检验回归拟合好坏的(零假设是因变量和自变量没有关系)-方差分析表SPSS的回归分析自变量和因变量都是定量变量时的线性回归分析(hischool.sav)利用SPSS选项:Analyze-Regression-Linear再把有关的自变量选入Independent,把因变量选入Dependent,然后OK即可。如果自变量有多个(多元回归模型),只要都选入就行。最小二乘估计:求使达最小.解下面方程得的最小二乘估计:附1称为处的残查.称为残查平方和.可验证:;即为的无偏估计.附2线性假设的显著性检验可以验证:其中附3又因独立性,有:即在零假设成立下附4检验:拒绝域:系数的置信水平为的置信区间附5Pearson相关系数检验两变量的线性相关性从数据得到参数极大似然估计为将数据和H0:观点和收入不相关;H1:这两个变量相关。:服从指数分布,:不服从指数分布近似地服从.25)=(120,90,240,150)用F分布,检验回归拟合好坏的(零假设是因变量和自变量没有关系)-方差分析表用F分布,检验回归拟合好坏的(零假设是因变量和自变量没有关系)-方差分析表:总体的概率密度为打开hischool.拟合检验法数据落在区间[126,158],将它分为7个区间如果称对子和Spearman秩相关系数和Kendall度量更加广义的单调(不一定线性)的关系.;的置信水平为的置信区间为附6的置信水平为的置信区间为附7多个定量自变量的线性回归分析如有k个(定量)自变量x1,x2…,xk,因变量y的线性回归模型为这里b0,b1,…,b

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论