




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.拟合检验法2.两个定性变量的相关性3.两个定量变量的相关性4.线性回归分析5.定性自变量的回归模型6.定量因变量、定性自变量模型--方差分析模型1.拟合检验法检验:总体的分布函数为:总体的分布函数不是如总体为离散型:总体分布率如总体为连续型:总体的概率密度为应用中,将的所有可能取值结果划分为两两互不相交的子集,在零假设下的分布为以记样本观测值中落在的个数,发生的频数一般地,若为真且试验次数又甚多时不应太大.在零假设下,当充分大时,统计量近似地服从.其中,是被估计参数的个数.例1.自1965年1月1日至1971年2月9日共2231天中,全世界记录到的里氏4级和4级以上地震162次统计如下(最长天数40434449586081109):验证相继两次地震间隔天数服从指数分布解:指数分布密度为从数据得到:服从指数分布,:不服从指数分布在零假设下,将的所有可能取值分为9个互不重叠的区间有数据和代入统计量得到而因此不能拒绝零假设例2.下面列出84个Etruscan人男子的头颅的最大宽度,试验证这些数据来自正态分布()解:如果服从正态分布从数据得到参数极大似然估计为数据落在区间[126,158],将它分为7个区间得到可验证:Spearman和Kendall相关系数为1数据落在区间[126,158],将它分为7个区间Pearsonc2统计量点击Data选weightcases点击weightcasesby将var00001选入frequencyvariable点击OK两个定性变量的相关性:总体的分布函数不是sav数据,b0,b1,a1,a2,a3的估计分别为28.如有k个(定量)自变量x1,x2…,xk,因变量y的线性回归模型为中,全世界记录到的里氏4级和4级以上地震162次对Yi=Xi2,Pearson相关系数不为1,但这里b0,b1,…,bk称为回归系数。它们的求法和性质与一个自变量的情况类似。000,拒绝零假设,两个变量有关。不应太大.将数据和代入公式得而在显著水平0.1,不能拒绝零假设.:服从正态分布,:不服从正态分布例3.一农场10年前在一鱼塘按比例20:15:40:25投放了四种鱼的鱼苗,现在鱼塘中得到样本如下解:
:的分布律为将数据和代入公式得而拒绝,即鱼苗比例有显著变化1.先计算npi即600×(0.20,0.15,0.40,0.25)=(120,90,240,150)2.打开SPSS,在变量名var00001下输入数据1,2,3,4,在变量名var00002下输入132,100,200,168,3.点击Data选weightcases点击weightcasesby将var00001选入frequencyvariable点击OK4.选Analyze-nonparametrictests–chi-square,将var00001选入testvariablelist,在expectedvalues处,点击values,敲入120点击Add,敲入90点击Add,敲入240点击Add,敲入150点击Add,点击OK用SPSS进行拟合优度检验
用鱼塘例子说明SPSS结果2.两个定性变量的相关性列联表(contingencytable):各个变量不同水平的交汇处,是这种水平组合出现的频数或计数(count)。二维的列联表又称为交叉表(crosstable)。列联表可以有很多维。维数多的叫做高维列联表。点击Data选weightcases点击weightcasesby将number选入frequencyvariable点击OK选Analyze-DescriptiveStatistics-Crosstabs-将income放入columns将opinion放入rows.点击statistics选chi-square点击continue点击cells,在counts中选expected点击continue不同收入水平的人和观点的确不同,即收入高低的确影响观点。收入高的人不赞成偏多,收入低的人赞成偏多SPSS的相关分析-两个定性变量赞成不赞成收入和观点的相关性
假设检验
H0:观点和收入不相关;H1:这两个变量相关。Pearson
c2统计量和似然比(likelihoodratio)c2统计量;它们都渐近c2分布。例中数据两个p-值小于0.001。收入和观点的条形图
性别和观点的相关性
性别和观点的条形图
3.两个定量变量的相关性研究两个定量变量的关系,最简单的直观办法就是画出它们的散点图。下面是四组数据的散点图;每一组数据表示了两个变量x和y的样本。不相关
正线性相关负线性相关
相关但非线性相关A.Pearson相关系数它取值于-1和1之间。当两个变量Yi=aXi,相关系数为1;而Yi=-aXi,相关系数为-1,其中a为正数.而当两个变量不那么线性相关时,相关系数就接近0。对一列数Pearson相关系数如果为二元正态分布,如假设检验为则统计量在零假设下,服从自由度为的分布.对一列数记为在观测中的秩,而为在观测中的秩.假设检验:不相关;相关(正相关;负相关)B.Spearman秩相关系数Spearman检验统计量:当Si=Ri时,=1;当Si=n-Ri时,=-1在零假设下,当样本量n很大时,如果称对子和为协同的(concordant);如果称对子和为不协同的(disconcordant).令:C.Kendalltau相关系数假设没有情况容易验证如所有对子都协同如所有对子都不协同且
假设检验:不相关;相关在零假设下,当样本量很大时,即:当很大时,应拒绝零假设.Pearson相关系数检验两变量的线性相关性Spearman秩相关系数和Kendall度量更加广义的单调(不一定线性)的关系.对Yi=Xi,三种相关系数均为1对Yi=Xi2,Pearson相关系数不为1,但Spearman和Kendall相关系数为1
例1:初三和高一成绩的Pearson相关系数,Kendallt相关系数和Spearman秩相关系数分别为0.795,0.595和0.758。这三个统计量的p-值均为0.000-小数点后前三位是0.(三个零假设:均为不相关)正相关:初三成绩较高的学生,高一成绩也较高。SPSS的相关分析-两个定量变量打开hischool.sav,选Analyze-Correlate-Bivariate,再把两个变量j3和s1选入variables,选择Pearson,Spearman和Kendall,再点击OK
4.线性回归分析用直线拟合二维空间的点,常用最小二乘回归,即寻找一条直线,使所有点到该直线的豎直距离的平方和最小两个定量变量是否无关等价于假设检验用t检验进行检验。例中,要找初三成绩(因变量)和高一成绩(自变量)的回归直线。
检验零假设:x的系数为0:t检验统计量为9.089,而p-值为0.000,拒绝零假设,两个变量有关。除了检验之外,还有度量拟合好坏的量,即自变量解释因变量变化百分比的度量,叫做决定系数(coefficientofdetermination,也叫测定系数或可决系数),用“R-square”表示。例中,R-square=
4307.206/6810=0.632-自变量大约解释63%的因变量的变化。R2越接近1,回归就越成功。由于R2随变量数目增加而增大,人们对其进行修改;有一修正的R2(adjustedRsquare)。用F分布,检验回归拟合好坏的(零假设是因变量和自变量没有关系)-方差分析表SPSS的回归分析自变量和因变量都是定量变量时的线性回归分析(hischool.sav)利用SPSS选项:Analyze-Regression-Linear再把有关的自变量选入Independent,把因变量选入Dependent,然后OK即可。如果自变量有多个(多元回归模型),只要都选入就行。最小二乘估计:求使达最小.解下面方程得的最小二乘估计:附1称为处的残查.称为残查平方和.可验证:;即为的无偏估计.附2线性假设的显著性检验可以验证:其中附3又因独立性,有:即在零假设成立下附4检验:拒绝域:系数的置信水平为的置信区间附5Pearson相关系数检验两变量的线性相关性从数据得到参数极大似然估计为将数据和H0:观点和收入不相关;H1:这两个变量相关。:服从指数分布,:不服从指数分布近似地服从.25)=(120,90,240,150)用F分布,检验回归拟合好坏的(零假设是因变量和自变量没有关系)-方差分析表用F分布,检验回归拟合好坏的(零假设是因变量和自变量没有关系)-方差分析表:总体的概率密度为打开hischool.拟合检验法数据落在区间[126,158],将它分为7个区间如果称对子和Spearman秩相关系数和Kendall度量更加广义的单调(不一定线性)的关系.;的置信水平为的置信区间为附6的置信水平为的置信区间为附7多个定量自变量的线性回归分析如有k个(定量)自变量x1,x2…,xk,因变量y的线性回归模型为这里b0,b1,…,b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45250-2025电信和互联网服务标准化工作指南
- 北京航空航天大学北海学院《欧美文学名家研究》2023-2024学年第二学期期末试卷
- 中国地质大学(北京)《跨文化交流概论》2023-2024学年第一学期期末试卷
- 2025届甘肃省兰州市第五十五中学高三5月调研考试(生物试题文)试题含解析
- 云南农业大学《经典心理咨询与治疗技术》2023-2024学年第二学期期末试卷
- 更换地毯施工方案
- 墙面开槽施工方案
- 开化隧道施工方案
- 信息技术 第二册(五年制高职)课件 9.2.5 计算机视觉技术的安全隐患
- 住宅老旧电梯更新改造工作指南汇报- 中国电梯协会
- 课题申报书:大语言模型增强中学生科学探究实践的路径和机制研究
- 湖北省武汉市部分重点中学2025届高三第一次调研测试数学试卷含解析
- 2025年山东高速集团招聘笔试参考题库含答案解析
- 《永辉超市S店库存管理问题及产生原因和优化建议》8700字(论文)
- 《家用电器销售管理系统的设计与实现》2000字(论文)
- 酸及其性质(第一课时)课件九年级化学(2024)下册
- 《高速公路服务区开放设置技术要求》
- 2024年度出国留学保证金保函2篇
- 简易窗户安装合同范例
- 长江经济带发展规划纲要
- 污水处理厂提标改造工程施工组织设计
评论
0/150
提交评论