版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS练习题及简答
SPSS练习题
1、现有两个SPSS数据文件,分别为“学生成绩一”和“学生成绩二”,
请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数
据文件。先排序data---sortcases再合并data―mergefiles
2、有一份关于居民储蓄调查的数据存储在EXCEL中,请将该数据转换
成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。转换
Data—transpose,输题目
3、利用第2题的数据,将数据分成两份文件,其中第一份文件存储
常住地是“沿海或中心繁华城市”且本次存款金额在1000-2000之间的调
查数据,第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
选取数据data-selectcases
4、利用第2题数据,将其按常住地(升序)、收入水平(升序)存款
金额(降序)进行多重排序。排序data—sortcases一个一个选,力口
5、根据第1题的完整数据,对每个学生计算得优课程数和得良课程
数,并按得优课程数的降序排序。计算transform-count按个输,把所有
课程选取,define设区间,再排序
6、根据第1题的完整数据,计算每个学生课程的平均分和标准差,
同时计算男生和女生各科成绩的平均分。描述性统计,先转换
Data—transpose学号放下面,全部课程(poli到his)放上面,ok,
analyze---descriptivestatistics---descriptives,全选,optionso先拆分
data—splitfile按性别拆分,analyze—descriptivestatistics---descriptives全选
所有课程options---mean
7、利用第2题数据,大致浏览存款金额的数据分布状况,并选择恰
当的组限和组距进行组距分组。数据分组Transform-recode-下面一个,
输名字,change,old,range,newvalue---add挨个输,从小加到大,等距
8、在第2题的数据中,如果认为调查“今年的收入比去年增加”且
“预计未来一两年收入仍会会增加”的人是对自己收入比较满意和乐观的
人,请利用SPSS的计数和数据筛选功能找到这些人。(计算
transform-count或)选取data---selectcases
9、利用第2题数据,采用频数分析,分析被调查者的常住地、职业
和年龄分布特征,并绘制条形图。Analyze---descriptive
statistics---frequencies
10、利用第2题数据,从数据的集中趋势、离散程度和分布形状等角
度,分析被调查者本次存款金额的基本特征,并与标准分布曲线进行对比,
进一步,对不同常住地住房存款金额的基本特征进行对比分析。AnDSd
Analyze---DescriptiveStatistics—Descriptives,选择存款金额到Variable(s)中。
按Option,然后选择
Mean,std.deviation,Minlmum,Variance,Maximum,Range,Kutosis,Skewness,Vari
able
list.然后按continue,ok
11、将第1题的数据看作来自总体的样本,试分析男生和女生的课程
平均分是否存在显著差异;试分析哪些课程的平均差异不显著。
Transformcompute课程平均分=171620()analyze->compare
means->ind叩endent-samplesT;选择若干变量作为检验变量到test
variables框(课程平均分);选择代表不同总体的变量(sex)作为分组变
量到groupingvariable框;.定义分组变量的分组情况DefineGroups...:(填
1,2)o1.两总体方差是否相等F检验:F的统计量的观察值为0.257,对应
的P值为0.614,;如果显著性水平为0.05,由于概率P值大于0.05,两种方式
的方差无显著差异.看eaualvariancesassumend。2.两总体均值的检验:.T
统计量的观测值为-0.573,对应的双尾概率为0.569,T的P值>显著水平0.05,
故不能推翻原假设,所以女生男生的课程平均分无显著差异。
酉己对差异:analyze->comparemeans->paired-samples「“paired
variables框中每科与不同科目配对很麻烦略
12、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试
的话,一般平均得分为
75,现从雇员中随机随出11人参加考试,得分如下:80、81、72、
60、78、65、56、79、
77、87、76,请问该经理的宣称是否可信?
步骤:采用单样本T检验(原假设H0:u=u0,总体均值与检验值之间不
存在显著差异.);菜单选项:Analyze->comparemeans->one-samplesT
test;指定检验值:在test后的框中输入检验值(填75),最后ok!分析:N=ll
人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误
差(stderrormean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概
率P-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%
的置信区间,为卜7.68,5.14),由此采用双尾检验比较a和p。T统计量观测值
的双尾概率P-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;
且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14
内,75包括在置信区间内,所以经理的话是可信的。
13、利用促销方式数据,试分析这三种推销方式是否存在显著差异,
绘制各组均值的对比图,
并利用LSD方法进行多重比较检验。单因素方差分析对比图为
options中的descriptives
LSD为post…中的P值大于a接受所以无关
14、已知240例心肌梗塞患者治疗后24小时内的死亡情况如表1所
示,问两组病死亡率相
差是否显著?(examplel.sav)(显著性水平为5%)
表1:急性心肌梗塞患者治疗后24小时生死情况
•提出假设
H0:是否接受治疗的急性心肌梗塞患者的病死率相差不显著
H1:是否接受治疗的急性心肌梗塞患者的病死率相差显著
•操作步骤:
1、打开数据文件:file—open—data—examplel.sav2、对count变量
进行weightcases处理:data-weightcases
选中weightcasesby;在Frequenciesvariable中力口入变量count。3、
对数据进行交叉汇总,如得出的下列频次交叉表,如图表3—1:用
descriptive-crosstab过程,column填status,row填group。在cell选项中,
选中percentages,以计算频数百分比。
•统计表格及分析:
表3-1是否接受治疗与生存状况的相关性检验成果表(Chi-Square
Tests)
Asymp.Sig.
PearsonChi-SquareLinear-by-LinearAssociation有效个案数
Value6.040(b)6.015240
df11
(2-sided).014.014
表3—1是相关性卡方检验成果表。表中依次列出了Pearson卡方系数、
线性相关的值(Value)、自由度(df)和双尾检验的显著水平(Asymp.Sig.
(2-sided))o
表3-2显示了根据是否使用单参注射液对急性心肌梗塞患者进行分
组后,患者的生存和死亡状况频数和所占总数的百分比。
表3-2急性心肌梗塞患者是否治疗与生死情况的列联表
分组(group))总数
用单参注射液
未用单参注射液
Count
%within分组(group)Count
%within•分组(group)Count
%within•分组(group)
状况(status)
总数195100.0%45100.0%240100.0%
生存
18594.9%3884.4%22392.9%
死亡
105.1%715.6%177.1%
•结论:
根据表3—1可以看出,双侧检验的显著性概论为0.014,小于显著性
水平0.05;因此否定原假设,接受备择假设,即两组患者的完全缓解率之
间差别显著。
15、已知数据如表2所示,比较单用甘磷酰芥(单纯化疗组)与复合
使用光霉素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效,问两
组患者的完全缓解率之间有无差别?(example2.sav)(显著性水平为5%)
表2:两化疗组的缓解率比较
同上小于拒绝显著
16、已知数据如表3所示,问我国南北方鼻咽癌患者(按籍贯分)的
病理组织学分类的构成比有无差别?(example3.sav)(显著性水平为5%)
同上小于拒绝显著
表3:我国南北方鼻咽癌患者病理组织学分类构成
17、已知97名被调查儿童体检数据文件为child.sav,请分别计算男性、
女性与两性合计的儿童的平均身高与体重、中位身高与体重以及身高与体
重的标准差。1、打开数据文件:file—open—'data—child.sav
2、均值比较与检验:Analyze—Comparemeans—means3^在
independentVar.中选性别,dependentVan中选体重和身高4、在option
子框中选择median/mean/Std.Deviation
1、男性儿童的平均身高为109.962厘米;平均体重为18.202千克;
中位身高为109.10厘米;中位体重为17.50千克;身高的标准差为6.084
厘米;体重的标准差为2.786千克。2、女性儿童的平均身高为109.896
厘米;平均体重为18.389千克;中位身高为109.450厘米;中位体重为
17.750千克;身高的标准差为5.770厘米;体重的标准差为3.235千克。3、
两性儿童的平均身高为109.930厘米;平均体重为18.292千克;中位身高
为109.250厘米;中位体重为17.605千克;身高的标准差为5.905厘米;
体重的标准差为2.995千克。
18、已知97名被调查儿童体检数据文件为child.sav,请问儿童的身高
与体重是否分别受到性别与年龄的影响?(显著性水平为5%)
•提出假设:
1、H0:身高与体重受到年龄的影响不显著H1:身高与体重受到年
龄的影响显著2、H0:身高与体重受到性别的影响不显著H1:身高与
体重受到性别的影响显著
•操作步骤:
1、打开数据文件:file—open—data—child.sav2、均值比较与检验:
analysis—comparemeans-means
3、在independentVar.中选性别和年龄,dependentVar.中选体重和
身高4、在option子框中选择median/mean/Std.Deviation
在statisticforfirstlayer区域内勾上ANOVAtableandeta复选框
•统计表格及分析:
表7—1体重、身高与年龄的方差分析表
Mean
体重(x4,kg)*年龄(age)
身高(x5,cm)*年龄(age)
BetweenGroupsWithinGroupsTotal
BetweenGroupsWithinGroupsTotal
SumofSquares
286.215565.918852.1331757.7071554.8553312.562
df2939529395
Square143.1076.085878.85316.719
F23.51852.567
Sig..000
.000
在表7—1中,分别列出了平方和(SumofSquares)、自由度(df)、
均方差(MeanSquare)、F值以及F值的显著性水平(Sig.)。F对应的概率
值P(sig)Va(a=0.05);故拒绝原假设,接受备择假设,即身高与体重
受到年龄的影响显著。
表7—2体重、身高与性别的方差分析表
Square
体重(x4,kg)*性别(x2)
身高(x5,cm)*性别(x2)
BetweenGroupsWithinGroupsTotal
BetweenGroupsWithinGroupsTotal
1949519495
.8399.056.10535.239
.093.003
.762.956
在表7—2中,F对应的概率值P(sig)>a(a=0.05);故接受原假
设,即身高与体重受到性别的影响不显著。
19、文件example.sav中列出了某学校四个年级同学接受专业训练前
后的铁饼成绩,问接受专业训练后同学们的铁饼成绩有无显著提高?(显
著性水平为5%)
统计表格及分析:
表8—1配对样本的相关性分析表
H0:铁饼(训练前)和铁饼(训练后)的数据之间不存在线性关系
H1:铁饼(训练前)和铁饼(训练后)的数据之间存在线性关系
表8—1列出了配对样本的个数(N)、相关系数(Correlation)、显著
性概率(Sig.)o显著性概率趋近于0,远小于0.05,所以认为铁饼(训练
前)和铁饼(训练后)的数据之间存在线性关系。
表8—2配对样本T检验的成果表
Sig.
Std.
Pair1
铁饼(训练前)-铁饼(训练后)
表8-2中为铁饼(训练前)和铁饼(训练后)的数据的T检验结果。
表中前4项分别
-.2417
.4323
.0882
-.4242
-.0591-2.739
23
.012
Mean
Deviation
PairedDifferences
Std.ErrorMean
95%ConfidenceIntervaloftheDifferenceLower
Upper
t
df
(2-tailed)
为配对样本数据差异的均值(Mean)、标准离差(Std.Deviation)>均
值的标准差(Std.Error
Mean)以及95%置信区间。后3项为t值(t)、自由度(df)和双尾
显著性概率表中双尾显著性概率为远小
(Sig.(2-tailed))o0.012,
于0.05,故拒绝原假设,接受备择假设,认为配对样本之间有显著差异,
即接受专业训练后同学们的铁饼成绩提高显著。
•结论:
铁饼(训练前)和铁饼(训练后)的数据之间存在线性关系。且配
对样本之间有显著差异,即接受专业训练后同学们的铁饼成绩有显著提高。
20、文件example.sav中列出了某学校四个年级同学的外语与中文成
绩,问男女生总成绩(英文+中文)之间有无显著差异?(显著性水平为
5%)做法:先计算出总成绩,计算方法:Transform菜单栏下的Compute
Variable选项
总成绩计算出来之后,选择Analyze选项下CompareMeans选项下“两
独立样本T检验”选项卡
将总成绩放入TestVariable一栏中,性别放入GroupingVariable一栏中
并为其定义。点0k即可得出结果。
结果分析:方差齐次性,采用F检验,0.235,大于0.05,所以认为男
女生总成绩两样本的的方差是没有显著性差异的;
校正t检验的显著性水平Sig(2-tailed)为0.951,大于0.05,所以男
女生总成绩之间没有显著性差异。
21、根据以往的资料,学生中文的平均成绩为80分。文件example.sav
中列出了某学校四个年级学生的中文成绩,问学生中文成绩有无显著的下
降?(显著性水平为5%)•提出假设:
HO:U=50(U-50=0);即学生中文成绩无显著的下降。
Hl:UW50(口-50W0);即学生中文成绩有显著的下降。
•操作步骤:
1、打开数据文件:file—open—data—example.sav
2、单一样本的均值检验:analysis—comparemeans—OneSampleT
Test
3、在testvalue中输入80,在testVariable中选"中文
4、在options中输入显著性水平5%
•统计表格及分析:
中文表9—1数据统计量表
N24
Mean78.54Std.Deviation11.159Std.ErrorMean2.278
表9—1为单样本数据的统计量表,列出了变量“中文”对应的数据
个数(N)、均值(mean)、标准离差(Std.Deviation)、均值的标准差(Std.
ErrorMean)。
表9—2单样本均值检验成果表
表9-2为单样本均值检验的成果表。表中分别为t值(t)、自由度(df)
和双尾显著性概率(Sig.(2-tailed))均值差(MeanDifference)以及均值差
的95%置信区间。
表中的显著性概率为0.528,远大于0.05;因此,可以认为该样本数
据的均值与总体均值之间没有显著差异。故接受原假设,即学生中文成绩
无显著的下降。
,结论:
样本数据的均值与总体均值之间没有显著差异,即学生中文成绩无显
著的下降。
22、文件example.sav中列出了某学校四个年级同学的英文成绩,问
学生英文成绩是否受到年级因素的影响?(显著性水平为5%)
HO:U1=U2=U3;即学生英文成绩不受年纪影响。
H1:U1,口2、U3不完全相等;即学生英文成绩受年纪影响。
•操作步骤:
1、打开数据文件:file—open-data-example.sav
2、单因方差分析检验:Analysis—CompareMeans—One-WayANOVA
3、在udependentlistn列表中输入变量名"英语";在"factor”文
本框中输入变量名“年
纪二
4、在options中输入显著性水平5%
•统计表格及分析:
表10—1数据方差分析表
Sumof
BetweenGroupsWithinGroupsTotal
Squares105.0002475.0002580.000
df32023
MeanSquare35.000123.750
F.283
Sig..837
表10—1中分别列出了方差来源、平方和(SumofSquares)、自由度
(df)、均方差(MeanSquare)、F值以及F值的显著性水平(Sig.)o由于
表中的显著性水平为0.837,远大于0.05;
故接受原假设,即认为学生英文成绩不受年级影响。
23、已知10名20岁男青年身高与臂长的数据,请计算其相关系数,
身高与臂长间存在显著的相关关系吗?(显著性水平为5%)(example4.sav)
表4青年身高与臂长的数据
•提H0:身高与臂长间不存在显著的相关关系。
H1:身高与臂长间存在显著的相关关系。
•操作步骤:
1、打开数据文件:file—open—data—example4.sav2、相关性检验:
Correlation-Bivariate
3、选择Pearson(积距相关);在option子框中选择means/Sd.
•统计表格及分析:
表11-1描述统计量表Mean172.5045.40
Std.Deviation
10.3412.951
N1010
身高(cm)臂长(cm)
表11-1为描述统计量表。表中列出的统计量包括变量的均值(Mean)、
标准离差(Std.Deviation)和数据个数(N)。
表11—2相关分析成果表
身高(cm)
臂长(cm)
PearsonCorrelationSig.(1-tailed)N
PearsonCorrelationSig.(1-tailed)N
身高(cm)
110.823(**).00210
臂长(cm)
.823(**).00210110
**Correlationissignificantatthe0.01level(1-tailed)
表11—2为相关分析成果表,表中列出了2个变量之间的Pearson相
关系数、单侧显著
性检验概率和数据组数脚注内容显示相关分
(Sig.(1-tailed))(N)o
析结果在0.01的水平上显著。另外,从表中可以看出,显著性概率为0.002,
远小于0.05,故拒绝原假设,接受备择假设;可以认为身高和臂长的数据
有较强的相关性。
,结论:
根据相关性分析结果,可知身高与臂长间存在显著的相关关系,其相
关系数为0.823,属于强相关。
24、已知学生铁饼与标枪的数据,请计算其相关系数?(example.sav)
•提出假设:
H0:学生铁饼与标枪成绩之间不存在显著关系。
Hl:学生铁饼与标枪成绩之间存在显著关系。
•操作步骤:
1>打开数据文件:file—open—data—example.sav2^相关性检验:
Correlation-Bivariate
3、选择Pearson(积距相关);在option子框中选择means/Sd.
•统计表格及分析:
表12-1描述统计量表
表11-1为描述统计量表。表中列出的统计量包括变量的均值(Mean)、
标准离差(Std.Deviation)和数据个数(N)。
表12—2相关分析成果表
标枪(m)
铁饼(训练前)
PearsonCorrelation
Sig.(1-tailed)
N
PearsonCorrelation
Sig.(1-tailed)
N
标枪(m)
124.644(**).00024
铁饼(训练前)
.644(**).00024124
**Correlationissignificantatthe0.01level(1-tailed).
表12—2为相关分析成果表,表中列出了2个变量之间的Pearson相
关系数、单侧显著性检验概率(Sig.(l-tailed))和数据组数(N)。脚注内
容显示相关分析结果在0.01的水平上显著。另外,从表中可以看出,显著
性概率趋近于0,故拒绝原假设,接受备择假设,即学生铁饼与标枪成绩
之间存在显著关系。
•结论:
学生的铁饼与标枪的数据有较强的相关性,其相关系数为0.644。
25、已调查97名儿童的生长发育数据,其中有左眼视力(x9)、右眼
视力(xlO),并已建立数据文件child.sav。试问左眼视力(x9)与右眼视
力(X10)间有无相关关系?(显著性水平为5%)
•提出假设:
HO:U1-U2=0,即左眼视力与右眼视力间不存在显著的相关关系。
Hl:Ul—U2W0,即左眼视力与右眼视力间存在显著的相关关系。
•操作步骤:
1、打开数据文件:file—open—data—child.sav2^相关性检验:
Correlation-Bivariate
3、选择Pearson(积距相关);在option子框中选择means/Sd.4、在
options中输入显著性水平5%
•统计表格及分析:
表13-1描述统计量表
Mean1.0391.033
Std.Deviation
,2946.2933
N9696
左眼视力(x9)右眼视力(xlO)
表13-1为描述统计量表。表中列出的统计量包括变量的均值(Mean)、
标准离差(Std.Deviation)和数据个数(N)。
表13—2相关分析成果表
PearsonCorrelationSig.(1-tailed)N
左眼视力(x9)
196
右眼视力(xlO)
.779(**).00096
左眼视力(x9)
右眼视力(xlO)
PearsonCorrelationSig.(1-tailed)N
.779(**).00096
196
**Correlationissignificantatthe0.01level(1-tailed).
表13—2为相关分析成果表,表中列出了2个变量之间的Pearson相
关系数、单侧显著性检验概率(Sig.(1-tailed))和数据组数(N)。脚注内
容显示相关分析结果在0.01的水平上显著。另外,从表中可以看出,显著
性概率趋近于0,远小于0.05,故拒绝原假设,接受备择假设;可以认为
儿童左眼视力与右眼视力有较强的相关性。
•结论:
儿童左眼视力与右眼视力有较强的相关性,其相关系数为0.779o
26>某地29名13岁男童身高(xl,cm),体重(x2,kg)及肺活量
(y,L)的实测数据文件是:example5.savo试计算其简单相关系数,当体
重(x2)被控制(即固定)时,计算身高(xl)与肺活量(y)的偏相关系
数r31.2,并作假设检验
•提出假设:
H0:身高与肺活量的偏相关系数与零无显著差异。
H1:身高与肺活量的偏相关系数与零有显著差异。
•操作步骤:
1、打开数据文件:file—open—data—example5.sav2、偏相关计算:
Analyze-Correlate-Partial
3、把参与分析的变量“身高"、“肺活量”选择到Variables;将控制
变量"体重”选择到Controllingforo
在option中的statistics中选择Zero-orderCorrelations,表示输出零阶
偏相关系数。
•统计表格及分析:
表14-1偏相关因素的偏相关分析成果表
ControlVariables-none-(a)
CorrelationSignificance(2-tailed)df
身高(cm)
1.000.0
肺活量(L)
.588.00127
体重(kg)
.742.00027
身高(cm)
体重(kg)
肺活量(L)
体重(kg)
身高(cm)
肺活量(L)
CorrelationSignificance(2-tailed)df
CorrelationSignificance(2-tailed)df
CorrelationSignificance(2-tailed)df
CorrelationSignificance(2-tailed)df
.588.00127.742.000271.000.0.093.63926
1.000.0.736.00027.093.639261.000.0
.736.000271.000.0
aCellscontainzero-order(Pearson)correlations.
由上表可以知道一系列简单相关系数和当体重被控制时、身高与肺活
量的偏相关系数。检验统计量的概率P值为0.639,大于给定的显著性水
平0.05;故接受原假设,认为身高与肺活量的偏相关系数与零无显著差异。
,结论:
1、男童身高与体重的简单相关系数为0.742;肺活量与身高的简单相
关系数为0.588;体重与肺活量的简单相关系数为0.736o
2、身高与肺活量的偏相关系数为0.093,P=0.639。身高与肺活量的偏
相关系数与零无显著差异,即身高与肺活量无显著的的偏相关。
27、世界各国的统计数据表明:妇女生育率与人均国民生产总值之间
呈现出对数关系。请依据example6.sav中所提供的数据写出其回归方程与
多元相关系数,在显著水平为5%时显著吗?[Analyze]->[Regression]—
[Linear]
28、文件example7.sav中列出了我国分地区家庭年人均食品支出、人
均收入与粮食单价的数据。请建立人均食品支出与人均收入间的一元线性
回归方程,,同时建立人均食品支出与人均收入和粮食单价间的二元线性回
归方程。
•操作步骤:
1、打开数据文件:file—open—data—example7.sav2、线性回归:
Analyze-Regression-Linear
3、一元线性回归方程:在dependent中输入变量”人均食品支出”;
在independent中输入变量”人均收入二
<Analyze>-<Correlate>-<Bivariate
4、二元线性回归方程:在dependent中输入变量“人均食品支出”;
在independent中输入变量“人均收入”和“粮食单价二
•统计表格及分析:
表15-1相关系数矩阵
PearsonCorrelation
Sig.(1-tailed)N
人均食品支出
1.000.923..0003030
人均收入
.9231.000.000.3030
人均食品支出
人均收入人均食品支出人均收入
人均食品支出人均收入
•提出假设:
H0:人均食品支出和变量人均收入之间无显著关系。H1:
人均食品支出和变量人均收入之间有显著关系。
表15—1为相关系数矩阵。表中第二行为相关系数矩阵;第三行为不
相关的显著性水平。变量人均食品支出和变量人均收入的相关系数为0.923,
说明两者关系紧密。单尾显著性检验的概率值趋近于0,所以拒绝两变量
没有相关性的假设,接受备择假设,即人均食品支出和人均收入之间有显
著关系。
表15—2数据方差分析表Sumof
Model1
RegressionResidualTotal
Squares878382.334152621.1321031003.467
df12829
MeanSquare878382.3345450.755
F161.149
Sig..000(a)
表15—2为方差分析表。利用该表作回归系数的显著性检验。表中列
出了回归项(Regression)、残差项(Residual)的平方和(SumofSquares)、
自由度(df)、均方(MeanSquare)F值和显著性概率(Sig.)。由于表中的
显著性概率趋近于0,小于0.05;所以拒绝原假设,即认为回归系数不为
零,回归方程是有意义的。
表15-3一元线性回归方程系数表
Std.
Model1(Constant)人均收入
B-53.086
.422
Error67.963.033
.923
-.78112.694
.441.000
LowerBound-192.303
.354
UpperBound86.131.490
Zero-orderPartial
.923
.923
Part
.923
Tolerance
1.000
VIF
1.000
表15-3中列出了变量人均收入和常数项的非标准化系数
(UnstandardizedCoefficients),标准化系数(StandardizedCoefficients)、t
值、显著性水平(Sig.)和自变量待定系数取值与常数项的95%置信区间。
自变量还列出了各种相关性指标和线性统计量。
表中变量人均收入的显著性水平概率(sig.)趋近于0,所以变量的待
定系数取值(B)是可靠的。所以人均食品支出与人均收入间的一元线性
回归方程:Y=-53.086+0.422X
•同上方法,可进行二元线性回归方程计算。
表15-4二元线性回归方程系数表
Unstandardized
Model1
(Constant)
Coefficients
Std.
B-85.196
,360187.621
Error63.90
3.04076.27
5
Beta
-1.333.787.213
9.0842.460
.194.000.021
StandardizedCoefficients
t
Sig.
95%ConfidenceIntervalforBLowerBound-216.314
.279
UpperBound45.922.442
Zero-orderPartial
.923.714
.868.428
Part
.608.165
Correlations
CollinearityStatisticsTolerance
.596.596
VIF
1.6781.678
人均收入粮食价格
31.117344.124
表中变量“人均收入”和“粮食价格”的显著性水平概率(sig.)都小
于0.05,故认为其待定系数取值是可靠的。所以,人均食品支出与人均收
入和粮食单价间的二元线性回归方程二元方程:
Y=-85.196+0.36X1+187.621X2
•结论:
1、人均食品支出与人均收入间的一元线性回归方程:Y=-53.086+0.422X
2、人均食品支出与人均收入和粮食单价间的二元线性回归方程二元
方程:
Y=-85.196+0.36X1+187.621X2
29、钩虫病复查阳性率y和治疗次数X有如下关系:
表5:阳性率(y)和治疗次数(x)
请用曲线估计法作多种曲线拟合,并请指出那种拟合效果最好?为什
么?(curvel.sav)[Analyze]->[Regression]->[CurveEstimation]
30、已知数据文件:hemoglo.savo试分别建立Ca、Mg、Fe、Mn与
Cu对hemogl的直线回归方程,并列出直线回归方程及其P值。注意方程
如何写?
・操作步骤:
1、打开数据文件:file—open-data—hemoglo.sav
2、线性回归分析:Analyze—Regression—Linear
3、在independent中依次输入变量ca、Mg、Fe、Mn与Cu;在dependent
中输入变量hemoglo
•统计表格及分析:
表16-1线性回归方程系数表1
Unstandardized
Model1
(Constant)钙(Ca)
Coefficients
Std.
B
Error
Beta
StandardizedCoefficients
t
Sig.
9.211.0222.643.044
.0973.486.508.002.616
表16—2线性回归方程系数表2Unstandardized
Model1
(Constant)镁(Mg)
Coefficients
Std.
B
Error
Beta
StandardizedCoefficients
t
Sig.
3.579.203
1.963.057
.569
1.8233.598
.079,001
表16—3线性回归方程系数表3Unstandardized
Model1
(Constant)铁(Fe)
Coefficients
Std.
B
Error
Beta
StandardizedCoefficients
t
Sig.
-.657.029
1.276.003
.863
-.5158.894
.611.000
表16—4线性回归方程系数表4
Unstandardized
Model1
(Constant)?孟(Mn)
Coefficients
Std.
B
Error
StandardizedCoefficients
Beta
t
Sig.
11.158-50.364.52528.441
-.32321.257-1.771.000.088
表16—5线性回归方程系数表5Unstandardized
Model1
(Constant)铜(Cu)
Coefficients
Std.
B
Error
Beta
StandardizedCoefficients
t
Sig.
8.2502.073
1.7641.558
.248
4.6761.331
.000,194
以上分别为Ca、Mg、Fe、Mn与Cu对hemogl的直线回归方程系数
表。列出了变量人均收入和常数项的非标准化系数(Unstandardized
Coefficients),标准化系数(StandardizedCoefficients)>t值、显著性水平
(Sig.)和自变量待定系数取值与常数项的95%置信区间。自变量还列出了
各种相关性指标和线性统计量。
根据以上数据可以求出Ca、Mg、Fe、Mn与Cu对hemogl的直线回
归方程。
,结论:
31、对数据文件:hemoglo.savo进一步调用逐步回归法(Stepwise)、
强迫剔除法(Remove)、向后逐步回归法(Backward)与向前逐步回归法
(Forward)建立Ca、Mg、Fe、Mn与Cu对hemogl的多元线性回归方程。
•题目分析:
题目中要求用不同的回归方法,建立不同变量之间的多元线性回归方
程,显然需要进行回归分析。特别要注意不同的回归发法的各自的剔除变
量的要求。
•操作步骤:
1、打开数据文件:file—open—data—hemoglo.sav
2、线性回归分析:Analyze—Regression—Linear
用enter强行进入做事前分析。
表17—1系数表
UnstandardizedCoefficients
Model1
(Constant)钙(Ca)镁(Mg)铁(Fe)
锦(Mn)铜(Cu)
B1.380-.069.028.028-16.5771.715
Std.Error
1.549.028.053.00416.4141.143
StandardizedCoefficients
Beta
-.304.079.821-,106.205
t.890-2.500.5346.730-1.0101.501
Sig.
.382.020.599.000.323.147
由表17—1可知,除了Ca和Fe外的变量的回归系数显著性t检验的
概率P值都大于显著性水平0.05。因此接受原假设,即这些变量与血红蛋
白无显著的线性关系,不应引入方程,可剔除这些变量,仅保留Ca和Fe
变量。
3、逐步回归法(Stepwise):逐步回归法是对向前逐步回归法的改进,
它既有引入变量,
也有剔除变量。
•统计表格及分析:
表17—2变量输入输出表由17—117—2。
表17—3系数分析表(逐步回归法)
UnstandardizedCoefficients
Model1
(Constant)铁(Fe)
StandardizedCoefficients
Beta
.863
t-,5158.894
Sig..611.000
B-.657.029
Std.Error1.276.003
由上表可得出Fe对hemogl的线性方程为Y=-0.657+0.029X4、强迫
剔除法(Remove):剔除所有变量。5、向后逐步回归法(Backward):
•统计表格及分析:
表”-4变量输入输出表
Model1
VariablesEntered铁(Fe),铜(Cu),镐(Mn),钙(Ca),镁(Mg)
2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论