SPSS数据统计分析(复习)_第1页
SPSS数据统计分析(复习)_第2页
SPSS数据统计分析(复习)_第3页
SPSS数据统计分析(复习)_第4页
SPSS数据统计分析(复习)_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

均值:方差检验

(【单样本T检验】

1.从某厂第一季度生产的电子元件中抽取了部分样品测量他们的电阻(单位:欧姆),数据

资料在“小测l.sav"中。按质量规定,元件的额定电阻为0.140欧姆,假定元件的电阻服从

正态分布。判断这批产品的质量是否合格。

One-SampleStatistics

Std.Error

NMeanStd.DeviationMean

电阻值35.1423.00426.00072

One-SampleTest

TestValue=0.140

95%ConfidenceIntervalofthe

Difference

Mean

tdfSig.(2-tailed)DifferenceLowerUpper

电阻值3.17434.003.00229.0008.0037

从上表单样本数据统计量表中可以得测试电阻值的样品有35个,均值为0.1423,标准差为

0.00426,均值标准误为0.00072

从单样本检验表中可以看出:t统计量的值为3.174,自由度为34,均值差值为0.00229,95%的置

信区间(0.0008,0.0037),相伴概率为0.003,远小于显著性水平0.05,说明假设成立,也就是

说这批产品的质量与0.140欧姆有显著性差异,说明这批产品的质量是不合格的。

"假设方差相箸"所对应的一行数据是在方差无显著性差异条件下的各统计量的值,"假设方差不

相等"所对应的下面一行数据是在方差有显著性差异条件下的各统计量的值

【独立样本T检验】

2、甲乙两台测时仪同时测量两靶间子弹飞行的时间,测量结果在“小测2.sav”中,假定两台仪

器测量的结果服从正态分布,设显著性水平为0Q5,问两台仪器的测量结果有无显著差异

Levene检验主要用来检验原假设条件是否成立,(即:假设方差相等和方差不相等两种情况)如果

SIG>0.05,证明假设成立,不能够拒绝原假设,如果SIG<0.05,证明假设不成立,拒绝原假设.

GroupStatistics

groupStd.Error

NMeanStd.DeviationMean

result1.00612,8883.7225629498

200713,1686.5870722189

IndepcndemSamplesTest

Levene'sTestforEqualityof

Vanancest-testforEqualityofMeans

95%ConfidenceIntervalofthe

Difference

MeanStd.Error

FSigtdfSig(2-tailed)DifferenceDifferenceLowerUpper

resultEqualvariances1.028.332-.77211.456-.28024.36283•1.07881.51834

assumed

Equalvariancesnot-.7599.677.466-.28024.36912-1.1064364595

assumed

在组数据统计表中可以得到第1组有6个样本,均值为12.8883,标准差是0.72256,均值标准

误为0.29498;第二组有7个样本,均值是13,标准差是0.5870均值标准误是0.22189;

在独立样本检验表中可以得出F的统计量的值为1.028,相伴概况为0,332,远大于显著性水

平0.05,说明这两组数据的方差之间不存在显著差别,所以适合采用独立样本T检验。t的统

计量为-0.772,自由度为11,95%的置信区间,(01.07881,0.51834),相伴概率为0.456,远大

于显著性水平0.05,假设成立,不能拒绝原假设,说明这2台仪器的测试结果没有显著性差异。

【配对样本T检验】

3、分别从甲乙两厂生产的同规格的前轮轮胎中随机抽取10只,将它们配对安装在10辆汽车

的左右轮上,行驶相同的里程之后,测得各只轮胎磨损的数据在“小测3.sav”中,试用配对样

本T检验过程检验两种轮胎的耐磨性之间的差异。

PairedSamplesStatistics

Std.Error

MeanNStd.DeviationMean

Pair1xl614.200010119.6446637.83496

x2586.90001099.3125831,40540

PairedSamplesCorrelations

NCorrelationSig.

Pairlxl&x210989.000

PairedSamplesTest

PairedDifferences

95%ConfidenceIntervalofthe

Difference

Std.Error

MeanStd.DeviationMeanLowerUppertdfSig.(2-tailed)

Pairlxl-x227.3000025.824418.166398.8263345.773673.343g.009

从上表的成对样本数据统计表中可以看出:左轮胎磨损量的举止为614.2,有10个样本,标准

差是119。644,均值的标准误为37.834;右轮胎磨损量均值为568.9,有10个样本,标准差

为99.31,均值的标准误为31.405;

成对样本相关系数表看出:xl和X2的相关系数为08.9%,相关性很高

在成对样本检验表中可以发现:t的统计量为3.343,自由度为9,95%的置信区间

(8.82633,45.77367),相伴概率为0.009,远小于显著性水平0.05,说明左右轮胎的耐磨性有

显著性差异。

【单因素】

对4个服务行业(航空公司-1、零售业-2、酒店业-3和汽车制造业-4)的服务质量进行评估。

评价数据见“小测l.sav%

Descrifitrves

scores

95%ConfidenceIntervalfor

Mean

NMeanStd.DeviationStd.ErrorLowerBoundUpperBoundMinimumMaximum

areways752.14295.080311.9201847,444456.841446.0059.00

retailing656.16674.875111.9902551.050661.282849.0063.00

hotel565.60004.827012.1587059.606571.593559.0070.00

auto550.20002.774891.2409746.754553.645548.0055.00

Total2355.69577.163261.4936452.598058.793346.0070.00

TestofHomogeneityofVariances

scores

Levene

Statisticdfl娘Sig.

1.493319.249

从上表可以看出4个服务行业的服务质量的相伴概率大于显著性水平0.05.说明这组数据适合

进行单因素方差分析。

ANOVA

scores

Sumof

SquaresdfMeanSquareFSig.

BetweenGroups731.1793243.72611,644.000

WithinGroups397.6901920.931

Total1128.87022

方差检验的F值为11.644,相伴概率为0.00,小于显著性水平,表示拒绝零假设,也就是说明

4个服务行业中至少有一行业和其他行业有明显的区别,也就是会所四个服务行业的服务质量

存在明显的差异、。

MultipleComparisons

scores

LSD

(1)trade(J)trade95%ConfidenceInterval

Mean

Difference(1-

J)Std.ErrorSig.LowerBoundUpperBound

arewaysretailing-4.023812.54532.130-9.35121.3036

hotel-13.45714X2.67887,000-19.0641-7.8502

auto1.942862.67887.477-3.66417.5498

retailingareways4.023812.54532.130-1.30369.3512

hotel-9.43333*277033.003-15.2317-3.6350

auto5.96667"2.77033.044.168311.7650

hotelareways13.45714*2.67887,0007.850219,0641

retailing9.43333"2.77033.0033.635015.2317

auto15.40000x2.89352.0009.343821.4562

autoareways-1.942862.67887.477-7.54983.6641

retailing-5.96667x277033.044-11.7650-.1683

hotel•15.40000*2.89352.000-21.4562-9.3438

*.Themeandifferenceissignificantatthe0.05level.

航空公司-1、零售业-2、酒店业-3和汽车制造业-4

这是LSD法多重比较的结果。可以看出hotel和areways^hotel和retailing>hotel和auto>retailing

和auto之间的相伴概率小于显著性水平,说明他们之间都存在显著差别。Retailing和areway、

auto和areways之间的相伴概率大于0.05,他们之间没有显著性差异

【单因素】

评估某种型号的电池质量。分别从A、B、C三个工厂生产的同种型号电池中各随机抽取5只

电池为样本,经试验得到其寿命(小时)如下表所示。

样品1样品2样品3样品4样品5

工厂A4048384245

工厂B3634302832

工厂c3940435050

Descri|)tives

寿命时

95%ConfidenceIntervalfor

Mean

NMeanStd.DeviationStd.ErrorLowerBoundUpperBoundMinimumMaximum

工厂A542.603.9751.77837.6647.543848

工厂B532.003.1621.41428.0735.932836

zrc544.405.3202.379377951.013950

Total1539.676.8941.78035.8543.482850

TestofHomogeneityofVariances

寿命时

Levene

Statisticdf1df2Sig.

1.735212.218

ANOVA

寿命时

Sumof

SquaresdfMeanSquareFSig.

BetweenGroups448.9332224.46712.447.001

WithinGroups216.4001218.033

Total665.33314

显著性为0.218,大于显著性水平0.05,可以认为各个组总体方差是相等的,因此这组数据适

合进行单因素方差分析

。方差检验的F值为12.447,相伴概率为0.001,小于显著性水平0.05.表示拒绝零假设,也就

是说这三组数据中至少有一组和其他两组有明显的区别

MuKipleComparisons

(i)ir(J)工厂95%ConfidenceInterval

Mean

Difference(I-

J)Std.ErrorSig.LowerBoundUpperBound

工厂A工厂B10.600x2.686.0024.7516.45

ire-1.8002.686.515-7.654.05

工厂B工厂A-10.600"2.686.002-16.45-4.75

工厂C-12.400x2.686.001-18.25-6.55

工厂C工厂A1.8002.686,515-4.057.65

工厂B12.400x2.686.0016.5518.25

*Themeandifferenceissignificantatthe0.05level.

LSD法多重比较结果可以的看出:

工厂A和工厂B的相伴概率为0.002,工厂B和工厂C的相伴概率为0.001,都低于显著性水

平0.05,说明工厂A与工厂B的电池寿命存在显著性差异。

工厂A和工厂C的相伴概率为0.515,大于显著性水平0.05,说明A和B厂的电池寿命不存在

显著性差异、

【多因素】

试分析不同包装及口味对某饮料销售水平的影响。在20家超市一天的销售数据见“小测3.sav”。

Between-SubjectsFactors

N

口味类别110

210

包装类别110

210

Levene'sTestofEqualityofError

Variances3

DependentVariable:请售数里

Fdf1df2Sig.

1.219316.335

Teststhenullhypothesisthattheerror

varianceofthedependentvariableisequal

acrossgroups.

a.Design:+口味类别+包袋类别+口味

类别*包装类别

第一个表是【主体间因子】表,可以看出各个控制变量水平下观察到的个案的个数。

第二个表是【误差方案等同性的Levene检验】表中i看出相伴概率为0.335,大于显著性水平

0.05,因此认为各个组总体方差相等的,满足方差齐次性检验的前提条件。

TestsofBetween-SubjectsEffects

DependentVariable:销售数里

SourceTypeIIISum

ofSquaresdfMeanSquareFSig.

CorrectedModel2620.000s3873.3332.911.067

27380.000127380.00091.267.000

口味类别2420.00012420.0008.067.012

包装类别180.0001180.000.600.450

口味类别*包装类别20.000120.000.067.800

Error4800.00016300.000

Total34800.00020

CorrectedTotal7420.00019

a.RSquared=.353(AdiustedRSquared=.232)

【主体间效应的检验】表看出不同口味的离差平方和为2420,均分为2420,自由度为1,F的

统计量为8.067,相伴概0.012小于显著性水水平0.05,而包装类贡献的离差平方和为180,均

方为280,自由度1,F的统计量为0.600,相伴概率为0.45大于显著性水平0.05.

因此说明不同口味对超市的销售量有显著性的影响,而不同包装对销售量却没有显著性影响。

口味类别和包装类别的交互作用的相伴概率为0.067,大于显著性水平0.05,说明它们之间的

交互作用对销售量造成的影响不显著。

CustomHypothesisTestsIndex

1ContrastCoefficients(L'Simple

Matrix)Contrast

(reference

category=2)

for口味类别

TransformationIdentityMatrix

Coefficients(MMatrix)

ContrastResults(KZeroMatrix

Matrix)

2ContrastCoefficients(L'Simple

Matrix)Contrast

(reference

category=2)

for包装类别

TransformationIdentityMatrix

Coefficients(MMatrix)

ContrastResults(KZeroMatrix

Matrix)

CustomHypothesisTests#1

ContrastResults(KMatrix)

口味类别SimpleContrast3Depe-

消售数里

Level1vs.Level2ContrastEstimate-22.000

HypothesizedValue0

Difference(Estimate-Hypothesized)-22.000

Std.Error7.746

Sig..012

95%ConfidenceIntervalLowerBound-38.421

forDifference

UpperBound-5.579

a.Referencecategory:2

TestResults

DependentVariable:俏售数里

SourceSumof

SquaresdfMeanSquareFSig.

Contrast2420.00012420.0008.067.012

Error4800.00016300.000

CustomHypothesisTests#2

ContrastResults(KMatrix)

包装类别SimpleContrast3Depe-

消售数里

Level1vs.Level2ContrastEstimate-6.000

HypothesizedValue0

Difference(Estimate-Hypothesized)-6.000

Std.Error7746

Sig..450

95%ConfidenceIntervalLowerBound-22.421

forDifference

UpperBound10.421

a.Referencecategory:2

TestResults

DependentVariable销售数里

SourceSumof

SquaresdfMeanSquareFSig.

Contrast180.0001180,000.600.450

Error4800.00016300.000

EstimatedMarginalMeans

GrandMean

DependentVariable销售数里

95%ConfidenceInterval

MeanStd.ErrorLowerBoundUpperBound

37.0003.8732879045.210

相关性

【二元定距相关性分析】

分析一相关一双变量

相关性

英语数学物理工程

英语Pearson相关性1,343,250,286

显著性(单则)105.184.151

平方与叉税的和1316.933303.333247.200365.800

协方差94.06721.66717.65726.129

N15151515

数学Pearson相关性.3431.848".650""

显著性(单期.105.000.004

平方与叉积的和303.333593.333562.000558.000

协方差21.66742.38140.14339.857

N15151515

物理Pearson相关性,250.848"1764"

显著性(单制).184,000,000

平方与叉税的和247.200562.000740.400732.600

出方差17.65740.14352.88652.329

N15151515

工程Pearson才联性.286.650”.764”1

显著性(单侧).151.004.000

平方与叉积的和365.800558.000732.6001240.400

协方差26.12939.85752.32988.600

N15151515

在01水平(单侧)上显著相关。

.数学与物理相伴概率为0.00小于0.05有显著性的相关性,相关系数大于0.8,说明有高度正相关

英语和物理的相伴概率为0.250,他们之间没有显著相关性。

【二元定序相关系分析】

某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如下表所示。现求降雨量

对产量的偏相关。

DescriptiveStatistics

MeanStd.DeviationN

产里444.0000161.8778710

降雨里92.900041.2726710

温度14.00004.6904210

Correlations

ControlVariables产里降雨里温度

-none-3产里Correlation1.000.981.986

Significance(2-tailed).000.000

df088

降雨里Correlation.9811.000.957

Significance(2-tailed).000.000

df808

温度Correlation.986.9571.000

Significance(2-tailed).000.000

df880

温度产里Correlation1.000.780

Significance(2-tailed).013

df07

降雨里Correlation7801.000

Significance(2-tailed).013

df70

表中上半部分输出的是变量两两之间的Pearson简单相关系数,"产量"和"降雨量”的相关性系

数为0.981,双侧检验的相伴概率为0.000。

表中下半部分偏相关分析的输出结果,在剔除"温度”变量的影响条件下,"产量"和"降雨量"的

相关性系数为0.780,双侧检验的相伴概率为0.013,

可见,简单相关系数和偏相关系数相比,前者有夸大的成分,后者更符合实际。

【偏相关分析】

【距离分析】

【回归】

【一般线性回归】

练习1:

为了检验美国电力行业是否存在规模经济,特收集了1955年145家美国电力企业

的总成本(TC)、产量(Q)、工资率(PL)及资本租赁价格(PK)的数据,见"练习

l.sav%试以工资率为y因变量,以产量为x自变量,对工资率和产量做简单线性

回归分析。

VariablesEntered/Remavedb

ModelVariablesVariables

EnteredRemovedMethod

1QaEnter

a.Allrequestedvariablesentered.

b.Dependentvariable:PL

ModelSumma萨

ModelAdjustedRStd.Errorof

RRSquareSquaretheEstimate

1.171a.029.023.2341

a.Predictors:(Constant),Q

b.DependentVariable:PL

第一个是输入/移去的变量表:

模型汇总表中看出:R值为0.171,R方为0.029,调整后的R方为0.023,反应了因变量工资

率和自变量产量之间没有线性回归关系。

ANOVAb

ModelSumof

SquaresdfMeanSquareFSig.

1Regression.2371.2374.331,039a

Residual7.838143.055

Total8.075144

a.Predictors:(Constant),Q

b.Dependentvariable:PL

Coefficients3

ModelStandardized

UnstandardizedCoefficientsCoefficients

BStd.ErrorBetatSig.

1(Constant)1.943,02480,696,000

Q1.385E-5.000,1712.081.039

a.DependentVariable:PL

从ANOVA表方差分析表中可以看出:相伴概率为0.039,说明因变量和自变量之间有显著性

系数表中可以看出:常量为1.943,回归系数为1.385*10(-5次方)。回归系数的相伴概率为

0.39小于0.05该回归方差有意义:

ResidualsStatistics残差统计a

MinimumMaximumMeanStd.DeviationN

PredictedValue1.9432.1741.972.0406145

Residual-.5180.3697.0000.2333145

Std.PredictedValue-.7274.975.0001.000145

Std.Residual-2.2131.579.000.997145

a.DependentVariable:PL

Histogram

DependentVariable:PL

Mean=-1.67E-15

20-Std.Dev.=0.997

N=145

A

Q

U

a

n

b双击以

a

1O-激活

lt

RegressionStandardizedResidual

练习2:

现有1992年~2006年国家财政收入和国民生产总值的数据如下表所示,

请研究国家财政收入x和国民生产总值y之间的线性关系。

VariablesErrteredjRemovedb

ModelVariablesVariables

EnteredRemovedMethod

1财政收入(单Enter

位:亿元尸

a.Allrequestedvariablesentered.

b.DependentVariable:国内生产总值(单位:亿

元)

ModelSummary5

ModelAdjustedRStd.Errorof

RRSquareSquaretheEstimate

1.989s.979.9778133.9069

a.Predictors:(Constant),财政I以入(单位:亿元)

b.DependentVariable:国内生产总值(单位:亿元)

模型汇总表中可以看出:R值为0.989,R方为0.979,调整后的R方为0.977,表

明了因变量国家财政收入和自变量国民生产总值之间的具有高度线性关系

ANOVAb

ModelSumof

SquaresdfMeanSquareFSig.

1Regression3.919E1013.919E10592.379.000a

Residual8.601E8136.616E7

Total4.005E1014

a.Predictors:(Constant),财政收入(单位:亿元)

b.DependentVariable:国内生产总值(单位:亿元)

Coefficients3

Model

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论