统计学类型数据检验_第1页
统计学类型数据检验_第2页
统计学类型数据检验_第3页
统计学类型数据检验_第4页
统计学类型数据检验_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学类型数据检验1第一页,共三十四页,2022年,8月28日类型数据分析目的:本讲结束后,学生们应能够:

将类型数据整理为列联表解释卡方分布的性质运用卡方分布进行同质性检验运用卡方分布进行独立性检验解释卡方检验的SPSS输出结果2第二页,共三十四页,2022年,8月28日类型数据分析讲课提纲

列联表–交叉列联表所讲述的内容总体之间的同质性两个变量之间的独立性将统计学运用于具体情形–SPSS发挥的作用3第三页,共三十四页,2022年,8月28日列联表

--交叉列联表所讲述的内容收集抽样单位特征或特点方面的资料整理数据以反映每种类型的计数情况与“类型”有联系的观察值被称为类型数据

4第四页,共三十四页,2022年,8月28日列联表

--交叉列联表所讲述的内容例题1 根据同一特征对两个样本进行分类CF(商业广告片)在电视上播放之前,通常要经过检验和修改。一名软饮料生产商想在电视上播放一个新的商业广告片。他为这个广告制作了两个版本,即CF-A和CF-B。这名生产商想对广告片的两个版本进行初步的检验。为此,他将其中一个版本的广告片播放给一半观众看,另一个版本的广告片播放给另一半观众看,然后他对这些观众进行电话调查并将他们的反应分为以下几类:不记得

记得

只记得广告内容

观看过的内容

广告中的要点5第五页,共三十四页,2022年,8月28日列联表

--交叉列联表所讲述的内容这两个不同版本的商业广告片是否在人们头脑中留下了同样的印象?6第六页,共三十四页,2022年,8月28日列联表

--交叉列联表所讲述的内容7第七页,共三十四页,2022年,8月28日列联表

--交叉列联表所讲述的内容例题2 根据两种特征对一个样本进行分类劳工合同期限与行业类型之间是否具有联系?8第八页,共三十四页,2022年,8月28日列联表

--交叉列联表所讲述的内容卡方(2)分布--

它由一系列分布组成,其具体形状取决于一个参数,即自由度(df)卡方分布是一种抽样分布卡方分布倾向右侧随着自由度(df)增大,卡方分布将接近正态分布9第九页,共三十四页,2022年,8月28日列联表

--交叉列联表所讲述的内容df=1df=6df=10df=420246812141610第十页,共三十四页,2022年,8月28日列联表

--交叉列联表所讲述的内容卡方检验的基本思想--

比较观察频数和期望频数如果观察频数接近期望频数,则可以作为接受原假设(H0)的证据运用卡方检验--

检验同质性检验拟合优度检验独立性检验总体方差是否相等11第十一页,共三十四页,2022年,8月28日总体之间的同质性当把从两个样本中抽取的数据根据同一特征进行了分类并表示为列联表之后目的是检验不同总体的反应类型是否相同为了回答这个问题,我们利用卡方检验来检验同质性12第十二页,共三十四页,2022年,8月28日总体之间的同质性例题1:两个不同版本商业广告片的反应类型每种版本的商业广告片代表一个总体每一种反应类型代表未知的总体比例13第十三页,共三十四页,2022年,8月28日总体之间的同质性原假设为具有“同质性”或“相似的反应类型”,可以将其写成H0:

pA1

=pB1,pA2

=pB2,pA3

=pB3

14第十四页,共三十四页,2022年,8月28日总体之间的同质性根据H0,pi可以被估计为和如果原假设为真,两个总体的每种反应类型都应当具有相同的比例,让我们分别用一些常见的比例符号p1,p2,p3来表示15第十五页,共三十四页,2022年,8月28日总体之间的同质性期望频数--16第十六页,共三十四页,2022年,8月28日总体之间的同质性检验统计量如果观察频数与期望频数相差很大,我们就认为原假设为假17第十七页,共三十四页,2022年,8月28日总体之间的同质性2

=0.674+0.502+2.006+0.770+0.573+2.292=6.8172值是否过大,使得我们不得不拒绝H0?将该值与从2表中获得的“临界值”进行比较查表之前需要知道1. 自由度 d.f.=(r–1)(c–1)2. 右尾上面的面积()–显著水平18第十八页,共三十四页,2022年,8月28日总体之间的同质性019第十九页,共三十四页,2022年,8月28日总体之间的同质性自由度d.f.=(2–1)(3–1)=2显著水平,=0.05=5.99临界值

6.817>5.99数据显示:当显著水平=0.05时,检验统计量太大,因此我们应当拒绝H0观众在观看完两种不同版本的商业广告片之后,其反应类型会有明显的差异20第二十页,共三十四页,2022年,8月28日总体之间的同质性进行卡方同质检验的步骤

1.构造假设2.建立列联表并计算期望频数3.计算检验统计量4.计算自由度并查找临界值5.进行决策并得出结论21第二十一页,共三十四页,2022年,8月28日总体之间的同质性H0:各个总体的反应类型具有相同的概率HA:与其他总体相比,有些总体的反应类型有不同的概率检验统计量自由度=(r–1)(c–1)拒绝H0

如果2>(检验统计量>临界值

)22第二十二页,共三十四页,2022年,8月28日两个变量之间的独立性当按照两种特征对数据进行了归类并将其表示为双向列联表时实质性问题是:这两种特征是否在总体中进行了独立分布?为了回答这个问题,我们需要利用2来进行独立性检验23第二十三页,共三十四页,2022年,8月28日两个变量之间的独立性思考一下,当显著水平

=0.05时,劳工合同期限是否与行业类型有联系?24第二十四页,共三十四页,2022年,8月28日两个变量之间的独立性1.构造假设H0:合同期限与行业类型相互独立HA:合同期限与行业类型相互不独立2.计算期望频数如果原假设为真,则我们预计可以得到P(期限

行业)=P(期限)

P(行业)25第二十五页,共三十四页,2022年,8月28日两个变量之间的独立性因此,可以根据下表计算期望频数26第二十六页,共三十四页,2022年,8月28日两个变量之间的独立性3.检验统计量=4.157自由度=(2–1)(3–1)=24.临界值=5.995.4.157<5.99(即检验统计量<临界值)

接受H0数据显示:当显著水平=0.05时,合同期限与行业类型相互独立27第二十七页,共三十四页,2022年,8月28日两个变量之间的独立性H0:两个因子相互独立HA:两个因子相互不独立检验统计量自由度=(r–1)(c–1)拒绝

H0

如果 2>(即检验统计量>临界值)28第二十八页,共三十四页,2022年,8月28日将统计学运用于具体情形

--

SPSS发挥的作用

定义数据–变量图有三个变量有待定义:行业、期限、计数29第二十九页,共三十四页,2022年,8月28日将统计学运用于具体情形

--

SPSS发挥的作用

输入数据–数据图将3栏、6排数据按以下方式输入根据计数衡量各种情形(数据衡量情形)

30第三十页,共三十四页,2022年,8月28日将统计学运用于具体情形

--

SPSS发挥的作用进行分析–菜单条1.在菜单条中单击

分析描述统计学交叉列表…2.将行业规定为行,期限规定为列

单击小格…

并且

检查期望数和各行的百分比

单击统计并且 方检验和PhiandCramer’sV

3.单击OK31第三十一页,共三十四页,2022年,8月28日将统计学运用于具体情形

--

SPSS发挥的作用

SPSS输出结果–可以用皮尔生卡方来表示卡方检验统计值

2=4.157 自由度=2p–值=0.125(>0.05)由于p–值>,因此我们接受

H0即数据支持原假设:即行业类型与合同期限是相互独立的

32第三十二页,共三十四页,2022年,8月28日将统计学运用于具体情形

--

SPSS发挥的作用行业类型与期限交叉列表

101874824514.1180.150.8245.04.1%76.3%19.6%100.09113.932.2155.08.4%69.0%22.6%100.0%232948340023.0294.083.0400.05.8%73.5%20.8%100.0%计数每一类行业的期望数计数每一类行业的期望数

计数每一类行业

的期望数

制造型

非制造型

行业类型

总计少于2年2–

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论