SPSS软件入门与基础统计知识_第1页
SPSS软件入门与基础统计知识_第2页
SPSS软件入门与基础统计知识_第3页
SPSS软件入门与基础统计知识_第4页
SPSS软件入门与基础统计知识_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

版权所有,使用者请勿删改SPSS软件应用第一讲SPSS根本介绍全称:StatisticalPackagefortheSocialScience社会科学统计包软件是当前在社会科学上最流行的统计应用软件:如:市场营销调查,社会学研究,教育学研究等你想轻轻松松发篇好文章在核心期刊上吗?SPSS/EXCEL计算描述统计指标小结软件获得汇总统计量的基本选项SPSS1,分析>描述统计>频率2,转换>计算变量Excel1,工具一数据分析一描述统计一汇总统计或者公式:TOTAL,AVERAGE,MEDIAN,MODE,PERCENTILE,STDEV,VAR等你想用一款比excel更傻瓜快捷高效的软件吗?你想轻轻松松看懂论文,毫无压力吗?你想做比他更好的研究吗?统计在教育学的小例子你会不会忍不住想:1,样本中,有多少男孩,多少女孩?2,班级数学平均分是多少,女孩数学多少分?男孩数学多少分?3,班上100-120分数段有多少学生?深入的,你会不会想探究:男生的数学是不是真的比女生好?本地学生是不是比外地学生成绩好?数学好的学生计算时机不会也不错?两者之间有一定的关联?中考分数可不可以预测高考分数?根本学习内容:相关统计知识SPSS根本界面简介SPSS数据文件创立、编辑以及修改统计学根本概念:描述统计(descriptivestatistics)研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。优点:化繁为简,例如用图表展示数据,建立数据模型,使数据清晰明了。推断统计(inferentialstatistics)研究如何利用样本数据来推断总体等特征的统计方法。例如:要了解武汉市〔一个地区〕初中生运用计算机根本技能的能力,不可能对每个初中生的技能水平进行一一测量,需要抽取局部初中生,进行测量,然后根据获得的样本数据对所研究的总体特征进行推断。总体(population)总体是包含所研究的全部个体(case)的集合。思考:在研究中,有些总体很好确定,比方研究武汉市学生的中考成绩,那么武汉市所有学生就是总体;但有些场合总体范围很难确定,比方要了解学生是否喜欢一种新兴的教育技术〔电子白板〕,首先要确定哪些学校是使用者,即确定构成该使用者的总体,但事实上,总体范围确实定比较复杂。总体、

样本与个体样本(sample)样本是从总体中抽取一局部个体的集合,构成样本的个体数目称之为样本量(samplesize);个体(case)统计分析的根本单元〔人、企业、单位等〕;研究的参与者;样本中的一个成员;一个样本中有n个个体,那么样本量(samplesize)是n;参数统计量μσπxsp平均数标准差比

例总体样本推断参数(parameter)和

统计量(statistic)参数(parameter)参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某些特征值。一般由总体平均数μ,总体标准差σ等;由于总体数据通常是庞大的,我们所不知道的,所以参数是一个未知的常数。因为如此,所以要进行抽样,根据样本计算出某些值去估计总体参数。参数(parameter)和

统计量(statistic)

统计量(statistic)统计量是用来描述样本特征的概括性数学度量。它是根据样本数据所计算出来的量值。统计量是样本的函数。一般有样本平均数x、样本标准差s。由于样本是抽选出来的,所以统计量总是知道的。抽样的目的是根据样本量去估计总体参数。例如用样本平均数x去估计总体平均数μ,用样本标准差s去估计总体标准差σ。除去样本平均值,样本方差这些常规统计量,还有为统计分析的需要而构造出来的统计量,比方统计检验的z统计量,t统计量,χ2统计量,f统计量等变量(variable)变量是说明现象的某种特征的概念。简单的说是你想测量的个体的根本属性。例如:学生的性别、年龄、期中考试的分数、高考的分数、期中考试的班级排名等;对于性别、年龄、分数、排名的测量有4种类型,分别是:名义尺度、顺序尺度、间隔尺度、比率尺度。名义尺度〔Nominalscale〕例:性别男女例:居住的城市武汉北京上海天津例:你喜欢哪类书籍科幻小说纪实文学散文诗歌性别学生学号你使用过SPSS吗?1-是的

0-没有名义尺度〔nominalscale)名义尺度是一种标记方式,其中数字或者符号只是用来表示对物体分类(categories)的标签,表示不同性每一类都只表示分类;不存在比较关系,设置的答案要注意互斥性和完备性。没有顺序性!不能做加减法运算,目的是求的各类答案数量。常用的统计方法有频数分析、比率分析、求众数分析。顺序尺度〔ordinalscale〕期中考试某班全体同学的名次:第一名,第二名…..衣服的尺码:S、M、LX、XS、SP受教育的程度:小学、初中、高中、大学、研究生顺序尺度〔ordinalscale〕顺序尺度〔ordinalscale〕的数字和符号不仅代表类别,而且还表示按某种特征或者属性排列的上下、大小和先后顺序。特点:两个数字之间的差距没有绝对的意义。在顺序尺度中各类答案的分数是不能做加减乘除运算的;分数只是说明一个顺序关系。可进行频数分析、比例分析、求众数分析。间隔尺度〔intervalscale〕例子:

高考分数等

考试分数

温度值不仅是顺序关系,重点是有可测量顺序之间的相等差距。被调查者评定的分数可做加减,但不能作乘除运算。因为等距尺度中不具备真正的零点,不存在倍数关系。比率尺度〔rationscale〕比率尺度是测量数据中最高水平的尺度,可以进行分类分类、排序、加减乘数等运算。是最精确的计量尺度。有绝对零点(TrueZero),绝对

“0”

意味着“没有”。例如:体重你这个学期选了几门课程?年龄价格收入两个值是否有大小、等级区别?在两个差值1、2之间与2、3之间,是否是相等的?其中的0是否表示“没有”?No—nominal名义尺度Yes-goon继续No—ordinal顺序尺度Yes-goon继续No—interval间隔尺度Yes-goon继续为什么测量尺度很重要?尺度类型基本特征实例

可能用到的统计方法描述性推断性名义尺度nominalscale数字用于对物体的识别和分类学号,性别,媒体种类;百分比,众数(mode)卡方(chisquare),二项式检验顺序尺度ordinalscale数字代表物体的相对位置,无差距大小成绩排名,最终学历;社会阶层;百分位数,中位数(median)序列相关,方差分析间隔尺度intervalscale有相等的差距;无绝对零点,有以上特征具体考试分数,华氏摄氏温度;全距,平均数(mean),标准差(SD),简单相关,t检验,方差,回归,因子分析比率尺度ratioscale绝对零点意味着“无”,有以上所有基本特征年龄,收入,学习年限,体重;几何平均数,(间隔尺度允许的都可以)变异系数;对数分析测量尺度的重要性测量尺度决定所获取的信息:名义尺度是测量中最低的信息水平比率尺度测定可能包含大量的信息,是最精确的尺度尺度度量标准越高越好不同的测量尺度具有不同的分析方法小练习:一个研究者对研究武汉市初中生阅读习惯充满兴趣,他在当地的一家初中随机找了35个学生进行了调查,,询问他们性别,年龄,所在年级,班级名次,最喜欢的书的类型〔小说,记录文学,社科类读物等〕,每个月在书籍上的开销,花在读书上的时间做了收集。提问:1,在这个研究中,总体(population)是什么?样本(sample)是什么?2,样本量(samplesize)是多少?3,变量(variable)有哪些?分别属于什么测量尺度?4,样本是否能反映总体?武汉市初中生当地一家初中随机找的学生n=35性别是名义尺度,年龄是间隔尺度,所在年级是顺序尺度,班级名次是顺序尺度,最喜欢的书籍是名义尺度,书上的开销和花在书上的时间都是比率尺度思考:你可以使用不同的尺度测量相同的变量:教育:你接受了多少年的根本教育〔比率尺度ration〕最高教育水平〔顺序尺度ordinal〕测量尺度的复杂性:〔是顺序尺度还是间隔尺度〕例:这堂课老师展示的PowerPoint你喜欢吗?请按1到5进行排序:1表示非常不喜欢,5表示非常喜欢:非常不喜欢不喜欢一般,谈不上很喜欢也谈不上不喜欢喜欢非常喜欢根本学习内容:相关统计知识SPSS根本界面简介SPSS数据文件创立、编辑以及修改SPSS根本介绍SPSS软件共有4个窗口,表示4种不同类型的SPSS文件数据编辑窗口Dataeditor(.savfile)DataviewVariableview数据输出窗口outputviewer(.spvfile)语法窗口syntaxeditor(.spsfile)脚本窗口scriptwindow变量个体输出窗口根本学习内容:相关统计知识SPSS根本界面简介SPSS数据文件创立、编辑以及修改创始属于你自己的数据文件

插入新的变量insertingnewvariables

定义变量definingvariables

插入新的个体Insertingnewcases

输入数据Entering/editingdatapoints

删除变量Deletingvariables

删除个体Deletingcases

保存数据Savingyourdataset用SPSS来储存小练习中的数据:一个研究者对研究武汉市初中生阅读习惯充满兴趣,他在当地的一家初中随机找了35个学生进行了调查,,询问他们性别,年龄,所在年级,最喜欢的书的类型〔小说,记录文学,社科类读物等〕,每个月在书籍上的开销,每月零花钱,花在读书上的时间做了收集。提问:1,在这个研究中,总体(population)是什么?样本(sample)是什么?2,样本量(samplesize)是多少?3,变量(variable)有哪些?分别属于什么测量尺度?4,样本是否能反映总体?练习1,创立一个新的SPSS数据文件;

2,在变量视图创立以下几个变量(Variables):学号、性别、年龄、学生家庭社会经济状况〔低中高〕、中考总成绩、高考总成绩。确定其根本属性〔小数,测量尺度,值〕并保存该文件〔.sav);共创造5个个体〔Case)。3,保存数据文件SPSS数据文件〔.sav〕Excel文件〔.xls,xlsx,xlsm)数据的描述:图与表频数分布表饼图条形图直方图线图频数分布表美国使用交互性电子白板情况中学教师授课专业统计落在某一特定类别或组中的数据个数。把各个类别及落在其中的相应频数全部列出,用表格形式表现出来,叫频数分布。饼图piechart

美国一所中学使用交互性电子白板情况使用者占60%n=370不使用者占60%n=248用圆形以及圆内扇形的角度来表示数值大小的图形,主要用于一个样本或者总体中各组成局部占全部数据的比例。条形图barchart玩游戏n=455编程n=44听音乐n=477看电影n=350匈牙利德布勒森市初高中学生计算机使用情况调查直方图histogram某班级学生身高统计条形图和直方图的区别疑问:直方图和条形图看上去都是由方条组成,是否有区别?处理的数据是否不一样?答1:条形图:用宽度相同的条形的高度和长短来表示数据多少的图形。其宽度是固定的。直方图:直方图是用面积表示各组频数的多少,宽度是有意义的。答2:条形图是针对的分类数据。直方图正对的是数值型数据。SPSS:FrequencyTable频数表方法一:1、分析>描述统计>频率.2、选取变量〔variable〕放进变量表单(variableslist)中.你可以同时选取几个变量;3、可以选择从高到低,也可以选择从低到高;SPSS饼图、条形图、直方图分析>描述统计>频率单击对话框左边的图表选择图表类型性别高考语文方法二:图形>图表构建程序

图形画板模板选择程序

旧对话框实例:课堂实例中:我想看看三个班级各自的语文成绩,同时我想看看基于各自的家庭经济收入的三个班的高考语文成绩。如何实现呢?库>条>拖拽或者双击进入图表预览使用实例数据横轴〔是否为x轴〕:班级;纵轴〔是否为y轴〕:高考数学X轴上〔设置颜色〕:家庭收入一班家庭收入对高考数学平均分并没有什么影响二班家庭状况中等的高考数学平均分略高于收入低的学生平均分,家庭收入高的学生平均分最低;三班家庭收入高学生平均分略高于家庭收入中等略高于家庭收入差的。计算新变量computevariables如果我想计算所有学生高考语文、高考数学和高考英语的平均分,如何计算?计算新变量computevariables

转换>计算变量〔transform>computevariable)目标变量->取名,例如:平均分数学表达式->(高考语文+高考数学+高考英语)/3拓展练习:有一份电子白板量表,收集的时候,用-2表示很不满意,2表示满意。现在想用1表示不满意,5表示满意。如何转换?根本概念学习:集中趋势众数中位数和分位数均值离散程度测量平均差方差标准差SPSS/EXCEL计算描述统计指标小结软件获得汇总统计量的基本选项SPSS分析>描述统计>频率Excel工具一数据分析一描述统计一汇总统计或者公式:AVERAGE,MEDIAN,MODE,PERCENTILE,STDEV,VAR等集中趋势的度量分类数据:众数顺序数据:中位数和分位数数值型数据:均值众数、中位数和均值的比较集中趋势的度量1,众数〔mode〕众数是一组数据中出现频率最高的变量值。也就是出现最多的变量值。例如:1,1,1,2,2,1,1,3,4,5,4,2,1,1,191是出现频率最多的,所以是众数〔mode〕众数是一个位置代表值,它不受数据中极端值的影响。从分部的角度看,众数是具有明显集中趋势点的数值。可以有两个或者多个众数,还可以没有。可用于分类数据。TheMode众数特点:1,集中趋势的测量2,出现次数最多3,不受极端值的影响4,一组数据可能没有众数5,也可能有多个众数排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据中位数〔median〕中位数〔median〕举例:中位数位置=〔n+1〕/2例:7,8,9,12,15位置=〔5+1〕/2=3;中位数是97,8,9,12位置是=〔4+1〕/2=2.5中位数是8.5平均数平均数也称均值〔mean〕x-bar〔x〕=〔x1+x2+x3+x4+x5+xn〕/n这里指的是算数平均值。还有加权平均值和几何平均值。接上例:x=〔850+1200+1650+1700+2000+2500+2600+3000+3800+120000〕/10=3130平均数在统计中具有重要地位,它是进行统计分析和统计推断的根底。集中趋势的最常用测度值一组数据的均衡点所在表达了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据平均数众数、中位数、均值的特点和应用众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用众数、中位数和均值的关系左偏分布均值

中位数

众数对称分布

均值=中位数=众数右偏分布众数

中位数均值在对称的正态分布条件下:算术平均数等于众数等于中位数;在非对称正态分布的情况下,众数、中位数和平均数三者的差异取决于偏斜的程度,偏斜的程度越大,它们之间的差异越大;当次数分配呈右偏(正偏)时,算术平均数受极大值的影响;当次数分配呈左偏(负偏)时,算术平均数受极小值的影响;中位数那么总是介于众数和平均数之间。根本概念学习:集中趋势众数中位数和分位数均值离散程度测量方差标准差样本方差和标准差方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!理解:两个人打枪:每个人打6次:甲中靶:1,2,3,8,9,10乙中靶:3,4,5,6,7,8计算方差、标准差:两个人甲乙打枪,每个人打6次:甲中靶环数:1,2,3,8,9,10均值=5.5乙中靶环数:3,4,5,6,7,8均值=5.5甲中环数的方差:s2=[(5.5-1〕2+〔5.5-2〕2+〔5.5-3〕2+〔5.5-8〕2+〔5.5-9〕2+(5.5-10〕2]/(6-1)=20.25+12.25+6.25+6.25+12.25+20.25=15.5乙中环数的方差s2=[(5.5-3)2+(5.5-4)2+(5.5-5)2+(5.5-6)2+(5.5-7)2+(5.5-8)2]/(6-1)=6.26+2.25+0.25+0.25+2.25+6.25=3.5方差和标准差(varianceandstandarddeviation)数据离散程度的最常用测度值反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012

x=8.3

自由度(degreeoffreedom)一组数据中可以自由取值的数据的个数当样本数据的个数为n时,假设样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据那么不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,那么x=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个那么不能自由取值,比方x1=6,x2=7,那么x3那么必然取2,而不能取其他值样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差s2去估计总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论