统计学第2讲第2章-统计学的基本概念_第1页
统计学第2讲第2章-统计学的基本概念_第2页
统计学第2讲第2章-统计学的基本概念_第3页
统计学第2讲第2章-统计学的基本概念_第4页
统计学第2讲第2章-统计学的基本概念_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第2讲第2章—统计学的基本概念2.2统计符号的语法规则∑、X、N数学有它的名词、形容词、动词和副词形态数学名词名词代表人、地点、事物和想法,数学中名词代表数量统计中描述数量(或分数)是用X或Y,代表变量。而用c代表常数。N=10统计学第2讲第2章—统计学的基本概念统计学形容词语法中是用形容词修饰名词,修饰数学名词常常使用下标。X1,X2,X3,X4,….,Xn数学动词语法中是用动词表示与名词相关的行为,数学动词指导读者进行某种操作,使用∑求和以及开方运算∑(X1,X2,X3,X4,X5)统计学第2讲第2章—统计学的基本概念数学副词语法中副词被用来修饰动词,数学中也是一样。如果X1=7,X2=5,X3=9,X4=8,X5=11,X6=4X1+X2+X3+X4+……+Xn那么统计学第2讲第2章—统计学的基本概念

有时需要计算平方和=25+81+64+121=291

有时需要计算和的平方=(5+9+8+11)2=332=1089统计学第2讲第2章—统计学的基本概念如果X1=7,X2=5,X3=9,X4=8,X5=11,X6=4举例计算全部求和2.3求和规则统计学第2讲第2章—统计学的基本概念规则1N个常数相加等于此常数的N倍如果c=10,N=5,那么如果那么统计学第2讲第2章—统计学的基本概念规则2将每个数值都乘以一个常数再求和,其结果与先将所有数值求和再乘以这个常数相等。如果c=5,并且X1=2,X2=3,X3=4,那么统计学第2讲第2章—统计学的基本概念规则3每个数都加上一个常数,然后再求和,其结果是先将每个数求和再加上N倍的常数如果N=3,并且X1=3,X2=4,X3=6,那么每个数加上一个常数c=2,那么=19统计学第2讲第2章—统计学的基本概念规则4每个数都减去一个常数,然后再求和,其结果是先将每个数求和再减去N倍的常数如果N=3,并且X1=3,X2=4,X3=6,那么每个数减去一个常数c=2,那么=7统计学第2讲第2章—统计学的基本概念举例如果X1=100465,X2=100467,X3=100469,X4=100472对四数求和,可以将每一个数减去100000,将余数求和,然后再加上400000(100000×4)统计学第2讲第2章—统计学的基本概念2.4数据类型人类愿意探索远离现实的世界,例如探索遥远的星球,但是却忽略了决定我们生存的东西?类似的情况存在于同学对数字熟悉程度和数字概念的理解之中。空气(我们每年吸入与呼出的空气次数超过4亿次)例如计算球赛分数,计算考试分数等,若要问及单独一个数字是什么意思,或者问及描述处理数字的方法时,你怎么回答?统计学第2讲第2章—统计学的基本概念我们使用的大多数数字不具有算术性质三种数字类型1.称名量表数据(Nominalscaledata)2.顺序量表数据(Ordinalscaledata)3.等距和比率量表数据(Intervalandratioscaledata)测量(measurement)是事先根据一系列规则,对人、事物或事件用数字加以确定。统计学第2讲第2章—统计学的基本概念除开按照测量水平对数字进行分类之外,还可使用称名---顺序---等距---比率的划分方法观察和测量的基本要求是能够得到自然科学和社会科学的承认。其观察的事物经常称为“变量”。任意一个具体的观察值称为“变量值”。假如我们要研究幼儿园男女个体差异以及他(她)们花费在耍玩具上的时间。可以按性别进行分类,以分钟为单位来计量时间。则男女是分类变量,只有两种可能的取值,而时间是数值变量。定义哑变量:男=1,女=2,方便电脑识别统计学第2讲第2章—统计学的基本概念2.4.1称名量表(nominalscale)称名量表数据是由研究类别中的频次构成,例如性别、颜色类别、人口数、学校数、被试者态度,也称为频次数据(frequencydata),称名数据或分类数据。对无序变量的观察构成的非常低水平的测量,称为测量的称名量表。用数值赋予不同的类别,但数字无数量意义。与称名量表相关的数学关系只有等于(=)或(≠).统计学第2讲第2章—统计学的基本概念2.4.2顺序量表顺序量表既可以表示类别之间的不同关系,又可表示类别之间的位置关系。按照事物属性的大小或多少,按照顺序排列得到。进入比称名量表高一级的测量时,顺序量表是用来描述一系列顺序关系的度量。例如球员排名、候选人排名,无论排名高低,并无差异,只要个体与他在有序序列中的相对位置保持一致即可。统计学第2讲第2章—统计学的基本概念2.4.3等距和比率量表是最高等级的测量。与等距和比率量表相联系的数值具有真正的数量意义。可以进行加减乘除。等距和比率量表要求具有相同的测量单位,例如英寸、磅、秒、公斤。等距和比率量表的区别在于是否具有绝对零点。等距量表是有相等单位但无绝对零的数据,例如时间、温度、能力分数、智商,只能加减不能乘除。统计学第2讲第2章—统计学的基本概念比率量表:既表明大小又有相等单位,还具有绝对零点,例如身高、体重、反应等。例如:零年并不表示在此之前没有时间。相反,在比率量表中零表示完全不存在。长度为零意味着没有。例如:摄氏温度量表中,零点表示海平面上水结冰的点,是任意零点。真正的零点是什么?绝对零度(absolutezero)-273℃统计学第2讲第2章—统计学的基本概念-273°-200°-100°0°100°40°20°10°图2-1摄氏温度量表上不同点与绝对零点之间的关系40°是20°的两倍吗?20°是10°的两倍吗?40°=273°+40°=313°20°=273°+20°=293°10°=273°+10°=283°统计学第2讲第2章—统计学的基本概念

不能够说40是20的两倍,因为变量的测量水平会影响到你从数据中得出的结论。许多心理测量都是在等距量表上测量的,这些量表没有绝对零点。等距与比率量表得出的结论是不同的。例如:拼写测验,一人得40,另外一人得80分,可以说,后者是前者的两倍,但不能说后者是前者能力的两倍,为什么?

因为得0分并不意味着没有能力。只有当0分意味着绝对没有某种特质时,才可以下这样的结论。

可以很确定地说200斤是100斤的两倍。统计学第2讲第2章—统计学的基本概念测量工具最起码应该达到等距量表的水平,尽管测量获得的是等距还是比率量表存在争议,都是大多数行为科学家愿意接受这种假设。量表特点举例称名无序类别男性=1女性=2顺序有序名次:1、2、3等距有序、间距相等,无绝对零温度、考分比率有序、间距相等,有真正零点身高、体重表2-1量表及其特点统计学第2讲第2章—统计学的基本概念2.5连续变量和非连续变量如果让你调查每个每个美国家庭的儿童数量,其数量是从多少开始呢?从0开始,依次增加1人到大约15人或20人。平均每个美国家庭有个孩子。X=0,1,…,20被称为非连续变量(discontinuousvariable)或者间断变量(discretevariable),其特点与计数单位(countingunit)相同。非连续变量可以做代数运算,可以加减乘除。例如玩耍次数,老鼠按杠杆的次数。统计学第2讲第2章—统计学的基本概念连续变量(continuousvariable)

连续变量是没有数值间断的变量,任何两个数据点之间都可细分出无限多大小不同之数值,例如年龄、长度、重量、自信心分数等。注意:对非连续变量的测量时精确的,但是对连续变量的测量是近似的。如果报告某人的身高是168厘米,意思是什么?身高是厘米所以,连续变量的特点与测量单位(measuringunit)相同。通常是以整数来表示的。统计学第2讲第2章—统计学的基本概念2.5.1连续变量和数值的实限尽管连续变量的取值是近似的,我们可以列出连续变量取真值的区间(实限)。实限=真值±半个测量单位。例如体重称量55公斤,实限~公斤。455.566.5785.96.06.056.16.156.26.256.3图2-3变量取值及其实限统计学第2讲第2章—统计学的基本概念11的实限是到,为什么?11.5的实限是到,为什么?112的实限是到,为什么?的实限是到,为什么?2.6尾数的取舍1.你想要保留几位整数?2.怎样决定最后一位数字?视有效数字位数在获取最后数字时,最后数据比原始数据多保留两位小数,在中间步骤中不能取舍尾数*。统计学第2讲第2章—统计学的基本概念若原始数据是整数,则保留到第二位小数。若原始数据是10分位的,则保留到第3位小数,余类推。确定最后一位数字的规则:1.划分出要保留尾数的小数位数(比原始数据多两位)∧502.如果余数恰好是5,入成最接近的偶数。∧50仍然是∧50变成是∧50仍然是统计学第2讲第2章—统计学的基本概念3.如果余数大于5,就入到下一个更大的数字。如果小于5,则最后一位数字保持不变。记住:并不是所有的数字都保留两位小数,近似到什么程度将影响到最终答案。∧550保留两位小数变成是∧50保留三位小数变成是

在其他课程中,可能只要遇到≥5就进一位或其他舍入方法。但在统计中,如果在一个方向系统地取舍尾数,可能会产生系统误差(systematicerror)统计学第2讲第2章—统计学的基本概念假定第二位小数是5,就在前一位增加,所有的数值就都会增加,从而导致一个的系统误差近似为近似为近似为近似为25.20变成为系统误差-统计学第2讲第2章—统计学的基本概念假定第二位小数是5,如果前一位是奇数就进一位,如果是偶数就不变,那就不会产生系统误差近似为近似为近似为近似为25.20近似变成为统计学第2讲第2章—统计学的基本概念让我们看一些保留两位的例子近似为,为什么?近似为,为什么?近似为,为什么?近似为,为什么?近似为,为什么?近似为,为什么?统计学第2讲第2章—统计学的基本概念为下列数字保留一位小数的例子近似为,为什么?近似为,为什么?近似为,为什么?近似为,为什么?把下列数字保留为整数近似为678,为什么?近似为679,为什么?近似为680,为什么?近似为679,为什么?统计学第2讲第2章—统计学的基本概念2.7比率、频次、比例和百分数例1:一家幼儿园有50名儿童,其中男孩30名,女孩20名,那么女孩与男孩的比率(ratio)是多少?比率(ratio)是30:20,或3:2女孩的比例(proportion)是多少?比例是女孩的百分数(percentage)是多少?女孩百分数是40%男孩是60%统计学第2讲第2章—统计学的基本概念如果幼儿园要扩招10名儿童,总人数达到60人,其增长百分数是多少?什么叫增长百分数(percentincrease)?则增长百分数为20%如果要扩招50名儿童,其增长百分数是多少?比例、比率和百分数被滥用的例子:某人指责图书馆在三年内图书只增长了3%。校园停车费增长了150%,食堂食物变质率增长400%统计学第2讲第2章—统计学的基本概念例2某疾病控制中心用4000名妇女作为被试,目的是通过HIV咨询和检测点来检测HIV的感染情况。被试按种族分为三类,感染情况分为两类,即阳性和阴性种族HIV阳性HIV阴性合计黑人4913901439西班牙人21640661白人1718901907合计8739204007表2-21989-1990年由公众资助的HIV检测结果统计学第2讲第2章—统计学的基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论