教育统计学 课件 第1次课程简介及统计学基本概念;第4-5次课-数据文件的建立编辑与初步统计_第1页
教育统计学 课件 第1次课程简介及统计学基本概念;第4-5次课-数据文件的建立编辑与初步统计_第2页
教育统计学 课件 第1次课程简介及统计学基本概念;第4-5次课-数据文件的建立编辑与初步统计_第3页
教育统计学 课件 第1次课程简介及统计学基本概念;第4-5次课-数据文件的建立编辑与初步统计_第4页
教育统计学 课件 第1次课程简介及统计学基本概念;第4-5次课-数据文件的建立编辑与初步统计_第5页
已阅读5页,还剩144页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计学课堂简介及统计学基本知识北京师范大学教育学部胡咏梅教育学部本科生课程教学目的学习要求教学方式与考核教材及参考资料□

课程简介教学安排contents什么是教育统计学统计学中的基本概念描述统计与推断统计数据类型随机变量数据测度水平□

统计学基本知识什么是统计学

数据来源contents□

自我介绍□

你对统计学知识有多少了解?在生活中有没有运用统计学知识的经历?□

随机投掷三个骰子(质地均匀的6面体,1-6个数字),三个骰子数字之

和出现以下数字的概率哪些最大?□

4,5,6,7,8,9,10,11,12,13,14,15,16,171011121314151617234466664222628北京师范大学教育学部由54

.99%提高到58

.8%。20122013201420152016服务业比重从45.396上升到51.69%6,成为经济增长主动力。2012

2013201420152016

2017高技术制造业年均增长11.796。数据逐年看:为什么说这5年发生了

历史性变革20贵晶O

人编

:2018年3月5日,第十三届全国人民代表大会第一次会议在北

京人民大会堂开幕,国务院总理李克强作政府工作报告。李克强表示,第十二

届全国人民代表大会第一次会议以来的5年,中国经济社会发展取得历史性成

就、发生历史性变革。人民网梳理近年来逐年的100多项关键数据,对这5年

的历史性成就和历史性变革进行全面展现。中国移动口得星

09:57×

北京师范大学中国移动

O北京师范大学五年来,经济结构出现重大变革从54万亿元增加到82

.7万亿元,年均增长7

.

196,占世界经济比重从

11.496提高到15%左右,对世界经济增长责献率超过309%6。增速一

7.8%

7.3%从11.7万亿元增加到17.3万亿元。2017年全国财政收入

增长7.49%.扭转增速放缓态势。增速→10.2%

8,6%

5.8%

4.5%7-4%五年来,经济实力跃上新台阶国内生产总值消费贡献率财政收入09:58201717由52.2%提高到57.5%。2012

20132014

20152016

2017由5千多户增加到1万6千多户。5000

1万户201220132014201520162017中国移动口

010:00北京师范大学中国移动O北京师范大学能耗单位国内生产总值能耗、

水耗均下降20%以上。下障3.79%2013下障4.8%2014下障5.69%2015下障5.0%20163.720

17取得决定性进展,贫困人口减少6800多万,易地扶贫搬迁830万人,贫困发生率由10.296下降到3.19%。1650万

入1

2

3

2万

入14

4

2万人1240万人128

9万人五年来,生态环境状况逐步好转五年来,人民生活持续改善社会养老保险覆盖9

亿

人,基本医疗保险覆盖13

.

5亿人,织就了世界上最大的社会保障网。74个重点城市重污染天数减少一半科技进步贡献率日均新设企业达

到7

6

.

7

岁改造2

6

0

0多万套沙化土地面积脱贫攻坚森林面积污染天数农村危房人均预期寿命社会保障棚户区住房201201

2012016

201年

近2

0

0

0

里改

造1

7

0

0多

户增

加1

.

6

3

亿

亩减人

口09:59中国移动O

□09:59X

北京师范大学居民收入中国移动O

D09:58X

北京师范大学粮食生产能力12038.7亿斤20132014201520161214212324.8

12358亿斤12428.7亿斤从52.696提高到58.59%。54.8%

56.1%

57.4%

58.5%2012

20132014201520162017增速15%

9.9%

8.9%10.6%

n.6%全国居民人均可支配收入年均增长7.4%,超过经济增速,形成世界上人口最多的中等收入群体。增

8.0%

7-4%

.3%

7.2920五年来,创新驱动发展成果丰硕社会养老保险覆盖9亿多人,基本医疗保险覆盖13

.5亿人。织就了世界上最大的社会保障网。全社会研发投入出境旅游人次农村危房社会保障达

到76

.7岁

造2600多万套人均预期寿命棚户区住房年均增长119%,规模跃居世界第二位。由8300万增加到1亿3千多万。52.6%53.7%改

造1700多万户城镇化率达到1.2万亿斤。GDP总量排名国家名称单位亿美元GDP总量(人民币亿元)GDP总量(人民币亿元)地区排名第1美国$193621.3亿¥1308105.5028亿元壹佰叁拾万捌仟壹佰零伍亿元美洲国家排名第2中

国$122427.76亿¥827121.94656亿元捌拾贰万渠仟壹佰贰拾壹亿元亚洲国家排名第3日

本548844.9亿¥329996.1444亿元叁拾贰万玖仟玖佰玖拾陆亿元亚洲国家排名第4德国$36518.7亿¥246720.3372亿元贰拾肆万陆仟柒佰贰拾亿元欧洲国家排名第5法周$25748.1亿¥173954.1636亿元壹拾柒万叁仟玖佰伍拾肆亿元欧洲国家排名第6英国$25650.5亿¥173294.778亿元壹拾柒万叁仟贰佰玖拾肆亿元欧洲国家排名第7印度$24390.1亿¥164779.5156亿元壹拾陆万肆仟柒佰柒拾玖亿元亚洲国家排名第8巴西$20809.2亿¥140586.9552亿元壹拾肆万零伍佰捌拾陆亿元美洲国家排名第9意大利$19211.4亿¥129792.2184亿元壹拾贰万玖仟柒佰玖拾贰亿元欧洲国家排名第10加章大$16403.9亿¥110824.7484亿元壹拾壹万零捌佰贰拾肆亿元美洲国家排名第11韩国$15297.4亿¥103349.2344亿元壹拾万叁仟叁佰肆拾玖亿元亚洲国家排名第12俄罗断514693.4亿¥99268.6104亿元玖万玖仟贰佰陆拾捌亿元欧洲国家排名第13澳大利亚$13901.5亿¥93918.534亿元玖万叁仟玖佰壹拾捌亿元大洋州国家排名第14西班牙$13071.7亿¥88312.4052亿元捌万捌仟叁佰壹拾氮亿元欧洲国家排名第15墨西哥$11424.5亿¥77183.922亿元柒万柒仟壹佰捌拾叁亿元美洲国家排名第16印度尼西亚$10109.4亿¥68299.1064亿元陆万捌仟贰佰玖拾玖亿元亚洲国家排名第17土耳其58412.06亿¥56831.87736亿元伍万陆仟捌佰叁拾壹亿元亚洲国家排名第18荷兰$8244.8亿¥55701.8688亿元伍万伍仟渠佰零壹亿元欧洲国家排名第19瑞士$6806.45亿¥45984.3762亿元肆万伍仟玖佰捌拾肆亿元欧洲国家排名第20沙特阿拉伯$6785.41亿¥45842.22996亿元肆万伍仟捌佰肆拾是必元

"

学唐驳虎

:世界上有多少国家比中国人富?说的是人均2017年世界GDP排名(名义GDP国内生产总值世界排名)名义GDP与实际GDP的区别

北京师范大学教育学部口名

义GDP(Nominal

GDP)

也称货币GDP,是用生产物品和劳务的当

价格计算的全部最终产品的市场价值。□

际GDP

是指按基年价格计算的最终产品的价值。由于相同产品的价格在不同的年份会有所不同,因此,如果用名义GDP就无法对国民收入进行历史

的比较。为了使一个国家或地区不同年份的GDP

具有可比性,就需要以某一年的价格水平为基准,各

年的GDP都按照这一价格水平来计算。这个特定的年份就是基年,基年的价格水平就是所谓的不变价

格,按基年的不变价格计算出来的各年最终产品的价值就是实际GDP

。名

义GDP和实际GDP的关系可

以表示为:□名义GDP=

实际GDP×GDP

平减指数□

例如,2005年的名义GDP

是用2005年的价格水平算出的,而实际GDP

则是用2000的价格水平得出的(如果选2000年作基年)。秩国家人均国民总收入(美元

)年49甲巴拿马12,140201650二克罗地亚12,130201651二阿根廷11,970201652可火鸡11230201653哥斯达黎加10,840201654瑙鲁10750201655马尔代夫10,3802016世界10308201656四马来西亚9860201657毛里求斯9,770201658俄罗斯联邦9,720201659罗马尼亚9,480201660丽格林纳达9100201661墨西哥9,040201662巴西8,840201663哈萨克斯坦8810201664圣卢西亚8400201665中国8,250201600黎巴嫩7,9802016保加利亚75802016中国以8250美元排在第65位,排在中国前面的有64个国家,排在中国后面的有111个国家。按国家数量,占世界人口18.3%的中

国,排在前1/3的位置。全球所有人均GDP

排在中国前面

的国家,全部人口加起来也才17

亿,占世界人口的23%不到。2016年人均GDP排行榜(176个经济体)中高收入群体

[

编辑]1960-2015年间美国、中国、日本、德国、巴西、俄罗斯、印度的GDP变化趋势

北京师范大学教育学部2000-2015这15年间,中国的人均GDP,

从1000美元到

9000美元,翻了9倍以上。【“为什么我那么穷”】8000美元?我这么穷,哪来的8000美元?

北京师范大学教育学部□

“国内生产总值”GDP

是反映一个国家最终生产成果的总量指标,而“国民可支配收入”NDI

是衡量一个国家最终国民所得收入的总量指标,

GDP

代表的是生产总量;NDI

代表的是收入总量。□

简单地说,收入总量肯定要小于生产总量,NDI

肯定小于GDP。□

因为,

一国的GDP

要经过收入的初次分配和再分配,最终才能形成一国

的NDI,GDP

数据中除了国民薪资收入,还包括企业的利润和再投资,国家的税收开支与基础设施投资建设,也就是为未来积累的部分,以及

税收调节的社会福利再分配。根据国家统计局前几天公布的2017年国民经济和社会发展统计公

报:2017年全国人均NDI

为25974元,比2016年增长9.0%,扣除

通胀因素,实际增长7.3%。这占到人均GDP(59660

元)的43.5%。图182013

-

2017年全国居民人均可支配收入及其增长速度全国居民人均可支配收入-0一比上年实际增长2597423821219662016718311元35000280002100014000700008.06.320132014201520162017%302418120北京师

大学

教育

部7.38.1□

统计和反映民生状况,“算术平均数”容易掩盖不同人群之间存在的差距,还会引发

“被平均”的抱怨。但国际通行的“50%中位数值”就较好地反映了总体的状况。□2017年,全国人均NDI

的中位数为22408元,增长7.3%。□

按常住地分,城镇居民人均可支配收入36396元,中位数为33834元,折合月收入为28

20元。□农村居民人均可支配收入13432元,中位数为11969元。农民工的人均月收入997元。□

把全国居民人均年收入的中位数22408元,折合为月收入1867元。这是把成年劳动力

和无个人收入需要供养的老人小孩都平均进来之后的最终结果。北京师范大学教育学部公报除了50%中位数,还专门分门别类统计了不同层次人群的收入状况。□

在全体国民中,收入最低的20%低收入组2.8亿人,人均可支配收入5958元,月均不到

500元。□收入位于20%~40%的中等偏下收入组2.8亿人,人均可支配收入13843元,月均1153元。□收入位于40%~60%的中等收入组2.8亿人,人均可支配收入22495元,月均1875元。□收入位于60%~80%中等偏上收入组2.8亿人,人均可支配收入34547元,月均2879元。□收入位于头部20%的高收入组2.8亿人,人均可支配收入64934元,月均5412元。2017年收入分层

北京师范大学教育学部□

笔者再估测一下,这其中又位于最头部10%的1.4亿人——他们大多分布

在一二三线城市,人均月可支配收入应达到7500元左右

北京师范大学教育学部200020132014

20152016

2017按照人均2010年不变价2300元(目前一般按3300元掌握)的农村贫困标准

计算,2017年年底,农村依然有最贫困人口3046万人,占人口比例为3%。

按现行标准,当他们月均综合收入(还不是现金收入)超过275元,就算

脱贫了。如果按照世界银行的国际标准(每天生活费1.9美元,每天12元,

每月360元),中国则还有约6000万人生活在贫困线以下。图202013-2017年年末全国农村贫困人口

北京师范大学教育学部82497017557543353046万人10000800060004000最新中国小康家庭标准富人家庭年收入500万以上富裕家庭

年收入200-500万中产家庭年收入80-200万小康家庭

年收入60-80万贫穷家庭年收入35-60万贫困家庭

年收入20-35万困难家庭年收入10-20万特困家庭

年收入1C万以下下面这张

图就代表着北上广深顶尖群体“眼中的世界”北京艺大学教□

你对这门课有什么样的期待?北京师范大学教育学部实证研

究已逐渐成为中国教育科学研究的趋势

北京师范大学教育学部□

华东师范大学教育学部、北京师范大学教育学部、全国教育科学规划

办公室、光明日报教育研究中心于2015年10月17-18日在上海召开了全

国首届教育实证研究论坛,与会代表一致认为,加强实证研究是提高

教育科学研究水平、更好地发挥教育研究探索真理、咨政育人作用的

迫切要求,大力开发教育数据是加强实证研究的必要前提。□“用数据说话、用数据决策、用数据管理、用数据创新”。□

通过基于证据的科学决策,提高政府教育治理能力现代化水平。□

大数据时代教育研究的趋势:用数据来描述现象,用模型解释变化,用理论分析原因,

用实证建言政策。

君2023-3-5大数据告诉你:状元都是来自这些家庭!2016-06-26

北京师范大学教育学部□“澎湃新闻”发布了一份2015高考状元调查报告,对全国21个省和直辖

市的29名省级高考状元进行了全方位分析,包括了他们的学习、生活、

思想状况。□

家庭篇:什么样的家庭最容易培养出高考状元?1.

父母职业都是什么呢?生产人员销售人员

市场/公关人员客服人员

行政/后勤人员人力资源财务/审计人员文职/办事人员

技术/研发人员

管理人员教师

顾问/咨询专业人士(如会计师、律师、建筑师、医其它生产人员销售人员

市场/公关人员客服人员

行政/后勤人员入力资源

财务/审计人员

文职/办事人员

技术/研发人员

管理人员教师顾问/咨询专业人士(如会计师、律师、建筑师、医

其它03.45%3.45%0.00%3.45%0.00%10.34%

6.90%3.45%6.90%06.90%您父亲的职业是您母亲的职业是27.59%27.59%17.24%

13.79%3.45%

3.45%

3.45%3.45%3.45%

3.45%大学教31.03%6.90%6.90%3.45%002.状元们平时做家务吗?平时做家务吗

68.97%20.69%偶尔做

经常做10.34%每天做0.00%不做北京师范大学教育

(是否权威型-自由民主型家长)

北京师范大学教育学3.父母是否会干预学习?

4.与父母沟通顺畅吗?58.62%41.38%0

0

0儿乎不会86%偶尔会14%经常会

0%多来自普通小学和初中■小学■初中

■高中72.41%普通

41.38%20.69%3.45%特色

13.79%3.45%国际10.34%区示范性6.90%10.34%市示范性37.93%6.90%国家级示范性(省一级示范性)51.72%近九成没参加课外辅导班89.66%3.45%有,≥2个课外班篇:谁说状元就要拼学区房、课外班?1.状元们都是择校狂人么?2.状元们都上什么课外班?6.90%有,1个没有20.69%13.79%17.24%学习习惯篇:状元也非金刚人,照样爱拼才会赢

北京师范大学教育1.六成以上晚上11点后入睡48.28%24.14%20.69%6.90%10点以前

10点—11点11点—12点12点以前2.七成以上状元考前每天学习6小时以上

3.平时学习也很拼考前复习时间平均每天学习时间学习习惯篇:状元也非金刚人,照样爱拼才会赢

北京师范大学教育其它24%8小时以上10%6-8小时14%6

8小时

38%8小时以上38%4-

6

小时

52%其它

24%学习习惯篇:状元也非金刚人,照样爱拼才会赢4.状元高考也会感到紧张高考心态略带紧张

48%其它

52%北京师范大学教育学学习习惯篇:状元也非金刚人,照样爱拼才会赢

北京师范大学教育学5.遇到学习瓶颈怎么办?学习习惯篇:状元也非金刚人,照样爱拼才会赢6.倾向于独立完成作业方式状元怎么完成作业?其它3%独立完

成,有不懂

的自己查阅相关知识点北京师范大学教育97%多数状元学习特征:七成以上状元平时每天课外学习时间都在4小时以上、

六成每天11点以后睡觉、遇到学习瓶颈先自己思考、良好的心态学习习惯篇:状元也非金刚人,照样爱拼才会赢7.什么让你取得了好成绩?(单选题)17.24%6.90%取得好成绩的关键34.48%北京师范大学教育41.38%类似的调查研究需要学习哪些方法?

北京师范大学教育学部□

调查问卷的设计□

数据的收集方法(抽样方法与调查实施)□

数据的整理与统计分析(数据文件的编辑、统计方法)□

第1次课程简介及统计学基本知识□

第2、3次调查问卷和设计与评价□

第4、5次数据文件的建立、编辑与初步分析□

第6、7次数据的统计描述与数据的表示□

第8次概率与概率分布□

第9次抽样与抽样分布□

第10次参数估计□

第11次推断统计的基本概念与参数假设检验一、教

学安排

北京师范大学教育学□

第12次相关分析及其应用□

第13次方差分析及其应用□

第14次探索性因子分析及其应用□

第15次聚类分析及其应用□

第16次判别分析及其应用一、教学安排

北京师范大学教育学部□

通过对常用的教育统计方法的介绍,使学生了解和掌握这些方法的用途、原

理、条件、软件操作,并借助教育管理、教育评价、教育经济以及教育心理

学研究中的实例帮助他们进一步加深对方法应用方面的思考,以提高他们从

事实证研究与分析的能力。□

通过对教育调查和测量的基本方法、技术的介绍,使学生掌握问卷和量表的

编制与评价方法,提高其对教育现状、教育效果、学业成就、能力、品格等

方面进行科学测定的水平。□

对社会科学统计分析软件包SPSS

的操作进行细致的介绍,使学生可以独立进行教育调查、教育测量、教育实验中数据资料的统计分析工作。二、教学目的

北京师范大学教育学部□

本课程是一门应用性、操作性很强的课程,要求学生投入大量的时间上机练

习,并查阅有关杂志中的文章以获得对统计方法的深刻理解。因此,要求:(1)投入充分的上机时间,完成课后作业。(2)查阅《教育与经济》、《教育经济评论》、《高等教育研究》、《北大教

育评论》、《教育学报》、《心理学报》等杂志中涉及统计分析方法的文章。(3)完成课后材料的阅读。(4)缺课三次原则上取消选课资格。三、学

习要求北京师范大学教育学部□

课上以讲授为主,同时,结合上机操作。□

课下阅读相关文献(教材、参考书以及期刊中采用统计分析方法的文

章),完成平时作业(占40%)。□

期末考试(占60%):开卷笔试四、教学方式与考核北京师范大学教育学[1]胡咏梅编著,《教育统计学》,中国人民大学出版社,2023年第二版。[2]辛涛等编著.《心理与教育统计学》,中国人民大学出版社,2010年版。[3]刘红云编著,《高级心理统计》,中国人民大学出版社,2019年版。[4]郭志刚主编,《社会统计分析方法—SPSS

软件应用》,中国人民大学出版社,2001年2月版。[5]吴明隆编著,《SPSS

统计应用实务》,中国铁道出版社,2000年版。[6]卢纹岱主编,《SPSS

for

Windows统计分析》,电子工业出版社,2000年版。[7]梅雷迪斯.D.高尔等著,《教育研究方法导论》(第6版),江苏教育出版社,2002年

版。五、教

材及参考资料

北京师范大学教育学部例如,问卷调查Survey2.演示数据Presenting

Data例如,图表Charts

&Tables3.刻画数据(特征)CharacterizingData例如,平均值Average一、什么是统计学?

WhatisStatistics4、数据分析DataAnalysis统计学基本知识1.收集数据Collecting

Data北京师范大学教育学部做出决策Decision-Making为什么□

数理统计学是以随机现象为研究对象的数学学科。随机现象是指在一定

条件下可能产生多种结果,但是究竟产生哪种结果,事先不能确定的现

象。□

数理统计学就是通过对大量表征随机现象的数据的收集、整理、分析和

推断,来发现随机现象的统计规律的一门数学学科。□

简言之,统计学是关于数据资料的收集、整理、分析和推理的一门科学。统计学基本知识

一、什么是(数理)统计学?

北京师范大学教育学部□

教育统计学是数理统计学与教育学的一门交叉学科,它是运用数理统

计的原理和方法对教育现象进行数量化研究的一门学科。□

它将数理统计学的理论和方法应用于教育实际工作和各种教育调查、

教育实验等研究中,通过对所获得的数据的分析和处理,达到更为准

确地掌握情况、探索规律、制定方案、做出决策和预测等目的,从而为教育研究提供科学的定量分析方法。□

(

胡咏梅编著.《教育统计学与SPSS

软件应用》,北京师范大学出版社,

2002年,绪论,P1.)统计学

基本知识二、什么是教育统计学?北京师范大学教育学部统计学基本知识

三、基本概念:总体、个体、样本

北京师范大学教育学部□

总体(population)是指研究中研究者感兴趣的个体、对象或分数的全体。□

构成总体的每个基本单元称为个体

(individual)。□

从总体中抽取的一部分个体,称为总体的一个样本(sample)。样

总体的一个子集。□

样本容量(sample

size):组成样本的个体数量。统计学基本知识

三、基本概念:变量、自变量、因变量

北京师范大学教育学部□

变量

(variable):具有不确定性取值的事物属性。如性别、成绩等。□

变量在每个个体上的取值称为该变量的观测值(observation)。□自变量

(independentvariable):在心理学实验中,由研究者选择和控

制的变量,又称刺激变量,它决定着行为或心理的变化。□

因变量

(dependentvariable):被试的反应变量,它是自变量造成的结果,是研究者观察或测量的行为变量。统计学基本知识

三、基本概念:参数与统计量

北京师范大学教育学部□

反映总体数据特征的量数统称为总体参数,简称为参数。例如,总体平

均数、总体方差、总体标准差、总体相关系数等。□

统计量是指不依赖于任何未知参数的样本的函数,即它是直接从样本数

据计算出的各种量数。例如,样本平均数、样本方差、样本标准差、样

本相关系数等。统计学基本知识

四、描述统计和推断统计

北京师范大学教育学部□

描述统计:对观测数据的简缩、汇总,以概括观测数据反映的特征。□

对数据“分布”的描述;对数据集中趋势的描述;对数据离散程度的

描述;对数据之间相互关系的描述。□

包括:□呈现数据PresentingData(统计表、图)□刻画数据特征CharacterizingData(集中量数、离散量数、相关系数)□目标(Purpose)□描述数据DescribeData统计学基本知识

描述统计

北京师范大学教育学部□

推断统计:利用从总体中的一个样本获得的信息来推断总体的特征时使用的方法。包括:□参数估计Parameter

Estimation□假设检验Hypothesis

Testing□预测Prediction□目

(Purpose)□确定总体的特征MakeDecisionsAboutPopulationCharacteristics统计学基本知识

推断统计

北京师范大学教育学部统计学基本知识

、数据来源

北京师范大学教育数据来源直接来源

间接来源实验

问卷调查

观察

出版物或网上统计学基本知识

北京师范大学教育学部□《教育事业统计公报》、《教育经费执行情况统计公报》、《人力资源

和社会保障事业发展公报》、《中国教育年鉴》、《中国教育统计年鉴》、《中国教育经费统计年鉴》、《中国劳动统计年鉴》等等□

中国调查与数据中心:http://nsrc.ruc.edu.cn/中围人民大学中国调查与数据中心NSRCNationalSurveyResearchCenteratRenminUniversityofChina中

介中国人民大学中国调查与数据中心(NationalSurveyResearchCenteratRenminUniversityof

China,NSRC)是中国人民大学直属的跨学科、跨院系的综合性研究机构。中心的宗旨为科学、系统、全面地采集、整理、存储与开发中国经济与社会调查数据,进行调查方法与相关技术的研究开

发,实施具有重大科学与现实意义的大型科研项目,为科学研究和政府决策提供数据支持。中国

调….通

与公

告关于开展中国教育追踪调查(CEPS)2017

年追访的公告电话调查实习生招聘启事中国综合社会调查(CGSS)开展全国范围访问的公告关于开展大城市居民住房租赁状况电话调查的公告更

知中心主任袁卫接受《中国教育

报》专访,畅谈大数据什么是大数据?也许你不能准确地给它下

一个定义,但是,你知道或者不知道,它

就在那里,已经参透到你工作、生活的方方面面。我们该如何应对这场被一些人称

为第四次科技革命的全球新竞争?又如何培养适应大数据时代要求的高层次人才

…首页关于我们

联系我们

RSS订阅中国人民大学中国调查与x①

应用

Consular

Electronicthydù数it

0d|

ět

a

bayanatiuJ⁰

atuan原

来百

度的网

页网Glgoo

学术搜索欢

线

-Beiji

●四所高校超百亿!看

山tasedad查看详情新

动态Datendatuak国家发改委副主任、国家统计局局长宁吉喆到中心调研统计调查工作中心参加“2016年中国开放获取推介周活动《中国互联网发展指数》专家论证会在中心召开《大数据分析统计应用丛书》正式出版发行2016中国综合社会调查(CGSS)

之宗教调查绘图抽样培训顺利举行)

东亚社会调查2016年度工作会议顺利召开中国教育追踪调查(CEPS)2016

年度追访正式启动中国老年社会追踪调查新闻发布会顺利召开)中心发布《中国城市创业指数》中国人民大学中国调查与×C

nsrc.ruc.edu.cn应用

Consular

Electronic

原来百度的网页网

Glgoo学术搜索k

欢乐颂全集在线观

北京师范大学首都教新闻与动态中国国家调查数据库(CNSDA)Chinese

National

Survey

Data

Archive中国综合社会调查(CGSS)ChineseGeneralSocial

Survey中国教育追踪调查(CEPS)China

Education

PanelSurvey中国宗教调查(CRS)China

Religion

Survey中国老年社会追踪调查(CLASS)Chinese

Longitudinal

Aging

Social

Survey北京师范大学-Beji

四所高校超百亿!看通

与公

告关于开展中国教育追踪调查(CEPS)2017年追访的公告电话调查实习生招聘启事中国综合社会调查(CGSS)开展全国范围访问的公告

关于开展大城市居民住房租赁状况电话调查的公告中心主任袁卫接受《中国教育

报》专访,畅谈大数据什么是大数据?也许你不能准确地给它下

一个定义,但是,你知道或者不知道,它

就在那里,已经渗透到你工作、生活的方

方面面。我们该如何应对这场被一些人称

为“第四次科技革命”的全球新竞争?又如何

培养适应大数据时代要求的高层次人才…中国发展指数(RCDI)RUC

Chinese

Development

Index更多新闻更多通知

其他书签研

目数据数值数据

属性数据离散数据

连续数据统计学基本知识六

、数据类型北京师

范大学教育□

数值数据(定量的)□离散的(数出来的)■本月内买过几本书?

□连续的(测出来的)■从家到学校的距离?

(公里)□

属性数据(定性的)■你喜欢参与式教学吗?

喜欢

不喜欢统计学基本知识

数据类型举例

北京师范大学教育学部统计学基本知识

七、随机变量

北京师范大学教育学部□

表示随机现象各种结果的变量叫做随机变量。一般用X,Y,Z

等英文字

母来表示。用

“X=0”表示“未考上大学”

,“X=1”表示“考上大学”。□按照随机变量取值的测量水平,分为:定类变量、定序变量、定距变量、定比变量统计学基本知识

八、数据测度水平

北京师范大学教育学部□

定类变量

(Nominalvariable,又称称名变量):无等级次序排列的数据,

用来划分事物的不同类别。□

男-女;汉族-少数民族;工作单位类型□

定序变量(Ordinalvariable,又称顺序变量):可作等级次序排列的数

据。□

学校职称;班级排名统计学基本知识

八、数据测度水平

北京师范大学教育学部□

定距变量

(Intervalvariable,又称等距变量):具有相对参照点、相等单

位的数据。□没有真正的零点;例如,摄氏度C°;各种能力分数□

定比变量

(Ratiovariable,又称比率变量):存在真正的零点,有相等

单位,倍数有意义的数据。□身高、体重□

数据测度水平的信息含量由弱到强排列:

定类变量→定序变量→定距变量→定比变量□

定类变量和定序变量用于属性数据□

信息量相对较低;不能进行加减乘除运算□

定距变量和定比变量用于数值数据□

信息量相对较高;定距变量可以进行加减运算;定比变量还可以进行乘除运算。统计学基本知识

数据度量与信息含量

北京师范大学教育学部以下数据是属性数据还是数值数据?是离散的还是连续的?属于哪一种测度变量?1.汽车速度(km/h)

120,60,302.温度C°78,64,853.兄弟姐妹个数

0,1,2,3,44.成绩

A,B,C,D统计学基本知识

思考题

北京师范大学教育学部□

请珍惜当下□

请珍惜他人□

请珍惜自己,珍惜健康□

请珍惜你内心的渴望□

请珍惜我们这个伟大的时代北大经济学院院长孙祁祥教授2017年开学典礼的演讲-珍惜

北京师范大学教育学部□

请珍惜当下□做好每天的事情,而不要给自己太多懈怠、拖延

的理由。“明日复明日,明日何其多,我生待明

日,万事成蹉跎”。人生真的就是一场马拉松,每一个到达终点的人,都是从第一步开始、从每一步积累的。□我希望你们能珍惜当下、认真做好手头的每一件

事情,并且,在自己的能力范围内尽量做到极致

和卓越。养成这样的习惯,将会让你终身受益。北大经济

学院院长孙祁祥教授的开学演讲-珍惜

北京师范大学教育学部□

请珍惜他人□在大千世界里,在芸芸众生中,我们能走到一

起,真的就是一种缘分。□因此,要学会珍惜彼此:珍惜师生情;珍惜同

学情;珍惜朋友情,不要把从别人,甚至你的

父母那里得到的一切看做“理所当然”,而要心

存感激,常思回报。北大经

济学院院长孙祁祥教授的开学演讲-珍惜

北京师范大学教育学部□

请珍惜自己,特别是你的健康□不要因为年轻就肆意透支你的身体。□有一句格言说:“有两种东西丧失之后才会发

现它的价值——青春和健康”。但青春逝去,未见得活力不在、睿智不在、优雅不在;而失去健康,即使青春犹在,年轻于你何用?财富

于你何用?时间于你何用?□我特别赞同瑞士心理学家亚美路对健康的洞见:健康是一种自由——在一切自由中首屈一指。□你可以像“潇洒走一回”那首歌中唱到的那样“我

用青春赌明天”,但同学们,千万不要“用健康赌

明天”。北大经济学院院长孙祁祥教授的开学演讲-珍惜

北京师范大学教育学部□

请珍惜你内心的渴望□请珍惜你内心的渴望,而不要忽视它、压抑它、

甚至掐灭它。□

做自己喜欢的、擅长的事情,而不要人云亦云、

心浮气躁;不要去跟别人攀比,做最好的自己

足矣。□

,选择自己心之所属并坚守,有时可能并

不是一件容易的事,但如果你能做到这一点,你将会有更多的淡定和从容,更多的积淀和突

破,更多的喜悦和快乐。北大经

济学院院长孙祁祥教授的开学演讲-珍惜

北京师范大学教育学□最后,请珍惜我们这个伟大的时代□40多年前,当我还是一名上山下乡知青的时候,

我绝对想不到,有一天自己能够进入大学读书,更别说攻读博士学位、出国学习、当上北京大学的教授。□

我常常想,我是幸运的,因为,我赶上了改革开放的伟大时代,这个时代给予了我们每个人以机

会。□同学们,我们一定要珍惜这个伟大的时代,而最

好的珍惜,就是为这个时代做出我们应有的贡献!北大经济学院院长孙祁祥教授的开学演讲

-珍惜

北京师范大学教育学部谢谢!祝同学们新学期学业精进,收获多多北京师范大学教育学部教育统计学数据文件的建立、

编辑

与初步统计分析学部本科生课程北京师范大学教育学部胡咏梅

数据文件的编辑

制定数据分析方案

对数据文件进行统计分析SPSS简介问卷数据的编码

数据的录入缺失值的分析与处理

统计预处理contents1.

SPSS软件o

SPSS是“社会科学统计软件包”(Statistical

Package

for

the

SocialScience)的简称。口

1968年,美国斯坦福大学H.Nie等三位大学生开发了最早的SPSS统计软件,并于1975年在芝加哥成立了SPSS公司,已有40多年的成长历史。口伴随SPSS服务领域的扩大和深度的增加,SPSS公司已决定将其全称更改为StatisticalProductandService

Solutions(统计产品与服务解决方案)。一、SPSS简介SPSS与SAS

o目前,世界上最著名的数据统计分析软件是SAS和SPSS。o

SAS

(Statistical

Analysis

System)

统计分析系统由于是为专业统计分析人员设计

的,具有功能强大,灵活多样的特点,为专业人士所喜爱。o

SPSS是为广大的非专业人士设计,它操作简便,好学易懂,简单实用,因而很受

非专业人士的青睐。此外,比起SAS软件来,SPSS主要针对着社会科学研究领域

开发,因而更适合应用于教育科学研究,是国外教育科研人员必备的科研工具。o1988年,中国高教学会首次推广了这种软件,从此成为国内教育科研人员最常用的

工具。2

、SPSS的安装o

SPSS软件的安装o

SPSS的启动口(见演示)口

注意,软件安装后,启动SPSS,点击“编辑”最下方的“选项”

,在打开界

面中将右侧的语言(上下两处)改为“英语”

,再点击“应用”

、“确定”,将中文界面换成英文界面。o

SPSS的退出口(见演示)3

、SPSS的启动与退出4.

1

SPSS的数据编辑窗口:用来建立、读取、编辑数据文件,开展预想的统计分析。数据编辑器包括:口标题栏口主菜单栏口工具栏口状态栏口数据输入栏口数据显示区4

、SPSS的窗口介绍o

4.2语法窗口o

4.3输出窗口SPSS的其他窗口介绍o

4.2语法窗口o

4.3输出窗口SPSS的其他窗口介绍o打开数据文件口

扩展名:*.SAV口可以打开Excel

、SAS等数据文件o行、列、单元5

、数据文件o

SPSS变量名口变量名的字符通常不超过8个口首字符不能是数字或其他符号口保留字:ALL

、AND

、BY

、EQ

、GE

、LE

、LT

、NE

、NOT

、OR、

TO

、WITH口不区分大小写6

、SPSS变量6

、SPSS变量:变量定义—变量类型口Comma:

带逗点的数值型变量,默认总长度为8,小数位数为2.如:

2,300,000.57口Dot:圆点数值型变量,默认总长度为8,小数位数为2.如:2.300.000,57口

ScientificNotation:科学记数法变量,默认总长度为8,小数位数为2.如:

1.23E2,

123E-2,

123o

SPSS变量类型:细分为8种;默认数据总长度为8.口数值型(Numeric):默认总长度为8,小数位数为2.如:2300.57口

字符型(string):默认总长度为8,如:001,010

,男,女口日期型(date):有很多格式,如:dd-mm-yyyy,mm/dd/yyyy,mm/dd/yy,

…6

、SPSS变量:变量定义—变量标签与值标签o变量标签

(variablelabels)口

对变量名的附加说明口

例如:GDPPC可以加注“人均国内生产总值”o

值标签(valuelabels)口

对变量可能取值的附加说明口

例如:EDU可以可以加注标签1表示

究生;2表本科;3表示大专;4表示专或职

5示中

6表

示初中;7表示小学;8表文盲半文o

变量格式宽度

(width)口

“变量值宽度”(width,decimals)口

“变量名宽度”(通常不超过8个字符)o

单元格对齐(alignment

,默认为右对齐)o

缺失值(missing

value)口

系统默认数值型变量的缺失值为“.

”(即跳过此单元格不填

任何数据);字符型变量的缺失值为空格。口

特殊值可以定义为缺失值,例如身高3.65米,年龄99。6

、SPSS变量:变量定义—格式宽度、单元格对齐及缺失值o

测度类型(measurement)口定比变量(scale)(包括等距、等比尺度变量),如成绩、

经费口定序变量(ordinal)(等级尺度变量),如排名、职称口定类变量(nominal)(名义尺度变量),如性别、区域

类型6

、SPSS变量:变量定义—测度类型o

观测量(case)口

表示总体中的个体单位具有的特征。例如,学生的姓名、性别、成绩、专

业等;口

一个case对应着一个横行7

、观测量

练习1:建立一个某校某年级学生期末考试成绩表文件,变量包括学生ID

、班级、性别、数学成绩、英语成绩、物理成绩。文件名:某年级学生成绩表.sav1.定义变量名(name);2.定义变量类型(type)及长度(width);3.定义变量标签(label);4.定义值标签(values);5.定义缺失值(missing);6.定义列宽度(columns);7.定义对齐格式(align);8.定义测度水平(measure)8

、定义变量9

、数据文件的保存

o

与word

、excel等相似o

编码就是对应每个问题中的每种可能答案,都规定一个相应的数字来表示。即制定数据编码方案。二、问卷数据的编码数据年级性别问题1

问题n11…

.

422………

231…

1ll数据的编码

SPSS数据文件是一种有结构的数据文件。调查问卷中的单选择题,一道问题对应一个SPSS变量。文件结构

个案case

变量名

变量

多项选择题:多项选择题不能在SPSS中直接存储。•

多项选择题的处理方法–

思路:将一个问题定义成几个变量,用这几个变量来描述该问题的

几个可能被选择的答案。–

编码方式:–多选项二分法(multiple

dichotomize

method)–多选项分类法(multiple

category

method)数据的编码•

选项二分法(适用于可多选的题目)•

将每个答案作为一个变量,每个变量只有两个取值(0/1)

例如:你认为哪些大学可以称得上是高质量的大学?

(可多选)(1)北京大学

(2)清华大学

(3)人民大学(4)北京理工大学

(5)北京师范大学

(6)北京外国语大学变量名变量名标签编码方案X11北京大学1-选中;0-未选中X12清华大学1-选中;0-未选中X13人民大学1-选中;0-未选中X14北京理工大学1-选中;0-未选中X15北京师范大学1-选中;0-未选中X16北京外国语大学1-选中;0-未选中数据的编码•

多选项分类法(适用于非全排序题):•

从备选答案中按重要程度排序,排在第一、二、三,分列三个变量

(第一选项变量、第二选项变量、第三选项变量)。这些变量的取值为这些备选答案的类别。例如:变量名变量名标签编码方案A1第一选项1-北京大学;2-清华大学;3-人民大学;4-北京理工大学;5-北京师范大学;6-北京外国语大学A2第二选项1-北京大学;2-清华大学;3-人民大学;4-北京理工大学;5-北京师范大学;6-北京外国语大学A3第三选项1-北京大学;2-清华大学;3-人民大学;4-北京理工大学;5-北京师范大学;6-北京外国语大学数据的编码变量名变量名标签编码方案北京大学北京大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-

第六清华大学清华大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-

第六人民大学人民大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-

第六北京理工大学北京理工大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-

第六北京师范大学北京师范大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-

第六北京外国语大学北京外国语大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-

第六•

多选项分类法(适用于全排序题):•

从m个备选答案中按重要程度排序,排在第1

、2

、3

,m.分列m个变量(每个

备选答案为一个变量)。这些变量的取值为这些备选答案被排列的重要次序。数据的编码例如:变量名变量名标签编码方案性别1-男生;2-女生工作类型1-教师;2-学校行政人员;3-校长或副校长;4-地方教育部门行政人员达到期望1-完全达到;2-大部分达到;3-达到一半;

4-达到小部分;5-完全没有达到基本理论教育评价的基本理论1-有用;0-没有用指标体系评价指标体系的设计1-有用;0-没有用量表设计量表的设计与评价1-有用;0-没有用………………问卷数据的编码-课堂教学意见调查表编码方案(部分)o

对居民储蓄调查问卷进行编码.练习o

根据数据编码方案进行数据录入。三、数据的录入o

各小组同学将所编制的问卷进行编码,并试录入20个cases.练习四、缺失值分析与处理

o

缺失值指的是未知的变量值,可能是由于被调查者没有给出明确的答案(如量

表题中“不知道”或“不确定”

)或调查员没有记录下或记错他们的答案。o

缺失值通常有以下三种类型:口

完全随机缺失(Missing

completely

at

random,MCAR):即缺失完全是随机发生的,和自身

或其他变量的取值没有关系。通常可以直接剔除或用均值替代。MCAR较为少见。口

随机缺失(Missing

at

random,MAR):即缺失与其他变量的取值有关(如血压数据的缺失多

集中在高年龄段,这些人群可能由于行动不便而未到场接受测量)

。此时,直接删除或者

采用均值替代均不合适,可利用EM或回归算法对缺失数据进行估计。口

非随机缺失(Missing

at

non-random,MANR):即缺失不仅和其他变量的取值有关,也和自

身取值有关(如收入调查时高收入者一般不愿意提供家庭收入值)

。通常很难处理,只能

做粗略估计。口

SPSS的缺失值分析主要针对MAR

、MCAR情况,非随机缺失基本上没有统计方法可以处理。•

Exclude

cases

analysis

by

analysis:分析过程中,当处理带有缺失值的变

量时,则剔除在该变量上取缺失值的样本,否则,不剔除。

(适用于小

样本)•

Exclude

cases

listwise:分析过程中,剔除所有在任何变量上带有缺失值

的样本。

(适用于大规模抽样的样本)•

数据文件3-1.sav分析中SPSS对缺失值的一般处理•

Transform→Replace

Missing

Values•Series

mean:用整个序列的均值作为替代值;•

Mean

of

nearby

points:利用邻近点的均值作为替代值;•

Median

of

nearby

points:表示利用邻近点的中位数作为替代值;•

Linear

interpolation:线性插值法,用缺失值前后两时点数据的线性

组合进行填补;•

Linear

trend

at

point:线性趋势值法,表示利用回归拟合线的拟合值

作为替代值。SPSS对时序数据中缺失值的一般处理o

处理缺失数据的几种常用方法:1.用一个中间值代替

(一般以样本平均值代替)

(针对MCAR)

2.用一个估算的答案代替

(针对MAR或MANR)3.列表状态删除

listwise

deletion)4.配对状态删除

(pairwise

deletion)5.EM(Expectation-maximization)或

Regression四、缺失值的分析与处理•

Estimate:对所选变量计算均值、协方差阵、相关系数矩阵。计算时对

于缺失样本的处理方式:•

Listwise•

Pairwise•

EM•

RegressionSPSS的MissingValueanalysis功能:Estimate

•回归算法:•可在回归算法计算出的估计值的基础上,增加随机误差项以调整估

计值。•

指定随机误差项的分布•Residuals:与回归的残差分布相同。•Normal

variates:均值为0

,标准差为因变量的均值标准误差的平方

根。•

Student’s

t

variates:指定自由度的t分布,其余参数同上。•None:不添加随机误差项,直接用方程估计值替换缺省值。SPSS的MissingValueana

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论