版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
简明应用统计学
(第2版)
第1章统计学绪论1.1
引言1.2什么是统计学1.3为什么要学习统计学1.4统计学的类型1.5变量的类型1.6测量的水平1.7数据的收集1.8统计软件学习目标1.理解我们为什么要学习统计学。2.什么是描述统计学和推断统计学。3.区别定性变量和定量变量,区别离散变量和连续变量。4.区别变量的定类、定序、定距和定比测度水平。5.知道数据的四种收集方式。6.知道常用的统计软件。根据最新的研究结果,消费者的行为对自然资源到底有怎样的影响呢?你应该买使用柴油发动机的汽车,还是购买电动车,或者干脆骑自行车呢?报纸、杂志或网络中的统计结果对于你的决定非常关键,这些结果建议你该有怎样的消费观。1.1引言在金融危机发生后,各国政府对于国家经济的现状和对未来经济走势的预测十分关注,每个月都要编制CPI等各类指数以评价通货膨胀情况。有关商品销售额、新开工的住宅、货币流通以及工业生产的信息仅仅是构成预测基础的成百上千类信息的一小部分。我们该如何解读这些数据呢?知道一些统计知识有助于我们知道这些数据是如何与我们的生活息息相关的。假设你是市场部的新任经理,一次广告活动的统计结果摆到了你面前,声称某个结果是“统计显著”的。你如何解释这份报告而又不暴露你对该术语的无知呢?赶快学点统计,这对你和你的事业都非常有用。1.1引言统计学是收集、分析、表述和解释数据的科学(不列颠百科全书)统计是一门收集、分析、解释和提供数据的科学(韦伯斯特国际辞典第3版)统计指的是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论(MarioF.Triola,《初级统计学》)
统计学是数据的科学和艺术1.2
什么是统计学?
(statistics)1.收集数据:取得数据2.处理数据:整理与图表展示分析数据:利用统计方法分析数据数据解释:结果的说明得到结论:从数据分析中得出客观结论收集、处理、分析、解释数据并从数据中得出结论的科学1.2
什么是统计学?
(statistics)2009年8月6日《纽约时报》发表大幅文章《当今大学毕业生的唯一关键词是:统计学》(ForToday‘sGraduate,JustOneWord:Statistics).文章举例说明统计对各行各业的重要性。2009年8月25日华尔街杂志刊登《有利于找工作的5个专业》文章,认为在美国“工程、生命科学、统计学、环境研究和金融”是就业市场最受欢迎的专业。2010年6月3日第64届联合国大会第90次会议通过决议,每年10月20日被联合国确定为“世界统计日”。体现出全世界对统计数据和统计空前的关注和重视。2011年2月美国《科学》杂志以数据为主题出版专刊,学术界对数据和数据分析高度关注。1.3
为什么要学习统计学统计在许多学科中得到广泛的应用。比如说,学术研究杂志就依赖于统计结果。在许多学科中,一篇文章是否能够发表在主要杂志上,在很大程度上取决于该文章是否能正确地使用统计方法。除了学术领域,统计在其他领域也被人们广泛使用。统计在工业中得到大量使用,尤其用于研究新产品、质量控制和市场开发中;市场调查也需要统计。1.3
为什么要学习统计学统计的应用领域经济学管理学医学工程学社会学…
统计学统计的应用领域actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学)统计的应用领域hydrology(水文学)industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)managementscience(管理科学)marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善)1.3
为什么要学习统计学
(1)数据无处不在。
(2)统计学技术对于我们做出影响日常生活的许多决
策都十分有用。
(3)无论你以后从事什么工作,你都会面临与数据打
交道做出决策的问题。对统计学方法的了解将有
助于你更加有效的做出决策。数据收集过程:抽样(sampling)。比如,为了估计某一家超市所有顾客平均年龄,你只需要收集部分顾客的年龄信息,得到平均年龄的估计以后,你就可以针对这个年龄层的顾客,制定相应广告信息。统计涉及两个不同阶段:(1)描述数据集和(2)根据样本信息得出结论(估计、预测等)。统计的应用可以被分为两个部分:描述统计学和推断统计学。1.4统计学的类型1.4统计学的类型统计方法描述统计推断统计参数估计假设检验描述统计
(descriptivestatistics)
研究数据收集、处理、汇总、图表描述、概括与分析等统计方法内容搜集数据整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=105推断统计
(inferentialstatistics)
研究如何利用样本数据来推断总体特征的统计方法内容参数估计假设检验目的对总体特征作出推断样本总体1.5变量
(variable)变量是说明现象某种特征的概念如商品销售额、受教育程度、产品的质量等级等变量的具体表现称为变量值,即数据变量的值(value)通常是对某一特定个体的度量,特定个体可能是指一个人,一个家庭,一个地区,或一个国家。从表中可知,性别变量是以人为个体的观测,孩子的数目是以家庭为个体的观测。变量变量的值个体性别男,女人学历小学,中学,本科,硕士,博士人失业有工作,无工作人孩子数0,
1,
2,
3,…家庭贫困程度严重,一般,边缘,没有地区
变量
(variable)定性变量(qualitativevariable)或属性变量(attributevariable)定性变量取的值称为水平(level)或者类(class)。比如,姓名、性别、行业、出生地、国籍/地区以及汽车类型都是定性变量。定性数据通常以饼图或者条形图(详见第2章)的形式表示。定量变量(quantitativevariable)定量变量例子比较多,比如年龄、寿命、公司的员工人数、薪水金额等等。定量变量又可以分为连续的和离散的。离散变量(discretevariable)只能取某些特定的值,并且不同取值之间通常都存在着间距。比如具有某种特征的人口(取正整数值)、某种事故发生的次数(非负整数)、足球射门次数等等。连续变量(continuousvariable)的观测值可以遍取某一区间中的任何值。身高、体重、长度等等都是连续变量的例子。变量的类型
(variable)【例1.1】下面是关于是否喜欢锻炼的部分调查数据。性别锻炼的态度出生日期身高体重男非常喜欢17065女喜欢17560女一般16561男不太喜欢17970男很讨厌15345男喜欢18065女一般17255女非常喜欢16752表1.1是否喜欢锻炼的部分调查数据表1.1中的姓名、是否锻炼为定性变量。出生日期、身高和体重为定量变量,出生日期是离散变量,而身高和体重为连续变量。变量
(例题分析)变量
(其他分类)随机变量和非随机变量经验变量(empiricalvariables)和理论变量(theoreticalvariables)经验变量所描述的是我们周围可以观察到的事物理论变量则是由统计学家用数学方法所构造出来的一些变量,比如,z
统计量、t统计量、2统计量、F统计量等变量及其类型数据还可以按照测量水平进行分类。数据的测量水平通常制约着在数据概括和显示时可以选用的计算方法,它还决定着应该使用何种统计检验方法。1.6测量的水平通常,可以从下面几个方面获得数据:来自于公开发表资料中的数据统计年鉴有关期刊有关网站实验设计数据调查数据观察数据1.7数据收集统计数据的分类统计数据的分类按计量层次分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据实验的数据统计数据的分类
(按计量尺度分)分类数据(categoricaldata)
只能归于某一类别的非数字型数据对事物进行分类的结果,数据表现为类别,用文字来表述例如,人口按性别分为男、女两类顺序数据(rankdata)
只能归于某一有序类别的非数字型数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等数值型数据(metricdata)
按数字尺度测量的观察值结果表现为具体的数值,对事物的精确测度例如:身高为175cm、168cm、183cm观测的数据(observationaldata)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据实验的数据(experimentaldata)在实验中控制实验对象而收集到的数据比如,对一种新药疗效的实验,对一种新的农作物品种的实验等自然科学领域的数据大多数都为实验数据统计数据的分类
(按收集方法分)统计数据的分类
(按时间状况分)截面数据(cross-sectionaldata)
在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2005年我国各地区的国内生产总值数据时间序列数据(timeseriesdata)
在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据数据收集的第一个准则是要清楚测量的是什么。换句话说,变量必须有一个明确的适合研究目的的定义。这有时是说起来容易做起来难。如果我们对问题考虑得不全面,那么就没理由指望回答问题的人(一般称为响应者)能按照我们期望的回答问题。在我们做研究之前,对变量必须要有一个清晰、详尽的定义。1.7数据收集:定义变量假定我们在一次食品企业的市场调查中包含了这样的问题"在您的家庭中有多少个孩子?"我们也许认为自己知道想要了解的是什么,但是,没有理由期待响应者和我们有同样的想法。我们也许不加考虑地认为,"孩子"应定义为一个不满18岁并和他(她)的亲生父母一起生活的人。但如果一个家庭中包含大于18岁的亲生子女、前妻或前夫的孩子、养子或养女、过继子女或者其他年轻的亲戚,那该怎么办呢?对于不和亲生父母生活在一起的孩子怎么算呢?对于父母离了婚而共同抚养的孩子怎么算呢?这有很多种发生混淆的可能。因此,我们在调查之前首先需要明确"孩子"的定义。1.7数据收集:定义变量数据表通常叫做数据阵或数据文件。下表是一个根据抽样调查得来的数据生成的小数据阵的例子。
序号年龄性别态度120男反对223男赞成317女反对438女中立525女赞成643男赞成738男中立851女赞成935男赞成1039女反对1.7数据收集:数据表在计算机分析数据时,需要把数据文件中的描述性文字转化成数字。每一个人都被分配一个身份号码作为名字。年龄变量本来就是用数字测量的,因此不需要任何转化。性别变量的两个取值是“女”或“男”,因此,“女”用数字0代替,“男”用数字1代替。当然还可以使用任何两个别的数字,比如用17代替“女”,用23代替“男”。“态度”这个值可以用三个等级数1、2和3表示反对、中立和赞成。序号年龄性别态度1201122313317014380252503643137381285103935131039011.7数据收集:数据表统计软件的发展,使得只要输入你的数据,选一些选项,马上就得到令人惊叹的漂亮结果了。那么,傻瓜式统计软件的使用可以代替统计课程了?当然不是。数据的整理和识别,方法的选用,计算机输出结果的理解都不像使用傻瓜相机那样简单可靠。而且,只要数据格式无误、选项不矛盾而且不用零作为除数,统计软件就一定给你结果,而且几乎没有任何警告。另外,统计软件输出的结果太多。即使是同样的方法,不同软件输出的内容还不一样,甚至有时同样的内容名称也不一样。因此,应该特别留神,明白自己是在干什么,不要在得到一堆毫无意义的垃圾
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《单片机测控技术课程设计》课程教学大纲
- 2024年伐木设备出租合同范本
- 2024年出售精装修住房合同范本
- 2024年出口导弹合同范本
- 商业街开业活动
- 培训机构转介绍数据
- 中医针灸学基础培训课件
- 《餐饮服务与管理》高教版(第二版)5.3宴会准备工作单元练习卷(解析版)
- 分子诊断与肿瘤靶向治疗
- 2024产后出血观察和护理
- 《屠呦呦》幻灯片课件
- 质量检测中心环境保护管理制度和措施
- 失业保险待遇申请表
- 弱电智能化专业考试题库
- LED电子显示屏投标书技术标
- 企业基本情况调查表模板
- 收费站专项整治活动实施方案
- 风温肺热病中医优势病种疗效总结分析报告
- 旅游资源分类调查评价表 2017版
- 四川省宝兴县县城地质灾害调查评价报告
- 创伤性血气胸急救和护理课件课件
评论
0/150
提交评论