统计法-第1-8章课件011导论_第1页
统计法-第1-8章课件011导论_第2页
统计法-第1-8章课件011导论_第3页
统计法-第1-8章课件011导论_第4页
统计法-第1-8章课件011导论_第5页
免费预览已结束,剩余50页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学Statistics

共享邮箱:

什么是统计学?什么是统计学?

(statistics)统计学是收集、分析、表述和解释数据的科学(不列颠百科全书)统计是一门收集、分析、解释和提供数据的科学(韦伯斯特国际辞典第3版)统计指的是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论(MarioF.Triola,《初级统计学》)

统计是一套有关收集、处理、分析、解释和从数据中得出的结论的方法(教材)应用案例:制定宏观经济政策

例如:政府制定各项经济政策要知道:未来的就业形势?经济增长前景?物价形势?国际收支状况?这些信息都需要大量的统计支持(数据收集、趋势预测、政策效果的评价等等)。

应用案例:抽样调查2008年11月2日各民意调查机构对美国大选的两位候选人的支持率调查结果(选民票得票率)

马里斯特:奥巴马50,麦凯恩43.

拉斯马森:奥巴马51,

麦凯恩47.

盖洛普:奥巴马52,麦凯恩43.

佐格比:奥巴马50,麦凯恩43.

迪亚乔:奥巴马48,麦凯恩41.

战场:

奥巴马49,

麦凯恩45.

IBD:

奥巴马48,

麦凯恩44.实际结果:奥巴马和麦凯恩的选民票得票率分别为52%和46%。统计数据无处不在举例1:统计局:今年5月份CPI同比增长5.5%

举例2:期末全班同学的高等代数的平均分为75,最高分为92,最低分为40,不及格率为5%举例3:挪威公共卫生研究所的科学家调查表明,每天吸烟1到4支的人罹患缺血性心脏病的几率是不吸烟者的3倍,少量吸烟的男性罹患肺癌的风险比不吸烟男性高2倍,女性少量吸烟则会使罹患肺癌的风险增加4倍。

统计数据无处不在举例4:1981年,首届国际《红楼梦》研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为《从词汇上的统计论〈红楼梦〉作者的问题》的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对《红楼梦》后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。统计学是一系列从数据中获取有用信息以帮助决策的原理和方法。统计的各步骤

(statistics)1.收集数据:取得数据2.处理数据:整理与图表展示分析数据:利用统计方法研究数据数据解释:统计结果的说明得到结论:从数据中提取有用的信息得出结论收集、处理、分析、解释数据并从数据中得出结论的科学

统计方法数据分析的统计方法描述统计推断统计参数估计假设检验描述统计

(descriptivestatistics)描述统计

—用表格、图形和数字来概括、显示数据特征的统计方法内容整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=105描述统计举例例1:2005年我国出生人口性别比(男:女)已经升高到119.92,与正常值106相比有严重的偏离。例2:中国经济增长的起伏推断统计

(inferentialstatistics)推断统计—研究如何利用样本数据来推断总体特征的统计方法内容参数估计假设检验目的对总体特征作出推断样本总体推断统计举例例1:2003年人口变动抽样调查以全国为总体,在全国抽取了990个县(市、区)、3734个乡(镇、街道)、6544个调查小区的126万人。根据调查结果推算,2003年末全国总人口为129227万人,出生人口为1599万人,死亡人口为825万人,净增人口为774万人。例2:一家大公司的会计部门会从所有的发票中选择一部分来检查公司所有发票的准确性。描述统计与推断统计的关系总体内在的数量规律性推断

统计概率论与数理统计描述

统计

总体数据样本数据统计的应用领域经济学管理学医学工程学社会学…

统计学

由于大部分学科都涉及数据分析工作,因此统计学几乎可以与任何一个学科结合起来……统计的应用领域actuarialwork

(精算)

agriculture

(农业)animalscience

(动物学)

anthropology

(人类学)archaeology(考古学)

auditing(审计学)crystallography(晶体学)

demography(人口统计学)dentistry(牙医学)

ecology

(生态学)econometrics(经济计量学)

education(教育学)electionforecastingandprojection

(选举预测和策划)engineering(工程)

epidemiology(流行病学)finance(金融)fisheriesresearch

(水产渔业研究)gambling(赌博)

genetics(遗传学)geography(地理学)

geology(地质学)historicalresearch

(历史研究)

humangenetics

(人类遗传学)统计的应用领域hydrology(水文学)

industry

(工业)linguistics

(语言学)

literature(文学)manpowerplanning

(劳动力计划)managementscience

(管理科学)marketing(市场营销学)

medicaldiagnosis

(医学诊断)meteorology(气象学)

militaryscience

(军事科学)nuclearmaterialsafeguards

(核材料安全管理)ophthalmology(眼科学)

pharmaceutics(制药学)physics

(物理学)

politicalscience

(政治学)psychology(心理学)

psychophysics(心理物理学)qualitycontrol

(质量控制)

religiousstudies

(宗教研究)sociology

(社会学)

surveysampling

(调查抽样)taxonomy(分类学)

weathermodification

(气象改善)统计无处不在见教材P3:统计在工商管理中的应用。

统计学的分支理论统计学

—把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的角度,对统计方法加以推导论证。应用统计学—从所研究的领域或专门问题出发,视研究对象的性质采用适当的统计方法,解决所需研究的问题。应用统计学通常具有边缘交叉学科的性质第1章导论1.1

统计及其应用领域1.2统计数据的类型1.3统计中的几个基本概念1.1统计及其应用领域1.1.1什么是统计学1.1.2统计的应用领域“数据!数据!数据!”他不耐烦地喊道,“我不能做无米之炊!”

—Sherlock·福尔摩斯数据是做统计分析的基础1.2.1分类数据、顺序数据、数值型数据1.2.2观测数据和实验数据1.2.3截面数据和时间序列数据1.2统计数据的类型统计数据的分类统计数据的分类按计量尺度分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据实验的数据统计数据的分类

(按计量尺度分)分类数据(categoricaldata)

(定类尺度/名义尺度)定义:只能归于某一类别的数据,可用文字来表述或用数字代码表示(教材P5描述有误)特征:各类别无顺序,比率和差运算均无意义例如,性别(男、女)、民族、职业

顺序数据(rankdata)

(定序尺度/序数尺度)定义:只能归于某一有序类别的数据,可用文字来表述或数字代码表示特征:数据有顺序,但比率和差运算均无意义例如,质量等级(一等品、二等品、三等品、次品等),收入级别(高、中、低)。统计数据的分类

(按计量尺度分)数值型数据(metricdata)

(比率尺度)定义:按数字尺度测量的观察值,特点:数据存在自然顺序,且比率和差运算(加减乘除)均有意义,0值代表“没有”或”不存在“例如:身高为175cm、168cm、183cm间距数据(intervaldata)

(定距尺度)定义:对现象类别或次序之间间距测度的数值型数据。特点:数据存在自然顺序,差运算有意义,比率运算无意义。0值只是尺度上的一个点,不代表”不存在“例如:温度间距数据与数值数据区别间距数据中“0”表示一个具体数值,不表示“没有”或“不存在”,定比尺度中“0”表示“没有”或“不存在”。间距数据

0℃

-

273.15℃-123.15℃26.85℃数值数据

0K

150K300K

定距尺度与定比尺度区别(续)

在实际应用中间距数据与数值型差别不大,往往不作区分。例如在某些统计软件中(SPSSStatistics软件),数据的计量尺度被分为3类(本教材也如此):分类(Nominal)顺序(Ordinal)数值型(Scale

)四种计量尺度的比较1、四种尺度所包含的信息量是依次递增的,级别由低到高。2、根据较高层次的计量尺度可以获得较低层次的计量尺度。3、不同的尺度数据对应着不同数据显示方法和分析方法。低高分类顺序间距数值型数据类型:例子分类数据顺序数据间距数据数值数据精确程度良好1980134公斤中国国籍:健康状况:出生年份:体重:练习P11:二练习题1.1(讲)统计数据的分类

(按收集方法分)观测的数据(observationaldata)

定义:在没有对事物人为控制的条件下,通过调查或观测而收集到的数据例如:2010年城镇居民消费支出和可支配收入数据有关社会经济现象的统计数据几乎都是观测数据实验的数据(experimentaldata)

定义:在实验中控制实验对象而收集到的数据例如:对一种新药疗效的实验,对一种新的农作物品种的实验等自然科学领域的数据大多数都为实验数据统计数据的分类

(按时间状况分)截面数据(cross-sectionaldata)

定义:多个事物在相同或近似相同的时间点上收集的数据描述不同事物在某一时刻的变化情况举例:2005年我国各省份的国内生产总值数据

2006年各地区城镇居民家庭人均全年可支配收入和消费支出数据(见下表)统计数据的分类

(按时间状况分)时间序列数据(timeseriesdata)

定义:同一个事物在不同时期或时间点上收集到的数据描述事物随时间变化的情况举例:2000年至2005年国内生产总值数据

1990~2006年中国居民总量消费支出数据。统计数据的分类

(按时间状况分)面板数据(PanelData)定义:多个事物在某不同时期或时间点上进行测量得到的数据兼有时间序列和截面数据举例:2005-2006年各地区城镇居民家庭人均全年消费支出

1.3统计中的几个基本概念1.3.1总体和样本1.3.2参数和统计量1.3.3变量总体总体(population)定义:所研究的全部个体(数据)的集合,其中的每一个个体也称为元素举例:(1)要研究台湾选民对当前两位候选领导人马英九和蔡英文的支持度。则总体是台湾所有选民对两人的支持情况。(2)要检测某批产品的合格率,则该批次所有产品就是总体。总体分类总体(population)分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的区分有限和无限总体主要是为了判别在抽样中每次抽取是否独立,对无限总体,每次抽取一个单位并不影响下一次的抽样结果,而对有限总体,每次抽取是不独立的。(但当总体数量较大时,常将有限总体中的抽样也看作是独立的。)总体通常可以看作是一个随机变量,统计推断中通常是针对无限总体。样本样本(sample)定义:从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量或样本量(samplesize)举例:(1)从台湾所有选民中抽取出500位进行民意调查,则这500位选民是一个样本(2)从所有要检测批次的产品中抽出100件进行检测,则这100件产品就是一个样本。参数参数(parameter)定义:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值总体参数通常用希腊字母表示所关心的参数主要有总体均值()、标准差()、总体比例()等总体数据常常是未知的,总体参数也是未知的,因此需要根据样本来估计总体参数。统计量统计量(statistic)定义:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等基本样本统计量样本统计量通常用小写英文字母来表示还有一些为统计分析而构造的统计量:z统计量、t统计量、x2统计量、F统计量等。变量

(variable)

变量—说明现象某种特征的概念例如:商品销售额、受教育程度、产品的质量等级等特点:从一次观察到下一次观察结果会呈现出差别或变化变量的具体表现称为变量值,即数据变量

(基本分类)

分类变量(categoricalvariable)

:用于表示事物类别的名称如:性别、行业等变量顺序变量(rankvariable):用于表示事物有序类别的名称如:产品等级、受教育程度变量数值型变量(metricv

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论