版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学教师:郑奕君1你想过下面的问题吗?2当你买了一台电视时,被告知三年内可以免费保修。你想过厂家凭什么这样说吗?说多了,厂家会损失;说少了,会失去竞争,也是损失。到底这个保修期是怎样决定的呢?(和正态分布有关)在同一年级中,同样统计学的课程可能由一些不同教师讲授。教师讲课方式当然不一样,考试题目也不一定相同。那么如何比较不同班级的统计学成绩呢?(方差分析)大学排名是一个非常敏感的问题。不同的机构得出不同的结果;各自都说自己是客观、公正和有道理的。到底如何理解这些不同的结果呢?一个从来没有研究过红楼梦的统计学家如何根据比较写作习惯得出红楼梦从哪一段开始就不是曹雪芹的手笔了呢?……3你如何理解下面说法?4“某学校排名第一”“某县是贫困县”“某国的综合竞争力排名第43位”“该国家属于发展中国家”“该药品疗效99%”“该国贫富差距大”“这个县收入比那个县高”“消费价格指数为120%”“他的血压已经正常了”最常见于媒体的问题是在公布抽样调查结果时,不提样本量和调查对象(或如何得到样本的)。比如,一项广告可以说,“有三分之二人选择某产品”。人们往往理解为在广大消费者中,有三分之二的人选择该产品。但是,也不是没有下面的可能:即该广告数据仅仅来源于一个三口之家,其中有两个家庭成员使用该产品。5你相信统计结果吗?数据可以有误或做假统计方法(有意或无意)使用不当可以误导。有低级误导和高级误导。《统计陷阱》(上海财经大学出版社)《统计与真理》6为什么要学习统计7统计学学科地位简介统计名言统计能为我们做什么——案例讲解统计名言8When
you
analyze
any
topic,you
are
involved
in
statistics.——谢邦昌终有一日,统计的思维方法将会如读和写一样成为效率公民的必备能力。—---H.G.
wells若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。----南丁格尔不明于数欲举大事,如舟之无楫而欲行于大海也。——管子没有统计,其他学科可以存在,但是很渺小医学若无统计,就不是科学有三种谎言:谎言、糟糕透顶的谎言和统计资料……9统计能做些什么?10案例1 :啤酒与尿布的故事!案例2 :《红楼梦》出自谁的手笔?案例3: 撑死的人比饿死的人多?案例1:啤酒与尿布的故事11全球最大的零售商沃尔玛(
Walmart
)通过对顾客购物的数据分析后发现,很多周
末购买尿布的顾客也同时购买啤酒。经过深
入研究后发现,美国家庭买尿布的多是爸爸。爸爸们下班后要到超市买尿布,同时要“顺手牵羊”带走啤酒,好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆
放得很近,从而双双促进了尿布和啤酒的销
量。这个故事被公认是数据分析的经典范例。案例2:《红楼梦》作者考证12自从胡适作《红楼梦考证》以来,都认为曹雪芹作前80回,后40回为高鹗所续。然而这种看法一直饱受争议。1987年,复旦大学李贤平教授巧妙运用统计方法来判断《红楼梦》的作者。一般认为,每个人使用某些词的习惯是特有的。于是李教授用陈大康先生对每个回目所用的47个虚字(之,其,或,亦……,呀,吗,咧,罢……;可,便,就,……等)出现的次数(频率),作为《红楼梦》各个回目的数字标志,并以120个回目作为120个样本,使用统计分析方法,看看哪些回目出自同一人的手笔。最后李教授得出了许多新结果:前80回与后40回之间有交叉。前80回是曹雪芹据《石头记》写成,中
间插入《风月宝鉴》,还有一些别的增加成分。后40回是曹雪芹亲友将曹雪芹的草稿整理而成,宝黛故事为一人所写,贾府衰败情景当为另一人所写。等等。13案例3:撑死的人比饿死的人多!14据统计,肥胖并发脑血栓和心衰的发病率比正常体重高1倍,患冠心病2-5倍,高血压发病率多2-6倍,糖尿病者高4倍。美国生命保险协会的统计调查结果显示,超重25%和35%的肥胖症者的死亡率比正常人高28%和50%。表明肥胖程度和死亡率呈正相关,美国每年因肥胖患有冠心病和高血压、高血脂、糖尿病而死亡的人数大约有30万人。如何按照各种不同环境估计某商店的顾客人数如何按照各种指标评价雇员如何把地区(市县镇等)按照各种指标分类如何确定一个产品的可靠性如何进行偏差较少的民意调查如何根据一些财务数据发现漏税的嫌疑单位……15第一章17统计学与统计数据第一节 统计学的基本问题第二节统计学的分科第三节 统计学的基本概念第四节统计数据的来源与质量第一节 统计学的基本问题18一、统计的含义二、统计学的研究对象、研究方法、流程三、统计学的发展历史一、统计、统计学、统计规律统计的3种不同含义:1、统计工作——搜集数据的活动2、统计数据——对现象计量的结果3、统计学统计学“统计学是收集、分析、表述和解释数据的艺术与科学
”(摘自不列颠百科全书)19三种含义之间的关系统计工作与统计数据是工作与结果的关系统计工作、统计数据与统计学是实践与理论的关系20二、统计学的研究对象、流程、方法收集数据整理数据分析数据解释数据统计研究的目的(对象)21探索随机现象(数据)的内在规律—统计规律统计研究的过程例:统计数据的内在规律(一些例子)正常条件下新生婴儿的性别比为107:100投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/63.
农作物的产量与施肥量之间存在相关关系从大量实验(观察)数据中利用统计方法探索内在数量规律22统计研究方法统计方法描述统计推断统计参数估计假设检验23中国统计思想的源流与特点在3000多年前,《周易·系辞上》:方以类聚,物以群分《周易·系辞下》:上古结绳而治《周易·贲》:观乎天文,以察时变;观乎人文,以化成天下。《尚书·虞夏书》:关石和钧……中国古代统计思想的特点:从属性、与调查思想会计思想的不可分割性、与经济社会问题的阐述分析结合性24三、统计学发展历史25一般认为,统计学产生于17世纪中叶统计学的发展过程基本上沿着两条主线展开以“政治算术学派”为开端形成和发展起来的、以社会经济问题为主要研究对象的社会经济统计以概率论的研究为开端、并以概率论为基础形成和发展起来的、以方法和应用研究为主的数理统计今天,社会经济统计和数理统计仍然在以各自不同的方式发展着4.演变过程古典统计学:17世纪中叶~18世纪中叶国势学派 政治算术学派近代统计学:18世纪末~19世纪末数理统计学派 社会统计学派现代统计学:20世纪中叶~至今频率学派 贝叶斯学派26古典统计学之国势学派27奠基人——海门尔.康令
(H.Conring
)(Gottfried代表人——阿亨.瓦尔
Achenwall)在《近代欧洲各国国势学论》提出“统计学”有统计学之名,无统计学之实古典统计学之政治算术学派28创始人:威廉.配弟(William
Patty)代表作:《政治算术》——就是用数字和统计学方法“和只用比较级和最高级的词语以及单纯作思维的论证相反,我却采用了这样的方法(作为我很久以来就想建立的政治算术的一个范例)即用数字、重量、和尺度的词语来表述我自己想说的问题”有统计学之实,无统计学之名近代统计学——凯特勒时代29代表人物:凯特勒
(Adolphe
Quetelet)古典统计学的集大成者,近代统计学的先驱者。贡献:把概率论、误差法则、正态分布引进统计
学,用大数定律研究规律,丰富了统计方法体系。平均人理论:“我这里所研究的人,他在社会中的存在就像物体的重心,亦即那些社会因素围绕着波动的平均数”现代统计学30频率学派贝叶斯学派第二节:统计学的分科描述统计推断统计统计学的分科理论统计应用统计31一、 按内容分:32描述统计学(descriptive
statistics)——搜集、演示和描述样本数据推断统计学(inferential
statistics)——运用样本的描述性数据去推断总体数量特征、数量关系的方法描述统计内容搜集数据整理数据描述数据目的描述数据特征找出数据的基本规律025¥50Q1
Q2x
=
30Q3
Q4s2
=
10533描述统计34数据搜集 整理 描述
显示告类型人数(人)比例频率(%电视1120.56056.0网络510.25525.5杂志90.0454.5报纸100.0505.0路牌20.0101.0宣传页160.0808.0电冰箱消费者对广告宣传途径的效果评价?您觉得哪种类型的广告宣传效果最好?(仅选一项)1.电视
2.网络
3.杂志
4.报纸
5.路牌
6.宣传页广
)开支类型金额医生个人收入55.6非医生人员个人收15.7办公费用10.9医疗供应4治疗适当保险金3.5雇用医生2.3医疗设备1.5其他6.536在《财富》杂志一篇题为“在医生诊所中真正发生了什
么事”中,展示了患者用于支付各类诊所的手术和健康保健设备的费用被如何分解。在研究中,医生收到的现金中每
100美元有下列八种类型的开支被分离出来,下表现实100美元是怎样被支配的:37推断统计1.
内容参数估计假设检验目的对总体特征作出推断样本总体38描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析
等)总体数据样本数据统计学探索现象数量规律性的过程39二、按研究侧重点分理论统计学——指统计学的数学原理,它主要研究统计学的一般理论和统计方法的数学基础(包括概率论在内)应用统计学——研究如何应用统计方法去解决实际问题。如:生物统计、经济统计、社会统计、人口统计、农业统计等等40统计学管理理论 计量参数估计假…设.检验描述统计学推断统计学理论统计学应用统计学统计工具41总体结构图统计学与其他学科的关系42统计学可以用到几乎所有的学科领域统计学可以帮助其他学科探索学科内在的数量规律性统计学不能解决各学科领域的所有问题对统计分析结果的解释需要各学科领域的专业人员应用统计的领域43actuarial
work
(精算)animal
science(动物学)archaeology
(考古学)crystallography
(晶体学)dentistry
(牙医学)agriculture
(农业)anthropology
(人类学)auditing
(审计学)demography
(人口统计学)ecology
(生态学)econometrics
(经济计量学)
education
(教育学)election
forecasting
and
projection
(选举预测和策划)epidemiology
(流行病学)engineering
(工程)finance
(金融)fisheries
research
(水产渔业研究)gambling
(赌博)geography
(地理学)historical
research
(历史研究)genetics
(遗传学)geology
(地质学)human
genetics
(人类遗传学)应用统计的领域(续)44hydrology
(水文学)
Industry
(工业)linguistics
(语言学)
literature
(文学)manpower
planning
(劳动力计划)management
science
(管理科学)marketing
(市场营销学)
medical
diagnosis
(医学诊断)meteorology
(气象学)
military
science
(军事科学)nuclear
material
safeguards
(核材料安全管理)pharmaceutics
(制药学)political
science
(政治学)ophthalmology
(眼科学)physics
(物理学)psychology
(心理学)quality
control
(质量控制)sociology
(社会学)taxonomy(分类学)psychophysics
(心理物理学)religious
studies
(宗教研究)survey
sampling
(调查抽样)weather
modification
(气象改善)历史上著名的统计学家45Jacob
Bernoulli
(伯努利)(1654-1705)Edmond
Halley
(哈雷)(1656-1742)De
Moivre
(棣美佛)(1667-1754)Thomas
Bayes
(贝叶斯)(1702-1761)Leonhard
Euler
(欧拉)(1707-1783)Pierre
Simon
Laplace
(拉普拉斯)(1749-1827)Adrien
Marie
Legendre(勒让德)(1752-1833)Thomas
Robert
Malthus(马尔萨斯)(1766-1834)Friedrich
Gauss
(高斯)(1777-1855)Johann
Gregor
Mendel(孟德尔)(1822-1884)Karl
Pearson
(皮尔森)(1857-1936)Ronald
Aylmer
Fisher
(费歇)(1890-1962)Jerzy
Neyman
(内曼)(1894-1981)Egon
Sharpe
Pearson(皮尔森)(1895-1980)William
Feller
(费勒)(1906-1970)历史上著名的统计学家46Jacob
Bernoulli (伯努利)(1654-1705)Edmond
Halley
(哈雷)(1656-1742)De
Moivre
(棣美佛)(1667-1754)Thomas
Bayes(贝叶斯)(1702-1761)Leonhard
Euler
(欧拉)(1707-1783)Pierre
Simon
Laplace(拉普拉斯)(1749-1827)Adrien
Marie
Legendre(勒让德)(1752-1833)Thomas
Robert
Malthus(马尔萨斯)(1766-1834)Friedrich
Gauss(高斯)(1777-1855)Johann
Gregor
Mendel(孟德尔)(1822-1884)Karl
Pearson
(皮尔森)(1857-1936)Ronald
Aylmer
Fisher
(费歇)(1890-1962)Jerzy
Neyman
(内曼)(1894-1981)Egon
Sharpe
Pearson(皮尔森)(1895-1980)William
Feller
(费勒)(1906-1970)第三节 统计学的基本概念47总体和样本指标和标志参数和统计量1.
总体、总体单位和样本48总体:总体是包含所研究的全部个体的集合。总体三大特征:①同质性②大量性③差异性(“君子和而不同,小人同而不和”)总体分类:①有限总体:指总体单位数有限而可以计数的总体②无限总体:指总体单位数无限不可以计数的总体总体单位:构成统计总体的各个单位。总体和总体单位关系:对于同一研究目的,二者是包含关系统计研究目的改变,总体、总体单位可以相互转化。例:新生入学体检总体:全体新生总体单位:每一位新生样本:样本是从总体中抽取的一部分个体的集合。 (总体的子集)49总体样本随机或非随机抽取总体单位50总体、总体单位、样本关系2.
指标和标志51标志:含义:用来表示总体单位特征的名称。作用:标签,将各总体单位区分开来。例:研究本班的情况,姓名,成绩,性别…把每个个体区分开来。标志值:标志的具体表现形式。例:中华人民共和国人口普查总体:具有中华人民共和国国籍的所有公民总体单位:每一位公民52标志名称国籍:姓名:性别:民族:婚姻状况:家庭成员数:年龄:身高:体重:收入:标志值中国(不变标志)张三男汉已婚4人(离散变量)50
(连续变量)
172cm72.5kg2000元/月姓
性
年
籍 身高 体重 学院
班名
别
龄
贯
cm
kg
级张
男三19广东1.73
64信息李
女四20四川1.63
51信息王
女五17湖北1.61
47信息标志标志值总体单位53分类按标志表现的异同品质标志–
例:产品品名、商品类别、籍贯、性别等按性质分数量标志–例:商品价格、年龄、消费者的收入等标志不变标志54可变标志注:不变标志把总体单位联系在一起,可变标志成就了统计研究的必要变量:即可变标志,用于描述总体单位所具有的特征或特性。有时也指这些特征或特性的值汇总或加工后的量。(指标名称)55指标含义:用来表示总体数量特征的量,一般更习惯 称指标为变量,由指标名称和指标值构成。56例:指标名称指标值工业企业总数:10000000工业企业职工数:3亿人工业总产值:5千亿平均工资:7000元/年人总体单位:每一个工业企业注:指标可以是指标名称也可以是指标名称+指标值特点: 可量性、综合性。指标变量)分类定量指标定性指标分类型指标(名义变量)–
例:性别、颜色等顺序型指标(有序变量)–
例:产品等级、学历等离散变量--例:课时,页数,家庭成员数连续变量--
例:重量,利润等算术运算对于定性指标无意义,对于定量指标运算有意义57总量指标(绝对数)相对指标(相对数)指标构成形式更多分类58平均指标(平均数)实物指标计量单位价值指标时期指标时间性质不同时点指标注:各种相互联系的指标所构成的整体即指标体系还可分为:质量指标:说明总体质量状况数量指标:说明总体总量状况,也叫总量指标。考虑:一个完整的统计指标应包括什么?59指标和标志的关系60联系:指标值由标志值汇总加工而得到;两者的划分不绝对,可以互相转化区别:两者说明的对象不同;两者表现形式不同3.
参数和统计量61参数:概括整个总体所有数据的一个数值。(总体的某种特征值)–例:总体平均数、总体比例,总体方差等统计量:概括整个样本所有数据的一个数值。(样本的某种特征值)-例:样本平均值、样本比例,样本方差等参数是固定的,统计量是变化的每一个参数,有一个相应的样本统计量总体参数样本62统计量判断是非63推断性统计是对试验结果得出的数据的研究和描述描述性统计是我们能用一个样本的研究来对该样本来自的总体作出推测或估计统计量是从总体的某些特征测量值计算出来参数是从样本某些特征测量值计算出来的小练习(1)64
某药品制造商感兴趣的是用该公司开发的某种新药能控制高血压人群血压的比例。进行了一项
包含5000个高血压病人个体的研究。他发现用这
种药后80%的个体,他们的高血压能够被控制。假定这5000个个体在高血压人群中具有代表性的话,回答下列问题:1、总体是什么?2、样本是什么?3、识别所关心的参数4、识别样本统计量并给出它的值5、我们知道这个参数的值么?第四节 统计数据的来源与质量一、统计数据的间接来源二、统计数据的直接来源三、统计数据的质量一、统计数据的间接来源1.公开出版物:《中国统计年鉴》、《中国统计摘要》、《中国社会统计年鉴》、《中国工业经济统计年鉴》、《中国农村统计年鉴》、《中国人口统计年鉴》、《中国市场统计年鉴》、《世界经济年鉴》、《国外经济统计资料》、《世界发展报告》……Internet2.
网络中国统计66年鉴2001中国人口统计年
鉴中国市场统
计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社二、统计数据的直接来源统计调查方式普查抽
样调查67统计
报表重点
调查典型调查普查(概念要点)
为特定目的专门组织的非经常性全面调查通常是一次性或周期性的一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄总体68抽样调查
(概念要点)总体
随机样本
4.
具有经济性、时效性强、适应面广、
准确性高等特点从总体中随机抽取一部分单位(样本)进行调查目的是推断总体的未知数字特征最常用的调查方式69统计报表——了解(概念要点)1.统计调查方式之一2.过去曾经是我国主要的数据收集方式3.按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据4.有各种各样的类型70重点调查和典型调查——了解(概念要点)从调查对象的全部单位中选择少数典型单位进行调查目的是描述和揭示事物的本质特征和规律调查结果不能用于推断总体
71
重点调查从调查对象的全部单位中选择少数重点单位进行调查调查结果不能用于推断总体典型调查调查方法询问调查访问
调查数据的搜集方法观察实验电话调查邮寄调
查观察电脑辅
助座谈会个别深访实验72CATI应用领域:品牌知名度研究、产品渗透率研究、品牌市场占有率研究、产品广告到达率研究、广告投放后的效果跟踪研究、消费习惯研究、消费者生活形态研究、顾客满意度调查、服务质量跟踪调查、产品(担保)登记、家庭用品测试及选举民意测验以及健康问题调查等。优点:更高的访问覆盖访问工
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沈阳理工大学《化工设计基础》2023-2024学年第一学期期末试卷
- 沈阳理工大学《电路》2022-2023学年期末试卷
- 沈阳理工大学《产品调研方法》2022-2023学年第一学期期末试卷
- 归还租赁押金合同范本
- 贵州总承包合同条款
- 合肥研究院研究生公寓租住协议书
- 辅警体测标准
- 2024空气净化器设备租赁合同模板
- 2024服装加盟合同范本
- 沈阳理工大学《EDA技术与VHD语言》2022-2023学年期末试卷
- 诫子书综合测试题及答案
- 重庆绿地系统规划
- 小升初数学衔接讲座
- 提高自我保护意识主题班会
- 医院门诊信息管理系统可行性研究报告
- 《银屑病临床表现》课件
- 智慧后勤系统市场分析报告
- 承包人实施计划
- “山东通”协同办公平台 应用系统接入规范-地方标准
- 技术分红协议合同
- 仪表现场检修风险评估报告
评论
0/150
提交评论