版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第1章 数据与统计学2009年2月10日,国家统计局发布的最新统计显示,今年1月份我国居民消费价格总水平(CPI)同比上涨1.0%,生产者物价指数(PPI)同比下降3.3%,创82个月以来月度新低。1.1 统计数据与统计学第一章 数据与统计学 1.2 统计学的产生与发展1.4 统计数据的来源1.5 统计数据的质量1.6 统计学的基本概念1.3 统计学的分科1.1 统计数据与统计学统计资料统计学统计活动 统计学的概念1.【 统计的涵义 】三种政府统计:国家统计局、职能部门企事业单位统计:工厂统计机构等经营统计:调查咨询公司、统计事务所等其它:如研究性统计机构等 统计的涵义之二统计活动即统计实践活
2、动,是对统计数据进行搜集、整理和分析的全过程 统计学 1869年的第七次国际统计会议上,在讨论关于统计学的定义时,据说竟有180余种之多。“收集和分析数据的科学和艺术”。不列颠百科全书最接近科学的定义:统计学是一门关于数据资料的收集、整理、分析和推断的科学。 复旦大学统计的涵义之三三种含义之间的关系统计数据与统计活动是统计成果与过程的关系,统计活动与统计学则是统计实践与理论的关系统计规律 (一些例子)正常条件下新生婴儿的男女性别比为107:100投掷一枚质地均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6农作物的产量与施肥量之间存在相关关系统计学的故事 发生在
3、英国,二战前期德国势头很猛,英国从敦刻尔克撤回到本岛,德国每天不定期的对英国狂轰乱炸,后来英国空军发展起来,双方空战不断。 为了能够提高飞机的防护能力,英国的飞机设计师们决定给飞机增加护甲,但是设计师们并不清楚应该在什么地方增加护甲,于是请来了统计学家,统计学家将每架中弹之后仍然安全返航的飞机的中弹部位描绘在一张图上,然后将所有中弹飞机的图都叠放在一起,这样就形成了浓密不同的弹孔分布。工作完成了,然后统计学家很牛的说没有弹孔的地方就是应该增加护甲的地方,因为这个部位中弹的飞机都没能幸免于难。 迷信和心理作用 心理作用会对一个人身体的生物功能产生影响吗?很遗憾,对这个问题还没有实验证据。但是已经
4、不断有研究报告,涉及到支持所谓“心于物质之上”的谈论。最近有一个研究报告,圣地亚哥的加利福尼亚大学的菲力普斯(D.Phillips)花了25年的时间,对老年美籍华裔妇女在一个重要的节日,中秋节前后的死亡率进行的调查,他发现节日前一周死亡率比通常低35.1%,节日后一周死亡率比通常高出34.6%。看起来,人具有一种能力来延续死亡直到经历某个吉祥的时刻。 这些研究结果是否显示一些人能够运用他们的能力延缓死亡日期,直到某个重要的事件发生。如生日、节日或纪念日与这个类似的一个著名例子是有关托马斯杰弗逊(Thomas Jefferson)的报道,据说他延长了他的死亡直到1826年的7月4日刚好独立宣言签
5、字后的第50年,他仅仅问了医生:“今天是7月4日吗?”就去世了。统计学的研究对象 社会经济统计学的研究对象是社会经济现象总体的数量特征和数量关系。 其研究对象的特点是: 社会性、总体性、变异性统计在工商管理中的一些的应用企业发展战略产品质量管理市场研究财务分析经济预测人力资源管理中美纯水有限公司欲为其新推出的一种纯水产品起一个合适的名字,为此专门委托了当地的策划咨询公司,取了一个名字“波澜”。一个好的名字至少应该满足两个条件:(1)会使消费者联想到正确的产品“纯水”;(2)会使消费者产生与正确产品密切相关的联想,如“纯净”、“清爽”等。 后来中美纯水有限公司委托调查统计研究所,进行了一次全面的
6、市场研究,在调查中还包括简单的名称测试。 起名为“ 波澜”恰当吗?调查的代码和含义如下:代码含义代码含义代码含义Name1玉泉Product1雪糕Feel1清爽Name2雪源Product2纯水Feel2甘甜Name3春溪Product3碳酸饮料Feel3欢快Name4期望Product4果汁饮料Feel4纯净Name5波澜Product5保健食品Feel5安闲Name6天山绿Product6空调Feel6个性Name7中美纯Product7洗衣机Feel7兴奋Name8雪浪花Product8毛毯Feel8高档2021对应分析图Dimension l 由直观图可以看出,“波澜”(Name5)与
7、“洗衣机”(Product7)产品相联系,引起的感觉是“兴奋”,因此“波澜”不是合适的纯净水品牌名称。中美纯水公司的产品是“纯水”(Product2),他们如果想要使该名称给人们一种“纯净”(Feel4)的感觉,那么“中美纯”(Name7)将是最好的商品名称。如果想要使该名称给人们一种“清爽”(Feel1)的感觉,那么“玉泉”(Name1)将是最好的商品名称。中美纯水公司接受了调查统计研究所的建议,没有用“波澜”这个名称,而用了“中美纯”作为品牌的名称。实践证明,它的确是一个成功的品牌名称。(一)古典统计学时期(17C末18C末)国势学派(也称记述学派):创始人和代表人物,德国康令(H.Cor
8、ing,1606-1681)和阿亨瓦尔(G.Achenwall,1719-1772)。显著事项的记录1.命名“统计学”2.“统计数字资料”、“数字对比”等术语3.运用对比的方法来研究各国的实力与强弱政治算术学派:创始人和代表人物:英国威廉配第政治算术政治经济学之父,某种意义上也是统计学的创始人!1.提出了大量观察法、典型调查、定期调查原则2.广泛运用分类、制表及各种指标来浓缩与显现数量资料的信息3.有意识地运用可度量的方法,力求依靠数字来解释和说明社会经济生活英国格朗特(J.Graunt,1620-1670)关于死亡表的自然和政治观察(三)现代统计学时期(19C末现在)小样本思想、t分布理论、
9、卡方分布、方差分析、假设检验、估计理论、误差理论、决策理论、多元统计、时间序列、面板数据等方法的出现统计方法的不断创新医学统计学、天文统计学、传媒统计学、管理统计学、金融统计学、国民经济统计学、社会统计学、教育统计学、心理统计学、生物统计学等学科的出现统计应用面的的不断拓展第一阶段是统计学的初创阶段 第二阶段是统计推断方法体系基本确定的阶段 第三阶段是统计方法与应用研究全面发展的阶段 1.3 统计学的分科描述统计(descriptive statistics)研究数据收集、整理和描述的统计学分支 内容搜集数据整理数据展示数据描述性分析 目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q
10、4¥x = 30 s2 = 105推断统计 (inferential statistics)研究如何利用样本数据来推断总体特征的统计学分支内容参数估计假设检验目的对总体特征作出推断样本总体例1.1 一个随机样本包括200名顾客,他们同意对某一新产品提出意见。意见百分比(%)十分喜欢并购买该产品十分喜欢但可能不会购买该产品不喜欢该产品543214合计100200名顾客对新产品的意见年龄(岁)样本年龄组中的人数十分喜欢并购买该产品的人数人数(人)比重(%)人数(人)占各年龄组人数的比重(%)1519105110.020292010420.0303972363852.7404976386281.65
11、0及以上2211313.6合计20010010854.0各年龄组中喜欢并购买该产品的人数分布问题:如何知道该新灯丝的平均使用寿命?回答:需进行统计推断总体:所有用新灯丝生产的灯泡样本:200个随机抽检的灯泡数据收集:每个被检灯泡(样本)照明的小时数 例1.2 高亮度灯泡平均使用寿命 某灯泡厂使用一种新灯丝生产灯泡以延长灯泡使用寿命。 如果该200个被检灯泡的平均照明时间为76小时,则可推断该新灯丝所生产灯泡的平均寿命为76小时,或者给出区间。统计推断程序:1.4 统计数据的来源一、直接获取数据1、普查2、抽样调查二、间接数据的获取P91、统计年鉴2、统计局网站补充:统计数据的分类统计数据的分类
12、按计量层次分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据试验的数据统计数据的分类 (按计量尺度分)分类数据(categorical data) 对事物进行分类的结果数据表现为类别,用文字来表述例如,人口按性别分为男、女两类 顺序数据(rank data) 对事物类别顺序的测度数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等 数值型数据(metric data) 对事物的精确测度结果表现为具体的数值例如:身高为175cm、168cm、183cm统计数据的分类(按收集方法分)观测的数据(observational data) 通过调查或观测
13、而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据试验的数据(experimental data) 在试验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据统计数据的分类(按时间状况分)截面数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2012年我国各地区的国内生产总值数据时间序列数据(time series data) 在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2012年国内生产总值数
14、据1.5统计数据的质量调查误差的种类:由于人的主观故意或失误而产生的误差,理论上它可以用某种方法加以消除登记误差代表性误差由样本数值推断总体数值时所产生的误差,它不可以消除,但可以加以控制,只存在于抽样调查中 (随机误差)调查误差调查结果所得的统计数据与调查总体实际数量表现的差别和不一致从全部学生中随机抽取20人组成样本并计算平均体重:样本一:52.35样本二:50.26样本三:53.19真值: 51.18代表性误差误差的控制抽样误差可计算和控制非抽样误差的控制调查员的挑选调查员的培训督导员的调查专业水平调查过程控制调查结果进行检验、评估现场调查人员进行奖惩的制度统计数据的质量要求1. 精 度
15、:最低的抽样误差或随机误差2. 准确性:最小的非抽样误差或偏差3. 关联性:满足用户决策、管理和研究的需要4. 及时性:在最短的时间里取得并公布数据5. 一致性:保持时间序列的可比性6. 最低成本:以最经济的方式取得数据1.6统计学的基本概念一、 总体和样本总体与个体样本总体与样本的关系个体总体统计研究的客观对象的全体,是具有某种共同性质的事物所组成的集合体(也称为母体或调查对象)构成统计总体的个别事物称为个体(也称总体单位或调查单位)1.总体和个体的概念具有大量性、同质性、差异性等特征* 总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。1、总体容量随着个体数的增减可变
16、大变小。2、随着研究目的的不同,总体中个体可发生变化。3、随着研究范围的变化,总体与个体的角色可以变化。2.总体与个体的关系总体、总体单位总体、总体单位总体或总体单位的区分不是固定的,在一定条件下可以相互转化。 所谓样本就是从总体中抽取一部分个体所组成的集合,也称子样。(二)样本样本容量大于等于30时,称为大样本样本容量小于30时,称为小样本*1.概念:我们在调查时,一般应选择大样本一位社会学家想知道,当地成年职业女性对政府的托儿补助有什么意见。1.她从当地的一家企业拿到520个会员的名单,从这520个名单中随机抽取了100人,寄问卷给她们,但只回收了42份问卷。2.她从统计局拿到一份当地人口
17、的名单,选择了其中100名成年女性,寄问卷给她们,但只回收了42份问卷。上述调查中,总体和样本分别是什么? 1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。2.样本是用来推断总体的。3.总体和样本的角色是可以改变的。4.总体和样本都具有大量性、同质性和差异性三个特征。*2.样本与总体的关系二、 标志和变量(一)标志 1.标志的概念 所谓标志,就是用以描述个体所具有的特征的名称。标志在每个个体上的具体表现结果称为标志表现。 2.标志的种类* (1)按结果的表示方式不同,可以分为品质标志和数量标志品质标志数量标志说明总体单位的属性特征,在原始状态下无法量化 ,结果只能用
18、文字表示。说明总体单位的数量特征,在原始状态下能够量化,结果用数值表示。数量标志又被叫作变量统计研究是从登记标志开始,并通过对标志的综合来反映总体的数量特征.标志(个体)综合指标(总体)标志性别年龄民族宗教信仰党派身高体重男汉族佛教无党派43岁182cm75公斤标志值品质标志文字表述数量标志数据表述(二)变量1、变量的含义 狭义上看,变量就是可变的数量标志。 广义上看,变量是可变的数量标志和可变的品质标志。 注:此时的品质标志必须经过数量化 2、变量的分类确定性变量 随机变量 连续型变量离散型变量如何描述(规模、集中趋势等)如何推断(估计、检验等)度量取得、重叠组限、连续分布、概率密度函数计数取得、间断或连续组限、离散分布(二项分布、泊松分布等)定性变量 定量变量 反映定性数据反映定量数据统计使人豁达1、良好的统计训练使人宏观意识比较强 总体和总量是统计学中最基本的概念,虽然统计调查和处理都要从个体入手,但其最终目的是为了由此去对现象的总体做出评价。统计总是把着眼点放在宏观大势的把握上,对个体数据如何处理,也取决于怎样科学地得到总体的认识。久而久之,统计的训练使人宏观意识得到强化,遇到问题习惯将之放在时空的大背景中去考虑。古人云:会当凌绝顶,一览众山小。统计训练
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年高中语文第八单元人在都市第16课高妈训练含解析新人教版选修中国小说欣赏
- 2024-2025学年高中历史第五单元中国近现代社会生活的变迁第14课物质生活与习俗的变迁习题含解析新人教版必修2
- 保留意见的审计报告范文
- 2025年四川从业资格证货运考试试题及答案
- 2025年阿拉善盟货运从业资格证模拟考试题库
- 2025年河北货运从业资格证考试科目内容
- 2025年山东货运从业资格证考试试卷及答案
- 2025代购代销合同范本
- 中国全透明防护屏风项目投资可行性研究报告
- 中国防爆油加热器项目投资可行性研究报告
- 2024版招投标合同范本
- 汉字与对外汉语教学智慧树知到期末考试答案章节答案2024年西北师范大学
- 贵州省黔南州2023-2024学年度上学期期末质量监测八年级物理试卷
- 篮球智慧树知到期末考试答案章节答案2024年温州理工学院
- 统计与数据分析基础-形成性考核三(项目6-项目8阶段性测试权重25%)-国开-参考资料
- JB∕T 4058-2017 汽轮机清洁度
- 保险案件风险排查工作报告总结
- 三创赛获奖-非遗文化创新创业计划书
- 岗位竞聘课件(完美版)
- 《学校章程》制订工作会议纪要(六)
- 应急管理部宣传教育中心次招聘笔试真题2023
评论
0/150
提交评论