版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学基础
讲授者:李敬兰邮箱:orchidlee@统计学基础统计学基础基础知识*统计学基本问题*统计学研究对象和方法*统计学基本概念基础技能*统计调查*统计整理分析技能*描述统计*推断统计*社会经济统计模块一基础知识统计学基本问题统计学的研究对象和研究方法统计学基本概念统计学的起源
以我国为例:时间夏禹时代封建社会迄今领域人口统计户籍统计经济、社会、生态、医学个领域统计统计学的起源
以我国为例:时间夏禹时代封建社会迄今领域人口统计户籍统计经济、社会、生态、医学个领域统计统计理论的产生和发展统计含义=统计工作+统计资料+统计学统计学性质:
统计学本身是一门科学、一种工具,当与其它领取(经济、社会、医学等)结合后,便具有更强的生命力!
派系国势学派政治算术学派数学统计学派社会统计学派时间17世纪17世纪19世纪19世纪国别德国英国比利时德国代表人物康令&阿亨瓦尔约翰.格朗特
威廉.配第阿道夫.凯特勒恩格尔&梅尔应用领域国家各项事务
人口、军队、领土等各国综合
实力比较统计学结合概率论,形成数
理统计研究社会现象
人口与工业调查统计学的几个基本概念统计总体和总体单位小仔,醒醒,大鱼要出现啦~~~~~!总体单位单位单位单位单位单位单位单位单位单位单位单位总体单位单位单位@统计总体特征:大量性、差异性、同质性(例:许多大小不一的苹果)@统计总体分类:有限总体,例我国人口数量;无限总体,海洋里鱼的数量。@总体与单位的联系:可以相互转化(例:某校各班打瞌睡的人数的单位是班级,而某班打瞌睡的人数的总体也是班级)标志和变量
1)含义:说明总体单位特征或属性的名称(性别、年龄等)
2)分类:标志品质标志数量标志可变标志不变标志按标志值性质分按标志值是否变化分用文字表示用数量表示变量定性变量随机变量连续变量离散变量4)统计指标与标志统计指标标志
*区别:1)体现总体数量特征体现单位特征
如:某区国有企业总产值如:每个国有企业
2)必须可量未必都可量(如品质标志)*联系:1)总体单位的数量标志
2)两者可相互转换5)统计指标体系
汇总/分析统计指标的数值汇总间接计算员工年工资总额员工年平均工资统计指标A统计指标B统计指标C相互联系、相互补充:
例:每位员工年工资模块二基础技能
统计调查统计整理含义:收集被研究对象的各标志值的过程。要求:准确、及时、完整、系统。种类:方式:统计报表&普查&抽样调查&重点调查
&典型调查&综合运用各种调查方式步骤:确定调查目的、对象、项目、时间和期限;拟定调查表;确定实施计划。方法:观察&询问调查&实验&报告&网上调查调查问卷设计组织形式:统计报表&专门调查总体范围:全面调查&非全面调查调查时间是否连续:连续&非连续调查搜集资料方法:直接&凭证&采访&问卷调查调查时间周期长短:经常性&一次性调查范例重点:统计整理意义:科学整理统计调查所得资料,将其转化为反映总体的基本统计指标。
步骤:制作统计表和统计图统计汇总统计分组审核、订正调查资料设计整理方案制作统计表和统计图统计汇总统计分组审核、订正调查资料设计整理方案制作统计表和统计图统计汇总统计分组审核、订正调查资料设计整理方案4)数量分组中常用的概念:
*全距R(极差)=最大变量值-最小变量值*组限*闭口组:上限和下限都具备,如(5,6),(100,200);开口组:只有上限或下限,如“5以上”,“10以下”。
*组距d=*组中值=重叠式组限(50~60,60~70,70~80)衔接式组限(1-2,3-5,6-9)各组变量值“含上限不含下限)重叠式组限的组距d=上限-下线衔接式组限的组距=相邻组的下限-本组上限开口组的组距=相邻组的组距2上限+下限=下限+2组距=上限-2组距分配数列
1)概念:统计整理结果的一种表现形式。
2)要素:总体所分各组&各组所占有的总体单位数(次数/
频数)
3)分类:品质分配数列&变量分配数列
4)步骤:*排序:将原始资料按大小排序,以观其分布特点;*全距:确定变动范围和变动幅度;*组距:应是整数,最好是5或10的整数倍*组数=全距/组距*组限:变量相对集中,采用闭口式;变量相对分散,采用开口式;*编制变量分配数列
表1某零售企业集团30家连锁店营业额分析表总标题横栏标题按营业额分组(百万元)频数(家)频率(%)累计频数累计频率向上累计向下累计向上累计向下累计80-90310.033010.0100.090-100310.062720.0907172456.780.0110-120930.0261386.743.3120-130413.3304100.013.3合计30100.0------------按营业额分组(百万元)频数(家)频率(%)累计频数累计频率向上累计向下累计向上累计向下累计80-90310.033010.0100.090-100310.062720.0907172456.780.0110-120930.0261386.743.3120-130413.3304100.013.3合计30100.0------------纵栏标题指标数值主词宾词统计表
1)含义:用纵横交叉的线条所绘制的用以表现统计资料的表格。
2)构成:详见上一页表1所示。
3)种类:按主词分组状况分为简单表、分组表、复合表:*简单表:主词未经任何分组,仅罗列总体各单位的名称或时期;*分组表:主词只按一个标志分组;*复合表:主词按两个或以上的标志进行层叠分组。班级1班2班3班总人数656068按产业分组增加值(亿元)比重(%)第一产业第二产业第三产业14628449352987916.350.333.4合计89442100组别人数(人)比重(%)女性教授非教授男性教授非教授
109020805451040合计2001004)统计表的设计原则
a.标题简明、准确(内容、时间、空间);
b.计量单位必须注明在相应的纵栏标题上(若表中资料都属同一计量单位,可将计量单位写于表的右上方;
c.开口式设计,即左右两边不封口。表的上下横线用粗线表示;
d.数字对齐,当有相同数值时应填写该数,不能用“同上”、“同左”等字样代替;若没有数字或不应该有数字式,要用短线“——”表示;当缺乏某项资料室,可用省略号“……”表明,表示不是漏填;
e.若统计栏数较多,应加以编号,并可以表明其相互关系。主词栏:(甲)、(乙)、(丙)等文字编号;宾词栏:(1)、(2)、(3)等数字编号;
f.统计表的资料来源以及其他需要附加的说明可以写在表的下端,以便核查。
统计图
1)含义:用几何图形显示统计资料的直观、形象的形式。
2)种类:
A:条形图:宽度相同,高度/长短不一的条形来比较。“条”可以换为圆柱、方体、椎体等。
某市2010年7月份各年龄人数统计分析图某班同学每天看电视时间统计分析图B.折线图:用折线方式显示数据的变化趋势。C.饼状图:以圆的分割来表示总体的分组及结构情况。D.曲线图:*含义:当变量和组数较多时,折线可以近似的表现为一条平滑的曲线,利用曲线的升降起伏反映现象的数量变动情况的图形。*分类:
正态分布曲线右偏态分布曲线左偏态分布曲线U型分布曲线倒J形分布曲线J形分布曲线含义:描述一定条件下社会现象的总规模、总水平或工作总量的综合指标,是最基本的统计指标。种类:1)反映内容:总体单位总量(单位个数的总和)总体标志总量(单位某一标志值的总和)例:调查全国工业企业的生产经营状况,全国工业企业总数即为总体单位总量;体现各工业企业的生产经营状况的各标志值之和即为总体标志总量,如全国工业企业的总产值、工业增加值、工资总额等;
2)反映时间:时期指标(时间段的总量)---产品产量、GDP等时点指标(时间点的总量)---年末职工数、月末库存
3)计量单位:实物指标(实物单位计量的总量)--某市棉花产量;价值指标(货币单位计量的总量)--GDP/工资总额;劳动量指标(劳动量单位计量的总量)--出勤工时。总量指标计算方法
1)直接计算法:直接计数、点数和测量后加以汇总即得;
2)间接推算法:采用社会现象之间的平衡、因果、比例等关系推算总量的方法。例:利用产量、销量计算产品库存;利用样本资料推断某批次产品的合格率等。计算要点:
1)明确每项指标的含义和范围;
2)注意现象的同质性;
3)正确确定每项指标的计量单位。含义:描述社会经济现象的一般水平,数值表现为平均数,体现总体分布的集中趋势。计算:1)算术平均数=总体标志总量/总体单位数根据计算复杂性,可分为:
A.简单算术平均数
B.加权算术平均数平均指标2)调和平均数:
无论算术平均数,还是调和平均数,核心要点是抓住计算平均指标的基本原理,即平均指标=总量/数量。3)几何平均数:适用于平均比率和平均速度指标的计算,又分为:
*简单几何平均数
*加权几何平均数4)中位数:*含义:总体各单位按某一数量标志值排序后,居于中间位置的标志值,由于其位置居中,某些情况中可以反映现象的一般水平。
*种类:A.未分组资料:
第一步,排序:
第二步,确定中位数:
当n为奇数当n为偶数B.单项数列:第一步,计算累计次数∑f;第二步,确定中位数。
C.组距数列:第一步,计算累计次数∑f;第二步,计算中位数所在的组:(∑f)/2,即“中位数组”,该组的上、下限就规定了中位数的可能取值范围。第三步,插值法计算中位数的近似值;
当∑f为奇数当∑f为偶数
下限公式(较小制累计时使用)
上限公式(较大制累计时使用)
5)众数*含义:总体中出现次数最多的标志值。*计算:
A:单项数列:出现次数最多的标志值。
B:组距数列(必须是等距数列):
第一步:确定众数所在的组,即众数组;第二步:根据比值插值法推算众数的近似值:
下限公式
上限公式
算术平均数、中位数(Me)、众数(Mo)的关系对称分布右偏分布左偏分布含义:说明总体各单位标志值之间差异程度的指标。种类:
1)全距R=最大标志值-最小标志值
2)平均差AD
的计算情况分为两种:变异指标简单平均法,适用于未分组资料加权平均法,适用于分组资料3)方差和标准差:
*计算标志值为数量标志的方差和标准差:*计算是非标志的方差和标准差:设标志值为“是”的概率为p,标志值为”非“的概率为q,则p+q=1.此时:
适用于分组资料适用于未分组资料4)离散系数(变异系数)V:
平均差系数标准差系数项目5动态数列动态数列概述水平分析速度分析趋势分析动态数列概述
1)含义:又称时间数列、时间序列。将某一指标在不同时间上的数值按时间顺序排列的统计数列。
2)种类:按指标数值表现形式不同,分为:B.相对数动态数列A.绝对数动态数列C.平均数动态数列数值表现形式时间状况(时期、时点)时期数列时点数列一般水平的变化过程或发展趋势例:单位成本、平均亩产量数量对比关系或现象发展变化过程例:人口密度、人口自然增长率连续性取得、可加性、时间性一次性取得、不可加性、数值大小与时间长短无关3)编制原则:可比性
A.时间长短应该相等(特殊情况除外)即:时期指标所属的时间长度应该相等;时点指标所间隔的时间长度应该相等。
B.总体范围一致:即:随时间的变动,总体的空间范围不变,否则不满足可比性。
C.经济内容相同:即:明确指标的经济内容,且保持一致。
D.指标的计算方法、计量单位和计算价格应该一致
水平分析发展水平
A.根据数值表现形式可分为绝对水平、相对水平、平均水平;
B.根据位置不同,可分为最初水平、中间水平和最末水平。
C.根据研究计算需要,可分为基期水平、报告期水平;平均发展水平增长量:逐期增长量累计增长量平均增长量=逐期增长量之和/逐期增长量项数
=数列末期累计增长量/数列项数-1绝对数动态数列相对数或平均数动态数列时期数列:简单算术平均数时点数列连续时点间断时点逐日连续分组连续简单算术平均数加权算术平均数等间隔不等间隔首末折半法加权序时平均法速度分析发展速度=(报告期水平/基期水平)*100%
环比发展速度=报告期水平/前一期水平定基发展速度=报告期水平/固定期水平年距发展速度=本期发展水平/去年同期发展水平增长速度=(增长量/基期水平)*100%=发展速度-1
环比增长速度=逐期增长量/前一期水平定基发展速度=累计增长量/固定期水平年距发展速度=本期年距增长量/去年同期发展水平平均增长速度=平均发展速度-1平均发展速度:增长1%的绝对值=(逐期增长量/环比增长速度)*1%趋势分析影响动态序列因素构成:
1)长期趋势T:即持续向上、向下或持平的趋势。(GDP)2)季节变动S:随季节更替而出现有规律的变动。(交通客运量)
3)循环变动C:在若干年中发生的周期性起伏变动。(经济发展周期)
4)不规则变动I:临时的、偶然的、不明原因的影响而引起的随机变动。(地震)长期趋势T分析测定方法:
1)时距扩大法:增大时间间隔来编制新的动态数列。
2)移动平均法:计算移动序时平均数来编制新的动态数列。季节变动S分析方法:
1)按月(季)平均法:不考虑长期趋势影响,直接计算。
2)移动平均趋势剔除法:剔除长期趋势后再求季节变动。项目6抽样推断概述抽样误差抽样估计确定样本容量概述
1.含义:研究总体中的部分单位,并以此推断总体。
2.特点:随机抽取单位、用样本推断总体、抽样误差可算可控。
3.应用:A、抽样推断能够完成其他调查方式不能完成的调查任务;
B、修正和检验全面调查资料;
C、利用推断的结果进行假设检验,对事物做出正确判断;
D、对工业生产过程进行质量监控。
4.基本概念:a.全及总体:即统计总体,简称总体;
b.样本总体:从总体随机抽取部分单位的集合,又称样本;
c.参数:反映总体数量特征的综合指标(平均数,频率,标准差,方差)
d.统计量:反映样本总体数量特征的综合指标(样本平均数、样本频率、样本标准差、样本方差)
5.抽样方法:重置抽样+不重置抽样顺序抽样+非顺序抽样
6.抽样组织形式:简单随机、类型(分层)、等距、整群、多阶段抽样抽样误差
1.含义:用样本指标推断总体指标所产生的偏差。
2.来源:登记误差+代表性误差(非随机+随机)
3.抽样平均误差:
A.含义:指抽样平均数或抽样成数的标准差。
B.定义式:样本平均数的抽样平均误差样本成数的抽样平均误差重置抽样不重置抽样重置抽样不重置抽样C.影响抽样平均误差的因素总体变异程度(正比)、样本容量(反比)、抽样方法(重置抽样>不重置抽样)、抽样组织形式(整群抽样常大于其他形式)4.抽样极限误差:5.抽样误差的概率度:
样本平均数的抽样极限误差样本成数的抽样极限误差抽样估计
1.含义:利用样本指标数值估计总体指标的数值
2.分类:
A.点估计:不考虑抽样误差,直接将样本指标数值作为总体指标数值。
B.区间估计:将样本指标数值+抽样误差来推算总体的指标数值。确定样本容量总体平均数的估计区间总体成数的估计区间抽样平均数的单位数抽样成数的单位数重置抽样不重置抽样项目7相关与回归分析相关分析
1.含义:现象之间相互联系、相互制约的关系成为相关关系。
2.特点:现象间非确定性的相互依存。
3.种类:A.影响因素的多少:单相关、复相关
B.表现形态:直线相关、曲线相关
C.变动方向:正相关、负相关
D.密切程度:完全相关、不完全相关、不相关
4.分析步骤:
A.定性分析:利用理论知识和实际经验判断现象之间是否存在相关关系。
B.相关表/相关图:利用图、表粗略观察相关关系的类型和相关程度的高低。
C.测定相关系数:(仅适用于两个变量之间线性相关程度的测定)1)r的取值范围【-1,1】;2)r=0,表明两变量不相关;
r>0,表明正相关;
r<0,表明负相关;
r=1,表明完全正相关;
r=-1,表明完全负相关。回归分析
1.含义:测定具有相关关系的现象之间的数量表达式。
2.种类:根据自变量的个数:一元回归、多元回归根据回归线的形状:线性回归、非线性回归
3.与相关分析的区别:
A.变量关系B.变量随机性C.变量间关系的表现形式
4.一元线性回归方程:
1)含义:y=a+bx2)前提:两个变量之间存在显著线性相关关系,且有一定数量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关于行政事业单位成本管理问题的思考
- 新形势下商业银行的合规风险管理研究
- 地理东南亚二山河相间与城市分布热带旅游胜地新
- 53模拟试卷初中数学八年级下册04专项素养综合全练(四)
- DB1301-T 458-2023“嘉科豆1”大豆品种夏播栽培技术规程
- 管道专项施工组织设计
- 抖音短视频全攻略录制+特效+直播+运营模板
- 牧高笛财务报表分析报告
- 9.14公式法的教学
- TGXAS-康复机构学龄前孤独症儿童特殊教育服务规范编制说明
- 部编版六年级上册道德与法治《公民的基本权利和义务》课件
- 2024年中国电信新疆公司招聘笔试参考题库含答案解析
- 商业银行数据脱敏管理办法(2023年版)
- 沥青工施工详细要求培训
- 配电室运行维护投标方案(技术标)
- 快手申诉文本
- 费用申请审批表
- 新教材人教版高中英语必修一单词表
- 读书分享读书交流会《教育的情调》课件
- PICC导管意外脱出
- 小学道法1感受生活中的法律2课件
评论
0/150
提交评论