




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学基础(第二版)第一章第一章 统计和统计数据 一、统计学的含义一、统计学的含义统计学是收集、处理、分析、解释数据并统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。从数据中得出结论的科学。第一节第一节 统计及其应用领域统计及其应用领域统计提供的数据分析方法可分为统计提供的数据分析方法可分为描述统计描述统计和和推断统计推断统计两大类。两大类。描述统计:描述统计:研究数据收集、处理和描述的统研究数据收集、处理和描述的统计学方法。计学方法。推断统计:推断统计:研究如何利用样本数据来推断总研究如何利用样本数据来推断总体特征的统计学方法。体特征的统计学方法。二、统计的应用领域二、统计的应用
2、领域统计方法是适用于所有学科领域的通用数据分析统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。方法,只要有数据的地方就会用到统计方法。l企业发展战略l产品质量管理l市场研究l财务分析l经济预测l人力资源管理l产品质量管理l企业发展战略l产品质量管理l市场研究l企业发展战略l产品质量管理l财务分析l市场研究l企业发展战略l产品质量管理l经济预测l财务分析l市场研究l企业发展战略l产品质量管理l人力资源管理人力资源管理l经济预测经济预测l财务分析财务分析l市场研究市场研究l企业发展战略企业发展战略l产品质量管理产品质量管理统计的主要作用是帮助我们分析数据。它统计的
3、主要作用是帮助我们分析数据。它是一套分析数据的方法和工具,不能指望是一套分析数据的方法和工具,不能指望统计成为解决所有问题的灵丹妙药。统计成为解决所有问题的灵丹妙药。第二节第二节 数据的类型数据的类型按照所采用的不同计量尺度按照所采用的不同计量尺度,可以将统计数据分为,可以将统计数据分为分类数据、顺序数据、数值型数据分类数据、顺序数据、数值型数据一、分类数据、顺序数据、数值型数据一、分类数据、顺序数据、数值型数据分类数据分类数据 只能归于某一类别的非数字型数据,成为分类数据。只能归于某一类别的非数字型数据,成为分类数据。 例如:例如: 按照性别,人口可分为男性、女性。按照性别,人口可分为男性、
4、女性。 按照行业属性,企业可分为医药企业、家电企业、纺按照行业属性,企业可分为医药企业、家电企业、纺织品企业等。织品企业等。 为便于统计处理,对于分类数据可以用数字代码来表为便于统计处理,对于分类数据可以用数字代码来表示各个类别,如用示各个类别,如用“1”表示表示“男性男性”,“0”表示表示“女女性性”。顺序数据顺序数据 只能归于某一有序类别的非数字型数据,称为顺序数据。只能归于某一有序类别的非数字型数据,称为顺序数据。 顺序数据也是对事物进行分类的结果,但这些类别是有顺序数据也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。顺序的,它是由顺序尺度计量形成的。 例如:例
5、如: 产品可以分为一等品、二等品、三等品、次等品等。产品可以分为一等品、二等品、三等品、次等品等。 一个人对某一事物的态度可以分为非常同意、同意、保一个人对某一事物的态度可以分为非常同意、同意、保持中立、不同意、非常不同意等。持中立、不同意、非常不同意等。 同样的,同样的,“1”可以表示可以表示“非常同意非常同意”,“2”可以表示可以表示“同意同意”,“3”表示表示“保持中立保持中立”,“4”表示表示“不同不同意意”,以此类推。,以此类推。 数值型数据数值型数据 按数字尺度测量的观察值,称为数值型数据。按数字尺度测量的观察值,称为数值型数据。 数值型数据是使用自然或度量衡单位对事物进行数值型数
6、据是使用自然或度量衡单位对事物进行测量的结果,其结果表现为具体的数值。测量的结果,其结果表现为具体的数值。 分类数据和顺序数据说明的是事物的品质特征,分类数据和顺序数据说明的是事物的品质特征,通常是用通常是用文字文字来表述的,其结果均表现为类别,来表述的,其结果均表现为类别,因而可统称为因而可统称为定性数据定性数据或或品质数据品质数据。 数值型数据说明的是现象的数量特征,通常用数值型数据说明的是现象的数量特征,通常用数数值值来表现的,因而可称为来表现的,因而可称为定量数据定量数据或或数量数据数量数据。按照统计数据的收集方法按照统计数据的收集方法,可以将统计数据分为观,可以将统计数据分为观测数据
7、和实验数据。测数据和实验数据。二、观测数据和实验数据二、观测数据和实验数据 观测数据:通过调查或观测而收集到的数据。观测数据:通过调查或观测而收集到的数据。 实验数据:在实验中控制实验对象而收集到的数据。实验数据:在实验中控制实验对象而收集到的数据。按照所描述的现象与时间的关系按照所描述的现象与时间的关系,可以将统计数据,可以将统计数据分为截面数据和时间序列数据。分为截面数据和时间序列数据。三、截面数据和时间序列数据三、截面数据和时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间上收集到的数据。时间序列数据:
8、在不同时间上收集到的数据。1.下面的数据中属于顺序数据的是()下面的数据中属于顺序数据的是()A.5个人的年龄分别是25,22,34,41,33B.性别:男,女C.上市公司所属的行业:金属,房地产,医药,机械制造D.员工对企业某项改革措施的态度:赞成,中立,反对2.一家研究机构从一家研究机构从IT从业者中随机抽取从业者中随机抽取500人作为样本进人作为样本进行调查,其中行调查,其中60%的人回答他们的月收入在的人回答他们的月收入在5000元以上,元以上,50%的人回答他们的消费支付方式是用信用卡。这里的的人回答他们的消费支付方式是用信用卡。这里的“消费支付方式消费支付方式”是()是()A.分类
9、变量 B.顺序变量C.数值型变量 D.离散型变量3.下面的变量中属于顺序变量的是()下面的变量中属于顺序变量的是()A.收入 B.汽车产量 C.员工对企业某项改革措施的态度(赞成,中立,反对)D.企业类型4.一项民意调查的目的是想确定年轻人愿意与其父母讨论一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。调查结果表明:的话题。调查结果表明:45%的年轻人愿意与其父母讨的年轻人愿意与其父母讨论家庭财务状况,论家庭财务状况,38%的年轻人愿意与其父母讨论有关的年轻人愿意与其父母讨论有关教育的话题,教育的话题,15%的年轻人愿意与其父母讨论爱情问题。的年轻人愿意与其父母讨论爱情问题。该调查所收
10、集的数据是()该调查所收集的数据是()A.分类数据 B.顺序数据 C.数值型数据 D.试验数据第三节第三节 数据来源数据来源一、数据的间接来源一、数据的间接来源来源于别人调查或实验的数据,对使用者来说,来源于别人调查或实验的数据,对使用者来说,这是数据的间接来源,称为这是数据的间接来源,称为二手数据二手数据或或间接数据间接数据。利用二手数据对使用者来说既经济又方便,但使用利用二手数据对使用者来说既经济又方便,但使用时应注意统计数据的含义、计算口径和计算方法,时应注意统计数据的含义、计算口径和计算方法,以避免误用或滥用。在引用二手数据时,一定要注以避免误用或滥用。在引用二手数据时,一定要注明数据
11、的来源,尊重他人劳动成果。明数据的来源,尊重他人劳动成果。二、数据的直接来源二、数据的直接来源 数据直接来源主要有两个渠道:数据直接来源主要有两个渠道: 一是一是调查或观察调查或观察 调查是取得社会经济数据的重要手段 二是二是实验实验 实验是取得自然科学数据的主要手段。统计调查方式统计调查方式 常用的统计调查方式有抽样调查、普查、统计报表等。常用的统计调查方式有抽样调查、普查、统计报表等。 抽样调查抽样调查:从总体中随机抽取一部分单位作为样本进行:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集调查,并根据样本调查结果来推断总体特征的数据收集方法,称为抽样
12、调查。方法,称为抽样调查。 普查普查:为特定目的而专门组织的全面调查,称为普查。:为特定目的而专门组织的全面调查,称为普查。 统计报表统计报表:按照国家有关法规的规定,自上而下地统一:按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的调查方式。布置,自下而上地逐级提供基本统计数据的调查方式。数据的收集方法数据的收集方法 数据收集方法可分为询问调查、观察和实验三大类。数据收集方法可分为询问调查、观察和实验三大类。 询问调查询问调查 包括访问调查、邮寄调查、电话调查、电脑包括访问调查、邮寄调查、电话调查、电脑辅助调查、座谈会、个别深访。辅助调查、座谈会、个别深访。 观察法
13、观察法 实验法实验法 包括室内实验法和市场实验法包括室内实验法和市场实验法三、调查方案设计三、调查方案设计 调查目的调查目的 调查所要达到的具体目标调查所要达到的具体目标 “为什么调查为什么调查” 调查对象和调查单位调查对象和调查单位 调查对象:根据调查目的确定的调查研究的总体或调查范围。调查对象:根据调查目的确定的调查研究的总体或调查范围。 调查单位:构成调查对象的每一个单位。调查单位:构成调查对象的每一个单位。 例如:人口普查的调查对象是具有中国国籍并在中国境内常住的人,例如:人口普查的调查对象是具有中国国籍并在中国境内常住的人, 人口普查的调查单位是每一个人。人口普查的调查单位是每一个人
14、。 调查项目和调查表调查项目和调查表 调查项目通常以表格的形式来表现,称为调查表。调查表是用于登记调调查项目通常以表格的形式来表现,称为调查表。调查表是用于登记调查数据的一种表格,一般由表头、表体和表外附加三部分。查数据的一种表格,一般由表头、表体和表外附加三部分。 表头:调查表的名称,用来说明调查的内容。表头:调查表的名称,用来说明调查的内容。 表体:调查表的主要部分,是调查内容的具体体现表体:调查表的主要部分,是调查内容的具体体现 表外附加:通常由填表人签名、填报日期、填表说明等内容组成。表外附加:通常由填表人签名、填报日期、填表说明等内容组成。四、数据质量四、数据质量 如何保证统计数据的
15、质量是数据收集阶段要重点解决如何保证统计数据的质量是数据收集阶段要重点解决的问题。的问题。 为保证质量,需要在数据收集、整理、分析等阶段尽为保证质量,需要在数据收集、整理、分析等阶段尽可能减少误差。可能减少误差。 误差主要有抽样误差和非抽样误差两类。误差主要有抽样误差和非抽样误差两类。 抽样误差:抽样误差:指在用样本数据进行推断时所产生的随机指在用样本数据进行推断时所产生的随机误差。误差。 非抽样误差:非抽样误差:指调查过程中由于调查者或被调查者的指调查过程中由于调查者或被调查者的人为因素而造成的误差。人为因素而造成的误差。数据的质量评价标准概括为数据的质量评价标准概括为6个方面个方面 精度精
16、度 准确性准确性 关联性关联性 及时性及时性 一致性一致性 最低成本最低成本四、数据质量四、数据质量1.一个退休人员对寄居在家中的一窝燕子很感兴趣,他每一个退休人员对寄居在家中的一窝燕子很感兴趣,他每天观察并记录燕子飞出飞进的时间,以及它们喂养小燕子天观察并记录燕子飞出飞进的时间,以及它们喂养小燕子的习惯。这种收集数据的方法称为()的习惯。这种收集数据的方法称为()A.普查 B.观察 C.实验 D.询问2.如果一个样本因人故意操纵而出现偏差,这种误差属于如果一个样本因人故意操纵而出现偏差,这种误差属于()()A.抽样误差 B.非抽样误差C.设计误差 D.试验误差3.为了解居民对小区物业服务的意
17、见和看法,管理人员随为了解居民对小区物业服务的意见和看法,管理人员随机抽取了机抽取了50户居民,上门通过问卷进行调查。这种数据的户居民,上门通过问卷进行调查。这种数据的收集方法称为()收集方法称为()A.访问调查 B.邮寄调查 C.座谈会 D.个别深度访问4.为了解居民对小区物业服务的意见和看法,管理为了解居民对小区物业服务的意见和看法,管理人员挑选了有代表性的人员挑选了有代表性的5户居民,把他们召集在一户居民,把他们召集在一起进行座谈。这种数据的收集方法称为()起进行座谈。这种数据的收集方法称为()A.访问调查 B.邮寄调查C.座谈会 D.个别深度访问5.某小区两户居民因停车问题经常发生纠纷
18、,居委某小区两户居民因停车问题经常发生纠纷,居委会的管理人员对其中一户居民的车主进行专门座会的管理人员对其中一户居民的车主进行专门座谈。这种数据的收集方法称为()谈。这种数据的收集方法称为()A.访问调查 B.邮寄调查C.座谈会 D.个别深度访问总总体体 包含所研究的全部个体(数据)的集包含所研究的全部个体(数据)的集合合一、总体与样本一、总体与样本 个个体体 组成总体的每一个元素组成总体的每一个元素 第四节第四节 统计中的几个基本概念统计中的几个基本概念样样本本 从总体中抽取的一部分元素的集合从总体中抽取的一部分元素的集合样样本量本量 构成样本的元素数目(或称为样本容量)构成样本的元素数目(
19、或称为样本容量) 从总体中抽取一部分元素作为样本,目的是从总体中抽取一部分元素作为样本,目的是要根据样本提供的有关信息去推断总体的特要根据样本提供的有关信息去推断总体的特征。征。 例如:从一批灯泡中随机抽取例如:从一批灯泡中随机抽取100个,这个,这100个灯泡就构成了一个样本,然后根据这个灯泡就构成了一个样本,然后根据这100个个灯泡的平均使用寿命去推断这批灯泡的平均灯泡的平均使用寿命去推断这批灯泡的平均使用寿命。使用寿命。总体根据其所包含的单位数目是否可数可以总体根据其所包含的单位数目是否可数可以 分为分为有限总体有限总体和和无限总体无限总体。对于对于无限总体无限总体,每次抽取一个单位,并
20、不影响下一次,每次抽取一个单位,并不影响下一次的抽样结果,因此每次抽取可以看作的抽样结果,因此每次抽取可以看作独立独立的。的。对于对于有限总体有限总体,在抽取一个单位后,总体元素就会减,在抽取一个单位后,总体元素就会减少一个,前一次的抽样结果往往会影响第二次的抽样少一个,前一次的抽样结果往往会影响第二次的抽样结果,因此每次抽取是结果,因此每次抽取是不独立的不独立的。1.某研究部门准备在全市某研究部门准备在全市200万个家庭中抽取万个家庭中抽取2000个家个家庭,推断该城市所有职工家庭的年人均收入。这项研庭,推断该城市所有职工家庭的年人均收入。这项研究的究的总体总体是()是()A.2000个家庭
21、 B.200万个家庭C.2000个家庭的人均收入 D.200万个家庭的人均收入2.某研究部门准备在全市某研究部门准备在全市200万个家庭中抽取万个家庭中抽取2000个家个家庭,推断该城市所有职工家庭的年人均收入。这项研庭,推断该城市所有职工家庭的年人均收入。这项研究的究的样本样本是()是()A.2000个家庭 B.200万个家庭C.2000个家庭的人均收入 D.200万个家庭的人均收入二、参数和统计量二、参数和统计量参参数数 即用来描述总体特征的概括性数字度量。即用来描述总体特征的概括性数字度量。 总体平均数、总体标准差、总体比例总体平均数、总体标准差、总体比例统统计量计量 即用来描述样本特征
22、的概括性数字度量。即用来描述样本特征的概括性数字度量。 样本平均数、样本标准差、样本比例样本平均数、样本标准差、样本比例变变量量 说明现象某种特征的概念说明现象某种特征的概念变量的特点就是从一次观察到下一次观察会呈现出差别或变化。变量的特点就是从一次观察到下一次观察会呈现出差别或变化。 如如“商品销售额商品销售额”“”“受教育程度受教育程度” “ “产品的质量等级产品的质量等级”等都是变量。等都是变量。三、变量三、变量分类变量分类变量 说明事物类别的一个名称说明事物类别的一个名称 分类变量分类变量的数值取值就是的数值取值就是分类数据分类数据 如如“性别性别”是个分类变量,其变量值为是个分类变量
23、,其变量值为“男男”或或“女女”;“行业行业”也是一个分类变量,其也是一个分类变量,其变量值可以为变量值可以为“零售业零售业”“”“旅游业旅游业”“”“汽车汽车制造业制造业”等。等。顺序变量顺序变量 说明事物有序类别的一个名称说明事物有序类别的一个名称 顺序变量顺序变量的数值取值就是的数值取值就是顺序数据顺序数据如如 “产品等级产品等级”是个顺序变量,其变量值为是个顺序变量,其变量值为“一等品一等品”、“二等品二等品”、“三等品三等品”、“次品次品”等;等; “受教育程度受教育程度”也是一个顺序变量,其变量值可以为也是一个顺序变量,其变量值可以为“小学小学”“”“初中初中”“”“高中高中”等;
24、等; 一个人对某种事物的看法也是一个顺序变量,其变量一个人对某种事物的看法也是一个顺序变量,其变量值可以为值可以为“同意同意”、“保持中立保持中立”、“反对反对”等。等。数值型变量数值型变量 说明事物数字特征的一个名称说明事物数字特征的一个名称 数值型变量数值型变量的取值就是的取值就是数值型数据数值型数据 如如“产品产量产品产量”、“商品销售额商品销售额”、“零件零件尺寸尺寸”、“年龄年龄”、“时间时间”等都是数值型等都是数值型变量。变量。数值型变量数值型变量 根据其取值不同,可分为离散型变量和连续型变量。根据其取值不同,可分为离散型变量和连续型变量。 离散型变量离散型变量:只能取可数值的变量
25、:只能取可数值的变量(只能取有限个值,且取值都以整位数断开)(只能取有限个值,且取值都以整位数断开) 连续型变量连续型变量:可以在一个或多个区间中取任何值的变量:可以在一个或多个区间中取任何值的变量(取值是连续不断的,如(取值是连续不断的,如“年龄年龄”“”“温度温度”)1.一项调查表明,在所抽取的一项调查表明,在所抽取的1000个消费者中,他们每个消费者中,他们每月在网上购物的平均花费是月在网上购物的平均花费是200元,他们选择在网上购元,他们选择在网上购物的主要原因是物的主要原因是“价格便宜价格便宜”。这里的。这里的参数参数是()是()A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均花费金额D.1000个消费者的平均花费金额2.一项调查表明,在所抽取的一项调查表明,在所抽取的1000个消费者中,他们每个消费者中,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司劳务协议年
- 灯具代理销售合同协议
- 九年级英语介词常见用法和实例分析课堂讲解计划
- 会展策划公司项目管理与实施流程预案
- 工作任务分配表格-工作任务安排表
- 《原子的结构与核反应:高中化学核化学教案》
- 传媒广告发布协议
- 精细化办公制度与流程指南
- 格林童话作文赏析童话中的真善美
- 智慧之泉论语故事解读
- 烹饪营养与卫生知识考核试题题库与答案
- 走近人工智能
- 制造业信息化管理系统架构规划
- 蓝色卡通风好书推荐教育PPT模板
- 《纳米复合材料》第2章 纳米复合材料概论
- 宫颈癌HPV疫苗知识培训(课堂PPT)
- 2019版外研社高中英语必选择性必修一单词表
- 常用电工仪器仪表使用方法
- 建设工程绿色施工围蔽指导图集
- 2022新教科版六年级科学下册全一册全部教案(共28节)
- 中级Java软件开发工程师笔试题(附答案)
评论
0/150
提交评论