版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
金融数据统计分析项目三从数据看总体(高职)Chap3_从数据看总体01背景:移动互联网营销01知识:总体和样本01实践:对总体进行估计(高职)Chap3_从数据看总体学习目标理解总体和抽样之间的关系掌握利用样本对总体参数进行估计的方法掌握确定抽样调查样本容量的方法能够利用Excel完成点估计、区间估计和样本容量的计算(高职)Chap3_从数据看总体项目背景移动互联网营销(高职)Chap3_从数据看总体移动互联网营销移动化碎片化场景化移动互联网营销就是指使用手机、掌上电脑、笔记本电脑等移动通信设备与无线上网技术结合所构成的一个互联网营销体系。(高职)Chap3_从数据看总体移动互联网营销的特征能够实现精准客户目标定位营销碎片化营销内容的个性定制化(高职)Chap3_从数据看总体移动互联网营销模式微信营销微博营销APP营销(高职)Chap3_从数据看总体基于数据的移动互联网营销采集和处理数据建模分析数据解读数据(高职)Chap3_从数据看总体移动互联网逐渐跨入大数据时代真正的精准营销就是要挖掘并满足消费者的内在需求用户画像智能推荐系统(高职)Chap3_从数据看总体总体和样本总体:指所要认识的研究对象的全体,它是由所研究范围内具有某种共同性质的全体单位所组成的集合体总体分为变量总体和属性总体样本:样本是从体中随机抽取出来的一部分所组成的集合体一次抽样所包含的样本个数称为样本的容量重复抽样和不重复抽样(高职)Chap3_从数据看总体总体参数根据总体各单位标志值或标志属性计算的、反映总体某种属性的综合指标,称为全及指标,也称为“总体参数”总体平均数总体标准差(总体方差)总体比率(比例)(高职)Chap3_从数据看总体抽样指标根据样本各值计算的、反映样本属性的指标称为抽样指标抽样平均数样本标准差(样本方差)抽样比率(高职)Chap3_从数据看总体抽样调查的理论基础概率论大数定律随着抽样单位数的增加,样本平均数有接近总体平均数的趋势,这一可能性的概率可以尽可能地接近于1。这就是大数法则的意义。中心极限定理:为抽样误差的概率估计提供了理论基础 (高职)Chap3_从数据看总体抽样误差抽样误差是指由于抽样的随机性而带来的偶然的代表性误差抽样误差包括抽样实际误差和抽样平均误差两种抽样实际误差是指某一样本指标与被它估计的总体指标之间数值的差异抽样实际误差不是一个确定的值。(高职)Chap3_从数据看总体抽样平均误差计算示例序号样本总量样本平均数(1)(2)122212232.50.25324304322.50.25533306343.50.25742308433.50.25944411033300.5477(高职)Chap3_从数据看总体抽样的平均误差重复抽样下抽样平均误差的计算抽样平均数的平均误差抽样比率的平均误差不重复抽样下抽样平均误差的计算抽样平均数的平均误差抽样比率的平均误差(高职)Chap3_从数据看总体抽样极限误差抽样极限误差:以一定的可靠程度保证抽样误差不超过某一给定的范围。统计上把抽样极限误差又称为置信区间。在给定的准确度范围内,抽样估计还要求其估计的可靠程度,即可信度。抽样估计的可信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度,用表示。(高职)Chap3_从数据看总体由样本估计总体参数用样本参数值估计总体参数的方法称为抽样估计,也称为参数估计参数估计可以分为点估计和区间估计两类(高职)Chap3_从数据看总体点估计点估计:利用样本计算出的统计量直接作为总体参数的估计量。可以用样本平均数、中位数、众数等选择的主要依据:无偏性、有效性、一致性点估计的优点是简单、明确但由于样本的随机性,从一个样本得到的估计值往往不能作为总体参数的实际值(高职)Chap3_从数据看总体区间估计区间估计是根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围的方法利用实际样本资料,构造出一个置信区间,用这个区间来表明总体参数可能存在的范围,同时给出这个估计相应的概率保证程度,即置信度区间估计的公式表示为:(高职)Chap3_从数据看总体置信度和置信区间置信区间就是联系一定概率保证程度确定的区间置信度表示区间估计的可靠程度。例如,则说明有95%的可能总体参数包含在估计区间内。而不包括在这个区间的概率为
=5%,叫显著性水平。(高职)Chap3_从数据看总体总体均值的区间估计总体是正态分布且方差已知总体是正态分布且方差未知(高职)Chap3_从数据看总体大样本和小样本(高职)Chap3_从数据看总体总体比率的区间估计总体比率的区间估计是,其中为抽样的极限误差。例如,美国大选民意调查中,在某地区调查1000个样本,支持率为58%,置信度为95%条件下计算该地区所有居民的支持率区间。根据给出条件,得到样本的极限误差,所以该地区所有居民的支持率区间估计为[0.5494,0.6106]。(高职)Chap3_从数据看总体样本容量的确定样本容量越大,收集的信息就越多,从而会提高估计的精度,但相应的,投入的调查、观测成本会比较高估计正态总体均值时样本容量的确定估计总体比率时样本容量的确定(高职)Chap3_从数据看总体假设检验假设检验是先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。假设检验的步骤通常分为5步:①提出假设②从总体中随机抽取一个样本③确定一个适当的检验统计量,并用样本数据计算出具体数值④确定一个适当的显著水平,计算出临界值,指定拒绝域;⑤将③中计算的具体数值与④中的临界值进行比较,做出决策。在前计算机时代(手工计算),如果③计算的数值落在拒绝域,则拒绝原假设,否则不拒绝。在计算机时代,则直接利用值做出决策,如果值小于,则拒绝。(高职)Chap3_从数据看总体提出假设对总体参数作一个试验性的假设,将其称为原假设(Null
hypothesis),记作H0再定义一个与原假设相反的假设,称之备选假设(Alternativehypothesis),记作H1原假设和备择假设是相互对立的。通常,多数的假设检验都以否定原假设为目标,即人们希望通过掌握的反映现实世界的数据找出假设和现实之间的矛盾,从而否定这个假设,并称该检验显著(significant)(高职)Chap3_从数据看总体提出假设一般来讲,等号“=”总是放在原假设上。如果备择假设没有特定的方向性,并含有符号“≠”,这样的称为双侧检验或双尾检验。如果备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验备择假设的方向为“<”,称为左侧检验;备择假设的方向为“>”,称为右侧检验(高职)Chap3_从数据看总体假设检验的可能出现的错误第I类错误:原假设为真时拒绝原假设。第I类错误的概率记为,被称为显著水平。第II类错误:原假设为假时未拒绝原假设。第I类错误的概率记为。相对而言更加严重的是第I类错误,所以的值应该尽可能小。(高职)Chap3_从数据看总体检验统计量检验统计量是根据样本数据计算所得的某个样本统计量的标准化结果常用的检验统计量有t统计量、Z统计量、F统计量等。当总体是正态分布或大样本(n>=30)时的非正态分布时,使用Z检验统计量。当总体是正态分布,小样本抽样。如果总体标准差已知,则上面的Z检验统计量。如果总体标准差未知时,使用
t
检验统计量。(高职)Chap3_从数据看总体(高职)Chap3_从数据看总体拒绝域在原假设条件下,样本估计量服从一个给定的概率分布,而在备选假设下则不然。所以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一片树叶课件
- 2024年社会公共安全设备及器材项目评价分析报告
- 静脉血栓的预防及护理治疗
- 糖尿病护理简介
- XXXX市整治形式主义为基层减负情况报告范文
- 运动神经元病护理常规
- 老年人谵妄治疗和护理
- 音乐活动教案一只哈巴狗
- 工艺工程师安全职责(2篇)
- 企业售后服务岗位职责范文(2篇)
- 水利视频监控系统解决方案
- 警犬相关知识培训课件
- (2024年)院感知识培训内容(完整详细版)x
- 高三第一次联考英语试卷分析
- 幼儿园食品安全
- 家庭教育与孩子的生涯规划
- 大学生如何遵守网络生活中的道德要求
- 给小朋友科普医学知识
- 电气工程及其自动化生涯发展展示
- 2024学校所属企业国有资产管理的若干意见全文
- 五年级上册简易方程练习400题及答案
评论
0/150
提交评论