版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一页,共七十三页,2022年,8月28日第一节常用统计量一、频数分布二、交叉表三、集中趋势指标四、差异性指标五、分布形状的指标第二页,共七十三页,2022年,8月28日一、频数分布概念频率分析统计图形第三页,共七十三页,2022年,8月28日频数分布有时营销调研人员需要了解有关单个变量的信息本品牌的使用者中有多少称得上是品牌忠诚者?有多少个顾客对新产品很熟悉?多少比较熟悉?有多少顾客对饭菜的口味满意?多少非常满意?多少不满意?频数分布:了解对一个变量选择不同取值的调查对象数量。变量中不同取值的出现频率以百分比的形式展现;对一个变量的频数分布会产生频数、百分比、累积百分比几个数据。第四页,共七十三页,2022年,8月28日频数分布作用:有助于明确未回答者的多少,同时也能显示不合格答案的多少;可以检验奇异值和极端值;根据频数分布可以划出各种统计图形。第五页,共七十三页,2022年,8月28日频数分布第六页,共七十三页,2022年,8月28日频数分布所想购买的户型频数百分比有效百分比累积百分比一室一厅一卫32.132.192.19两室一厅一卫3927.6628.4730.66两室两厅一卫128.518.7639.42两室两厅两卫96.386.5745.99三室一厅一卫3222.7023.3669.34三室一厅两卫1510.6410.9580.29三室两厅一卫42.842.9283.21三室两厅两卫107.097.3090.51四室两厅两卫10.710.7391.24措层21.421.4692.70越层21.421.4694.16其他85.675.84100.00Total13797.16100.00Missing42.84Total141100.00
第七页,共七十三页,2022年,8月28日频数分布第八页,共七十三页,2022年,8月28日频数分布第九页,共七十三页,2022年,8月28日频数分布内部居住环境频数百分率住宅标准4331.39住宅类型3223.36隔音8864.23隔热与保湿7655.47光照10979.56日照8058.39朝向8763.50通风13195.62第十页,共七十三页,2022年,8月28日频数分布第十一页,共七十三页,2022年,8月28日二、交叉表概念频率分析第十二页,共七十三页,2022年,8月28日交叉表使用行和列的形式对比表示数据本产品中男性消费者的满意比率是多少?女性消费者满意的比率是多少呢?有多少高收入消费者对新产品很熟悉呢?多少比较熟悉、知道一些或者不熟悉该品牌呢?交叉表通常是由背景信息与题项作交叉分析获得。第十三页,共七十三页,2022年,8月28日交叉表所想购买的户型2500-3499元3500-4999元5000-7999元8000-9999元10000元以上中高收入群体一室一厅一卫
4.3
1.4两室一厅一卫42.917.420.026.0两室两厅一卫14.317.4
11.0两室两厅两卫3.64.325.0
5.5三室一厅一卫14.321.712.550.020.019.2三室一厅两卫10.713.012.520.011.0三室两厅一卫3.625.0
4.1三室两厅两卫7.14.312.5
8.2四室两厅两卫
4.3
1.4措层
20.01.4越层
50.020.02.7其他3.613.012.5
8.2第十四页,共七十三页,2022年,8月28日定量数据的描述统计分析数据分布性质算术平均数中位数众数集中趋势全距方差标准差离中趋势偏态分布形态四分位距峰度第十五页,共七十三页,2022年,8月28日三、集中趋势指标算术平均数中位数众数第十六页,共七十三页,2022年,8月28日平均数平均数是将总体中所有个体的数量标志差异抽象化,用以反映现象在一定时间、地点条件下的一般水平或代表性水平.对象:个体单位的数量差异;手段:将数量差异抽象化,即去差异;目的:反映各个个体现象数值的一般水平,代表性水平第十七页,共七十三页,2022年,8月28日平均数反映总体分布的集中趋势;反映总体现象的共性特征;是总体分布的重要数量特征值;是现象规律性的数量表现。第十八页,共七十三页,2022年,8月28日平均数总体分布的集中趋势:--1000个大客户的地区分布2121981921641551211339894中心点第十九页,共七十三页,2022年,8月28日平均数总体现象的共性特征捷达轿车:1没有奖品:99999集中趋势:没有奖品明天下雨的可能性是:80%明天不下雨的可能性:20%集中趋势是:明天下雨第二十页,共七十三页,2022年,8月28日骗人的“平均数”M:吉斯莫先生有一个小工厂,生产超级小玩意儿。M:管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。M:现在吉斯莫先生正在接见萨姆,谈工作问题。吉斯莫:我们这里报酬不错。平均薪金是每周300元。你在学徒期间每周得75元,不过很快就可以加工资。第二十一页,共七十三页,2022年,8月28日骗人的“平均数”M:萨姆工作了几天之后,要求见厂长。萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?第二十二页,共七十三页,2022年,8月28日骗人的“平均数”萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平均工资,而是中等工资。萨姆:每周100元又是怎么回事呢?吉斯莫:那称为众数,是大多数人挣的工资。吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。萨姆:好,现在我可懂了。我……我辞职!第二十三页,共七十三页,2022年,8月28日算术平均数算术平均数是集中趋势指标中最常用的一个统计量,用于评估一个用定距或定比尺度衡量的数据均值。数据都有一定的集中趋势,大部分回答应该分布在均值附近。第二十四页,共七十三页,2022年,8月28日中位数将总体中的各个个体数值按照大小顺序排列,居于中间位置的数值,便是中位数。中位数第二十五页,共七十三页,2022年,8月28日中位数1.是一种集中趋势或平均指标2.位于中间位置的数值如果数据为奇数项,中位数是中间位置的数值如果数据为偶数项,中位数是中间位置两个数值的平均数是一种位置平均数
3.不受总体中极值的影响中间位置n12第二十六页,共七十三页,2022年,8月28日中位数中间位置中位数n12612357789830....数据:10.3 4.9 8.9 11.7 6.3 7.7顺序:4.9 6.3 7.7
8.9 10.3 11.7位置:1 2 3
4 5 62第二十七页,共七十三页,2022年,8月28日众数总体中出现次数最多的数值是众数。众数第二十八页,共七十三页,2022年,8月28日众数1. 集中趋势测定指标或平均指标2.出现次数最多的数值3.不受总体中极值的影响4.可以没有众数,也可以有几个众数第二十九页,共七十三页,2022年,8月28日众数无众数
数据: 10.3 4.9 8.9 11.7 6.3 7.7一个众数
数据: 6.3 4.9 8.9 6.3 4.9
4.9一个以上的众数
数据: 21 28
28 41 43
43第三十页,共七十三页,2022年,8月28日平均数的局限性一个身高180的不会游泳的人想涉水过河,已知河的平均深度为1米,此人是否过河?为什么?某人想购买一台冰箱,现有如下信息:
冰箱品牌AB平均使用年限1010最多使用年限2012最少使用年限28第三十一页,共七十三页,2022年,8月28日四、差异性指标全距方差和标准差第三十二页,共七十三页,2022年,8月28日差异性指标标志变异指标是测定总体中各个个体单位标志值差异的变动范围或差异程度的指标。集中趋势第三十三页,共七十三页,2022年,8月28日差异需要测定吗?孟子说“物之不齐,物之性也”。乃佛家之殊相差异来自于大量现象的异质性或多变性大量现象相异之外,有其相同的一面。但经常是相异之处比相同之处更为显著。统计分析的主题,便是一套研究差异的技术。第三十四页,共七十三页,2022年,8月28日规律性的重要补充首先要充分接受差异,接受现象之个性,使世界丰富多彩;然后是认识差异,了解总体;用集中趋势抽象差异,得到总体一般水平;结合差异,全面认识现象。第三十五页,共七十三页,2022年,8月28日全距测量的是数据的分散程度,就是样本中最大值与最小值之差。全距直接到奇异值的影响反映标志值的变动范围全距计算简便,易于理解,应用普遍。全距的计算:全距=最大标志值-最小标志值第三十六页,共七十三页,2022年,8月28日精确地描述差异--标准差标准差是各单位标志值与其平均数的离差平方的算术平均数的平方根,它表示每个标志值与平均数的平均距离。第三十七页,共七十三页,2022年,8月28日五、分布形状的指标偏度峰度第三十八页,共七十三页,2022年,8月28日偏度理想的分布形态是对称的,但在现实生活中,现象之分布并不完全对称,而是或多或少地不同程度地存在着非对称情况,在统计上将这个非对称分布称为偏态。第三十九页,共七十三页,2022年,8月28日偏度如果偏度=0,则表明此分布为对称分布;如果偏度>0,则表明此分布为右偏态;如果偏度<0,则表明此分布为左偏态;非对称分布称为偏态第四十页,共七十三页,2022年,8月28日峰度峰度是表明一个次数分布陡峭或平缓的指标。一个总体分布的峰度越大,分布形态便越陡峭,总体的数值便越集中一个总体分布峰度越小,分布形态便越平缓,总体的数值便越分散,差异便越第四十一页,共七十三页,2022年,8月28日峰度如果峰度=3,则表明此分布为正态分布;如果峰度>3,则表明此分布为陡峭;如果峰度<3,则表明此分布为平缓;第四十二页,共七十三页,2022年,8月28日分布形状指标教育程度均值中间值众数方差全距峰度偏度初中1.151.001.000.492.0011.893.44高中/技校1.231.001.000.582.005.122.50中专1.481.001.001.044.005.312.33大专1.791.001.001.525.003.082.01大学本科或以上2.051.001.001.905.000.951.60Total1.471.001.001.165.007.442.80第四十三页,共七十三页,2022年,8月28日第二节常用统计表
统计表是以纵横交叉的线条所绘制的表格来陈示数据的一种形式。两大优点:一是能有条理地、系统地排列数据,使人们阅读时一目了然,印象深刻;二是能合理地、科学地组织数据,便于人们阅读时对照比较。第四十四页,共七十三页,2022年,8月28日统计表的典型形式婚姻、性别与时装购买选择分布表时装购买选择男性女性小计已婚未婚小计已婚未婚高档时装中档时装抵挡时装1712191301251641014655291692031087513590946818被调查者人数520390130480300180第四十五页,共七十三页,2022年,8月28日统计表的结构从形式上看:统计表总标题写在表的上端中部横行标题写在表的左方纵栏标题写在表的上方指标数值写在交叉对应处从内容上看:统计表主词列在横行标题的位置宾词列在总栏标题的位置第四十六页,共七十三页,2022年,8月28日统计表的设计
必须遵循科学、实用、简练、美观的原则。统计表形式的设计应设计成由纵横交叉组成的长方形表格,长宽之间应保持适当的比例。表上、下两端的端线应以粗线或双线绘制,其他线条应以细线绘制,左右两端均不划线。横行合计应列在最后一行,纵栏合计应列在最前一栏。第四十七页,共七十三页,2022年,8月28日
统计表内容的设计总标题应用简练而又准确的文字表述统计资料的内容。主词和宾词之间必须遵守相互对应的原则。各主词或宾词之间应当按时间的先后、数量的大小、空间的位置等自然顺序编排。指标数值的计量单位应按规定标注。第四十八页,共七十三页,2022年,8月28日
统计表制表技术要求文字工整、字迹清晰、数字对齐。统计数字部分不应留有空白。对需要特殊说明的统计指标和数据,应在表下加注说明。第四十九页,共七十三页,2022年,8月28日第五十页,共七十三页,2022年,8月28日第五十一页,共七十三页,2022年,8月28日第三节统计图
统计图是以圆点的多少、直线的长短、曲线的起伏、条形长短、柱状高低、圆饼面积等图形来陈示调研数据。统计图的制作:手工制作和计算机制作。统计图的种类:线图、条形图、直方图、圆面图、饼图、环行图、动态曲线图、散点图等第五十二页,共七十三页,2022年,8月28日线图概念:以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况适用资料:连续性资料第五十三页,共七十三页,2022年,8月28日线图
第五十四页,共七十三页,2022年,8月28日直方图1.概念:以各矩形的面积来代表各组频数的多少。2.适用资料:连续变量的频数分布。3.绘制要点
ⅰ坐标轴:横轴代表变量值,要用相等的距离表示相等的数量。纵轴坐标要从0开始。
ⅱ各矩形间不留空隙。
ⅲ对于组距相等的资料可以直接作图;组距不等的资料先进行换算,全部转化为组距相等的频数,用转化后的频数作图。第五十五页,共七十三页,2022年,8月28日直方图
第五十六页,共七十三页,2022年,8月28日直方图
第五十七页,共七十三页,2022年,8月28日柱状图
第五十八页,共七十三页,2022年,8月28日条形图1.概念:用等宽直条的长短来表示各个相互独立的指标大小的图形。
2.适用资料:相互独立的资料(资料有明确分组,不连续),计数资料
3.分类:分为单式和复式两种。单式适用于只有一组观察资料,复式适用于有若干组观察资料。
第五十九页,共七十三页,2022年,8月28日条形图
第六十页,共七十三页,2022年,8月28日柱状图
第六十一页,共七十三页,2022年,8月28日柱状图
第六十二页,共七十三页,2022年,8月28日柱状图第六十三页,共七十三页,2022年,8月28日散点图
第六十四页,共七十三页,2022年,8月28日折线图
第六十五页,共七十三页,2022年,8月28日
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024施工联营协议合同范本:装配式建筑构件生产3篇
- 二零二五年度企业办公家具定制与安装服务合同3篇
- 2025年度智能家居系统安装与售后服务合同9篇
- 二零二五年度2025版网络技术研发劳务协议范本2篇
- 2025版家庭保姆薪酬福利合同3篇
- 2024年门窗安装工程承包合同标准模板版B版
- 2024版xx发电机技术协议
- 二零二五年度吊装服务与工程监理合同3篇
- 2024年桥梁检测高空作业委托合同
- 2025版高层管理人员保密协议与信息安全保护合同6篇
- 股权招募计划书
- 创业之星学创杯经营决策常见问题汇总
- 公猪站工作总结汇报
- 医学专业医学统计学试题(答案见标注) (三)
- cnas实验室规划方案
- 新教材苏教版三年级上册科学全册单元测试卷
- 胶囊内镜定位导航技术研究
- 温病护理查房
- 职工心理健康知识手册
- 11396-国家开放大学2023年春期末统一考试《药事管理与法规(本)》答案
- 天津市四校2022-2023学年高二上学期期末联考数学试题(原卷版)
评论
0/150
提交评论