我们身边的统计学第一讲_第1页
我们身边的统计学第一讲_第2页
我们身边的统计学第一讲_第3页
我们身边的统计学第一讲_第4页
我们身边的统计学第一讲_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

我们身边的统计学第一讲1第一页,共六十二页,编辑于2023年,星期六课程内容以案例为主介绍统计学基本知识;运用统计知识观察分析身边的现象。2第二页,共六十二页,编辑于2023年,星期六课程要求学会运用统计学知识,观察身边的经济现象或社会现象,搜集相关数据,进行统计分析。完成一篇小论文写作。3第三页,共六十二页,编辑于2023年,星期六希望你们做到的:1、遵守课堂纪律;2、按时完成作业;3、有疑问欢迎举手提问;4、对教学方面的建议可写信反映:hymnyou@4第四页,共六十二页,编辑于2023年,星期六论文写作观察生活,找出具有因果关系的经济或社会现象,搜集数据建立回归模型进行分析。要求:(1)主题清晰,论述科学,结论有用;(2)数据真实,样本个数尽可能多;(3)论文字数不少于2000字;(4)分析至少包括描述统计、相关分析、回归分析(5)自由组队,1-6人一组;(6)第三次课起交。从第四次课起,陆续挑选优秀论文上台报告,并进行适当加分。5第五页,共六十二页,编辑于2023年,星期六论文一般框架研究背景理论分析与研究假设研究设计实证结果结论与讨论6第六页,共六十二页,编辑于2023年,星期六引例今天,你小资了吗?什么是小资?概念清晰小资一般为都市白领,在社会中有一定的地位和财富,又与“中产阶级”相差一定距离——主要在经济方面。

怎样才算小资?评价标准和指标体系一个真正的“小资”必须具有一定的生活品位、思想水准和艺术鉴赏能力7第七页,共六十二页,编辑于2023年,星期六【文学】

海明威、福克纳、马尔克斯、卡夫卡、普鲁斯特、豪尔赫·路易斯·博尔赫斯、卡尔维诺、昆德拉、村上春树、徐志摩、曹雪芹等。【音乐】古典音乐、爵士乐、西方流行音乐、电子休闲音乐、新世纪音乐、世界音乐、中国传统音乐等。【生活情趣】咖啡、家居、红酒、茶、笔记本电脑等。

8第八页,共六十二页,编辑于2023年,星期六【旅游】丽江、西藏、马尔代夫共和国、欧洲、澳洲等【时装】不求最贵,但求自我风格。【外语】至少精通英语,通晓日语、法语、德语等更好。要有TOEFL,GRE,雅思等有效分数。【科技】懂得充分利用互联网作为工作、生活的工具。9第九页,共六十二页,编辑于2023年,星期六什么决定小资?影响因素分析收入、学历、性别、工作等等我小资了吗?建立Logistic判别模型将自身相关因素代入模型进行判断10第十页,共六十二页,编辑于2023年,星期六怎样将上述问题进行数量分析呢?第一步,提出问题明确小资的定义(外延与内涵)建立小资的评价标准(区分真小资与伪小资)第二步,搜集数据问卷访问或网上调查或其他方式一定数量的样本及相关资料调查内容包括两大部分:1、评价指标(包括生活品位、思想水准和艺术鉴赏能力等等);2、个人背景资料。11第十一页,共六十二页,编辑于2023年,星期六第三步,数据分析与讨论通过评价指标,区分出真小资(取值为1)与非小资(取值为0)估计回归模型:分析哪些因素为关键因素,哪些不是?进行预测:将自身因素代入上述模型,比如收入水平、教育水平、生活特点等变量。12第十二页,共六十二页,编辑于2023年,星期六第一讲如何获得统计数据一手资料:通过访问调查获得;首要问题:问卷设计。二手资料:年鉴资料:《中国统计年鉴》、《中国城市统计年鉴》、《中国金融年鉴》等;相关网站:中国统计局;中国人民银行;国际货币基金组织;各地政府部门等;专业数据库:中经网;WIND数据库;CSMAR数据库;CCER数据库;锐思数据库;聚源数据库。13第十三页,共六十二页,编辑于2023年,星期六如何进行问卷设计?14第十四页,共六十二页,编辑于2023年,星期六15第十五页,共六十二页,编辑于2023年,星期六表头主体表尾问卷第一印象很重要!16第十六页,共六十二页,编辑于2023年,星期六调查问卷的设计在问卷调查中,问卷设计是非常重要的一个环节,它决定了市场调查的成功与否。

1、问卷的功能能正确反映调查目的和具体问题,突出重点,能使被调查者乐意合作,协助达到调查目的。能正确记录和反映被调查者回答的事实,提供正确的情报。格式统一的问卷还便于资料的统计和整理。17第十七页,共六十二页,编辑于2023年,星期六2、问卷的组成部分一份正式的调查问卷一般包括以下三个组成部分:

第一部分:前言。主要说明调查的主题、调查的目的、调查的意义,以及向被调查者表示感谢。第二部分:正文。这是调查问卷的主体部分,一般设计若干问题要求被调查者回答。第三部分:附录。这一部分可以将被调查者的有关情况加以登记,为进一步的统计分析收集资料。18第十八页,共六十二页,编辑于2023年,星期六3、问卷设计中的问题(1)语言不规范。语言的问题很多,但主要还是设计者使用语言不规范。在问卷调查中,我们不能使用学术化语言,也不能用官方语言,我们的语言必须贴近被调查者的生活。如有这样的问题:

您家属于以下哪种类型:

1)核心家庭2)单身家庭3)联合家庭4)主干家庭5)其他这样的问题就是明显的专业词汇的不合适运用。

19第十九页,共六十二页,编辑于2023年,星期六(2)问题带有倾向性。问卷中的问题必须保持中立,不能提问带有倾向性的问题。如:

动物保护很重要,你认为有进行动物保护的必要吗?

1)有2)没有3)说不清这样的问题是不应该出现在问卷中的。

20第二十页,共六十二页,编辑于2023年,星期六(3)问题引起回答者的焦虑。如有这样的问题:

你有没有在自然保护区内狩过猎?

1)有2)没有

这样的问题容易引起回答者的焦虑,因为大部分人都知道保护区是不准狩猎的。这个问题可以这样问:

在保护区狩猎是很普遍的事,你的情况是?

21第二十一页,共六十二页,编辑于2023年,星期六(4)一题多义。一个问题只能提问一个方面的情况,否则容易使回答者不知如何作答。如:

你和你的配偶的文化程度是:

1)小学及以下2)初中3)高中4)大专及以上这个问题就是一个题同时问两个人的情况,是让回答者不能回答的。

22第二十二页,共六十二页,编辑于2023年,星期六(5)问题笼统。这是调查中存在的较多的问题。如有这样的问题:

您对吸烟有害健康的了解情况是:

1)很了解2)了解3)一般

4)不太了解5)不了解23第二十三页,共六十二页,编辑于2023年,星期六我们对吸烟害处了解程度的衡量应该有一个标准,一般的处理方式是用量表,即用相关的多个问题来综合测量。如:你了解什么是二手烟吗?吸烟最会容易引起哪种疾病?你了解烟草中对人体危害的化学成分吗?24第二十四页,共六十二页,编辑于2023年,星期六(6)题支设计不合理。这包括设计的答案不穷尽、问题相同或处于同一维度等。如:

您家庭收入的主要来源是:

1)土地收入2)打工收入这个问题的答案就是题支没有穷尽,因为还有比如工作收入、生意收入、股票收入等。

25第二十五页,共六十二页,编辑于2023年,星期六4、问卷设计的一些技巧(1)问题顺序的排列。问卷的问题不应是杂乱排列的,应该有一定的顺序:从易到难:把简单易懂的问题放在前面,把复杂的问题放在后面,这样容易得到被调查者的配合,使被调查者感到问题好回答;从一般性到特殊性:一般性问题放在前面,特殊性问题放在后面;从感性到理性:先问行为方面的问题,再问态度、观念性问题;26第二十六页,共六十二页,编辑于2023年,星期六此外,把能引起被调查者兴趣的问题放在前面,把枯燥的问题放在后面;同类问题放在一起,这样回答者容易回答;开放性问题,即完全由被调查者自己回答,没有备选答案的问题放在后面。

27第二十七页,共六十二页,编辑于2023年,星期六(2)题支可以设计成半封闭半开放式即在备选题后再加一项“其他”并要求选这一项的回答者说出内容。这样可以弥补设计时的遗漏,而且我们在调查中往往会遇到我们预料不到的情况,所以半开放式问题给了我们空间。28第二十八页,共六十二页,编辑于2023年,星期六如何看待调查数据?29第二十九页,共六十二页,编辑于2023年,星期六统计调查误差评价统计调查质量的优劣,主要的评价标准之一是调查数据的准确性,常用调查误差的大小来反映。按调查误差的性质和产生的原因划分,统计调查误差可分抽样误差和非抽样误差。30第三十页,共六十二页,编辑于2023年,星期六抽样误差,指样本无法完全代表总体,由此产生的误差。它只存在于抽样调查中,它不能完全避免,但可以有效控制;非抽样误差则存在于任何形式的调查中,比如填写错误、样本重复或丢失而产生误差、被调查者提供不实数据而产生的计量误差。31第三十一页,共六十二页,编辑于2023年,星期六抽样的原理很简单:用足够大的样本数量、样本抽取的随机性来保证样本对总体的代表性,但这有时并不容易做到。样本的选择,有时会有偏差,使得样本很片面地“代表”着总体。这种偏差,可能出自无心,也可能出自有意。32第三十二页,共六十二页,编辑于2023年,星期六例1

1936年美国大选:罗斯福vs.阿尔夫1936年预测美国总统大选预测机构:美国《文学文摘》杂志预测方法:抽样调查、民意调查样本选择:从1000万个电话用户和《文学文摘》的订户中随机抽样调查预测结果:阿尔夫以370:161的比例胜过罗斯福33第三十三页,共六十二页,编辑于2023年,星期六实际结果呢?——罗斯福胜出!预测失败原因:1936年时有能力安装电话、订《文学文摘》的人在经济上较为宽裕,不能很好代表美国社会各阶层。并不是样本越多就越能反映总体,关键在于所选择的样本能多大程度代表总体。34第三十四页,共六十二页,编辑于2023年,星期六再看一例:1984年11月,里根与孟代尔竞选美国总统。盖洛普、哈里斯及国家广播公司三家民意调查社在前三个月所做调查的统计分析,里根分别可获得大约58%,54%,及60%的选票。正式选举的结果:里根约获59%选票,而孟代尔约获41%选票。35第三十五页,共六十二页,编辑于2023年,星期六此次美国所有的民意调查的预测数字与其选举结果最多只有5%的误差,但被调查的选民最多不超过3000人,可见统计的技巧是多么神奇!假使当年尼克松总统相信统计的话,大可以拨出一笔款来,委托民意调查公司做类似的统计调查、分析,假公济私一番!实在不必派人潜入水门民主党总部偷取文件,做出卑鄙的事来,结果反而弄得自己身败名裂,鞠躬下台,何苦来哉。36第三十六页,共六十二页,编辑于2023年,星期六例2

你相信网络投票结果吗?2006年,北京某报纸举行“中国最美50人”网络投票评比活动。37第三十七页,共六十二页,编辑于2023年,星期六例3耶鲁学生身价几何?美国《时代》杂志:“耶鲁大学学生毕业25年后一般年收入251,112美元。”2006年,美国平均收入3.68万美元25万美元意味着它进入了收入金字塔结构的上层38第三十八页,共六十二页,编辑于2023年,星期六分析这是一个平均数毕业25年后,没人能获得所有毕业生的数据,所以,这是一群样本单位数据的平均数。这个抽样的样本有足够的代表性吗?这个样本由哪些人组成?显然,是由调查者能获得联系地址、并肯回答调查问卷的人组成。这些人有代表性吗?39第三十九页,共六十二页,编辑于2023年,星期六“地址不详”的迷途小羔羊,会是事业上很成功的人吗?不太得志的学生,愿意回答、或如实回答自己的薪酬水平吗?结论:这是一个采用有偏样本的调查,其结论并不可信。40第四十页,共六十二页,编辑于2023年,星期六案例4

统计陷阱——献血有助长寿有研究声称:献血有助长寿!采样:找两个样本组:一组是经常献血者,另一组是没有任何献血记录者,比较他们的寿命,到底谁活得长?发现:经常献血者的平均寿命高于无献血者结论:献血有助长寿!讨论:(1)这个调查有问题吗?(2)有的话,问题出在哪里呢?41第四十一页,共六十二页,编辑于2023年,星期六调查案例42第四十二页,共六十二页,编辑于2023年,星期六许多新闻机构常举办民意调查,探询人们对某些议题的意见。这类民意调查每年都持续进行,但到了选举前才特别受重视。这其中以盖洛普民意调查最为出名。盖洛普公司由美国著名的社会科学家乔治·盖洛普博士于1930年创立,是全球知名的民意测验和商业调查/咨询公司。

案例1:民意调查43第四十三页,共六十二页,编辑于2023年,星期六盖洛普民意调查方案总体:18岁以上的美国居民样本:从总体中选出且经过电话访谈的人,其人数在1000-1500之间标志:各个受访者对某项政策的态度(赞成、中立或反对)指标:全部受访者对某项政策持有的一般态度:持赞成、中立或反对意见的各占全部受访者的比例44第四十四页,共六十二页,编辑于2023年,星期六“市场调查”是为了了解消费者的喜好及产品的使用情况。市场调查中的一个著名例子是“尼尔森媒体研究”做的电视收视率调查服务。尼尔森收视率影响广告商愿意花多少钱来买某节目的广告,以及该节目播不播下去。案例2:电视收视率45第四十五页,共六十二页,编辑于2023年,星期六对于尼尔森全国电视收视率调查来说:总体:所有1亿有电视机的美国住户。样本:约5000个住户,住户同意使用“个人收视记录器”来记录该户中每个人收视的节目。所记录的变量包括住户中的人数与他们的年龄及性别、电视机开着的时段、以及电视机开着时,是谁在看,看什么节目。标志或变量:每个住户看某节目的时间长度。指标:全部住户看某节目的平均时间。46第四十六页,共六十二页,编辑于2023年,星期六央视2009春晚收视率各省区分布

辽宁88.9%;黑龙江85.3%;北京73.2%;河北70.2%;天津68.8%;山西68.6%;山东68.4%;宁夏67.7%;甘肃64.2%;内蒙古63.8%;陕西61.5%;河南59.2%;新疆55.4%;安徽24.8%;湖北19.3%;江西18.7%;江苏18.6%;贵州18.4%;上海17.4%;四川16.5%;云南14.7%;湖南14.1%;浙江13.9%;福建12.2%;广东5.3%;广西2.6%;海南1.3%。对于全国绝大多数城市,某个节目有超过5%的观众在看,已属于高收视率。47第四十七页,共六十二页,编辑于2023年,星期六春晚广告收入2002年2亿元,2006年接近4亿元,今年春晚已经超过6亿元。春晚的广告包括硬广告和软广告。硬广告是每年央视春晚广告收入的重头戏,而软广告则植入于春晚的节目中。48第四十八页,共六十二页,编辑于2023年,星期六相声《我有点晕》表演者:姜昆、戴志诚这个相声里面体现的植入式广告有三个:1、招商银行

2、百度

3、动感地带,这个稍微有点隐晦,是用动感地带的一句宣传语体现的。49第四十九页,共六十二页,编辑于2023年,星期六2009年央视春晚最贵的广告在整点报时期间。美的电器企业以4800多万元的价格买下20时和零时两个整点报时的广告环节。2009年的贺电拜年,共有20家公司,每家公司都需要支付1000万元的广告费用。“我最喜爱的春晚节目评选”由四川郎酒集团斥巨资赞助,赞助费用为5600多万元人民币。

50第五十页,共六十二页,编辑于2023年,星期六2009年春晚露脸最多的企业百度公司第一次露脸:百度向全国人民拜年!第二次露脸:百度“新年贺词”贺年榜第三次露脸:姜昆戴自成的相声《有点晕》台词:“以前上图书馆,现在百度一下”第四次露脸:给了李彦宏镜头,大约有5次51第五十一页,共六十二页,编辑于2023年,星期六1996年,名不见经传的山东秦池酒厂在中央电视台黄金时段广告竞标中,以6666万元的高价争得“标王”。然而,在1995年,秦池酒厂实现利税仅为3588万元

;1997年,在中央电视台举办的第三届广告竞标中,秦池酒厂开出了3.2亿元的“天价”,夺得97年的“标王”。案例3:广告标王的陨落——都是广告惹的祸52第五十二页,共六十二页,编辑于2023年,星期六在“央视标王”光环的笼罩下,秦池酒厂一夜成名,秦池白酒身价倍增,产量迅猛扩张。中标后不到两个月,秦池就签订了销售合同4亿元;头两个月秦池销售收入就达2.18亿元,实现利税6800万元,相当于秦池酒厂建厂以来前55年的总和。当年,国内一家资产评估机构曾将秦池估值10亿元以上。53第五十三页,共六十二页,编辑于2023年,星期六董事长姬长孔宣称:“1995年,我们每天向中央电视台开进一辆桑塔纳,开出的是一辆豪华奥迪。今年,我们每天要开进一辆豪华奔驰,争取开出一辆加长林肯。”在付出3.2亿巨额费用之后,严重的资金不足使得秦池捉襟见肘。为了保证市场需求,秦池盲目增加生产线扩大生产规模,不仅资金无法正常周转,更无力进行技术创新、产品结构调整。54第五十四页,共六十二页,编辑于2023年,星期六为了解决产能不足,秦池集团收购大量的散酒,勾兑成低度酒销往全国市场。1997年底,秦池销售收入比上年减少了3亿元;2002年,秦池的销售额为3819.1万元,只有1996年9.6亿的1/30,利润一栏是“零”。今天,秦池酒厂仍然在维持生产,当年的辉煌却已是过眼云烟。55第五十五页,共六十二页,编辑于2023年,星期六标王陨落名单:第一届标王——“孔府宴酒,叫人想家”,最后自己连家也没有,以“零价品牌”转

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论