《传播学研究方法》导论_第1页
《传播学研究方法》导论_第2页
《传播学研究方法》导论_第3页
《传播学研究方法》导论_第4页
《传播学研究方法》导论_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元统计分析 华中科技大学社会学系社会统计学导论华中科技大学社会学系第一节 统计学漫谈思考:统计学是干什么的?它与我们的工作与生活有什么联系?华中科技大学社会学系一、为什么学习统计?台湾辅仁大学的谢邦昌教授指出:“When you analyze any topic, you are involved in statistics”一位资深的海外统计学家说:“统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。”华中科技大学社会学系不列颠百科全书中指出:“统计学是收集、分析、表述和解释数据的艺术与科学。”最近美国对统计学所下的定义是:“Statistic

2、s is the science for learning from data”华中科技大学社会学系生动的统计学红楼梦作者考证众所周知,红楼梦一书共120回,自从胡适作红楼梦考证以来,一般都认为前80 回为曹雪芹所写,后40 回为高鹗所续。然而长期以来这种看法一直都饱受争议。能否从统计上做出论证?华中科技大学社会学系从1985 年开始,复旦大学的李贤平教授带领他的学生作了这项很有意义的工作 研究思路:一般认为,每个人使用某些词的习惯是特有的。他们创造性的想法是将120 回看成是120个样本,然后确定与情节无关的虚词出现的次数作为变量,巧妙运用数理统计分析方法,看看哪些回目出自同一人的手笔。之所

3、以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的。华中科技大学社会学系李教授用每个回目中47 个虚词(之,其,或,亦;.:呀,吗,咧,罢.;可,便,就.等)出现的次数(频率),作为红楼梦各个回目的数字标志。利用多元分析中的聚类分析法进行聚类,果然将120回分成两类,即前80 回为一类,后40 回为一类,很形象地证实了不是出自同一人的手笔。华中科技大学社会学系之后又进一步分析前80 回是否为曹雪芹所写这时又找了一本曹雪芹的其它著作,做了类似计算,结果证实了用词手法完全相同,断定前80回为曹雪芹一人手笔,是他根据石头记写成,中间插

4、入风月宝鉴,还有一些别的增加成分。华中科技大学社会学系而后40回是否为高鹗写的呢?论证结果推翻了后40 回是高鹗一个人所写,而是曹雪芹亲友将其草稿整理而成,宝黛故事为一人所写,贾府衰败情景当为另一人所写等等。这个论证在红学界轰动很大,李教授他们用多元统计分析方法支持了红学界的观点,使红学界大为赞叹。华中科技大学社会学系关于CPI消费者物价指数(Consumer Price Index),英文缩写为CPI,是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。如果消费者物价指数升幅过大,表明通胀已经成为经济不稳定因素,央行会有紧缩货币政策和财政政策的风险

5、,从而造成经济前景不明朗。因此,该指数过高的升幅往往不被市场欢迎。华中科技大学社会学系例如,在过去12个月,消费者物价指数上升2.3%,那表示,生活成本比12个月前平均上升2.3%。当生活成本提高,你的金钱价值便随之下降。也就是说,一年前收到的一张100元纸币,今日只可以买到价值97.7元的货品及服务。一般说来当CPI3%的增幅时我们称为通货膨胀;当CPI5%的增幅时,就是严重的通货膨胀。华中科技大学社会学系(2007年8月)25日是国家统计局北京调查总队CPI调查员的“采价日”,40名调查员走访了全市600多个调查点,记录下千余种商品的价格。这也是该部门首次面向公众解读CPI的采集过程及计算

6、方式。统计局首次公布 CPI采集计算方式 华中科技大学社会学系鲜菜采价时间为上午 上午10时左右,调查员柳淑敏来到朝内南小街菜市场。她不时停下来询问各种蔬菜、水果的价格。问了几家之后,她就走到角落里,将问到的价格一一记录在物价调查卡片上。“如果让卖菜的看到我在记价格,他们会以为我是搞调查的,可能就不说真实价钱了。”据柳淑敏介绍,由于蔬菜等鲜活商品的价格一天内会数次变动,“早上刚出摊时最贵,晚上收摊时便宜”,所以统计部门要求调查员基本在上午时间采价。据国家统计局北京调查总队消费价格调查处处长赵超美介绍,有的菜市场和商场卖家并不开实价,所以统计部门要求调查员不能只是询问商品价格,有时还要“讨价还价

7、”,记录下真实的成交价。 华中科技大学社会学系鲜活商品5日一问价 赵超美称,居民消费价格指数包括食品、衣着等8大类消费品。每类消费品下又有不同分类,每个分类中有1至25个用以采价的商品,也就是“代表规格品”,国家统计局要求特大城市的代表规格品不少于600种,目前北京市有1493种,每年会做相应调整。 华中科技大学社会学系另外,有些市民不理解CPI中为什么不包含房价。赵超美表示,房价不计入CPI是国际惯例。房屋属于一次购买、多年使用的商品,与当年的消费价格指数计算不能同步。 赵超美说,调查点采集价格每月汇总一次,输入计算机,按规定程序计算出当月的CPI。对于与居民生活密切相关、价格变动频繁的鲜活

8、商品,每5日采价一次,一般性商品每月采价2至3次。华中科技大学社会学系记者:目前我国的CPI计算方法是从何时起采用的? 赵超美:我国从1951年就开始编制CPI了,那时叫“职工生活费用价格指数”,1994年更名叫“居民消费价格指数”。计算方法一直在调整,目前的这套计算方法是从2001年开始采用的。 国家统计局从成千上万种商品和服务项目中选出263种基本分类,各省市自行确定代表规格品,结合各种商品和服务项目价格变动对总指数的影响程度,根据一系列固定公式计算出最终的CPI。 华中科技大学社会学系记者:CPI中八大类消费品所占的比重是怎样的?赵超美:北京CPI中权数最大的是食品类,占28.5%,居住

9、类占11.5%,居住类及其他各类占多大权数不是任意确定的,都是根据“居民家庭用于各类商品和服务开支在所有消费品和服务开支中所占的比重”计算的。 价格的高低不等于价格指数的高低华中科技大学社会学系记者:居民反映实际物价涨幅比CPI要高得多,为什么会这样? 赵超美:价格与价格指数不同,价格是绝对数,指数是相对数,价格的高低不等于价格指数的高低。按月发布居民消费价格指数,一般拿上月、上年同月、上年同期来对比,而居民往往用目前价格与多年前的价格进行比较,感受就有所不同。 华中科技大学社会学系记者:猪肉前段时间涨幅在五成以上,为何CPI反映出来只涨了2.1%? 赵超美:CPI是个平均数,反映的是价格总水

10、平的变动趋势和程度。如果将它与某类价格变动相比较,就忽略了个体与总体的差异。例如北京市食品类价格7月同比上涨了9.9%,猪肉类同比上涨了64.2%,“确实很高,但并不能以偏概全,用猪肉指数代替总指数。”目前价格变动呈现明显的结构性特征,也就是食品价格上涨,移动电话机、轿车、电视机价格下降。 华中科技大学社会学系其他收视率中国作家财富排行榜大学排名学科排名华中科技大学社会学系其他你们班同学是否认为你很帅?女生比男生语言能力强,数学能力差城市女性赡养父母增多新农村建设取得丰硕成果华中科技大学社会学系思考(2005年6月)连日来,一些媒体争相传播一项调研结果:“中国离婚率已超日本韩国,与新加坡同属亚

11、洲离婚率较高的国家”。 之前,一些报纸和网站也不断有诸如“广东去年近10万人离婚”、“上海离婚增20倍”、“中国离婚率将以每年二百万对的速度递增”等消息。什么原因?对此大家有什么看法?华中科技大学社会学系这些消息引起了世人对中国离婚率的深切忧虑,有人甚至将离婚率上升的主要原因归咎于第一代独生子女心智不成熟、对待婚姻“草结草离”。 华中科技大学社会学系中国离婚率飙升?专家称统计方法不符国际标准中国婚姻家庭研究会常务理事徐安琪指出:中国离婚率没有如此之高,有关部门统计方法与国际标准不符华中科技大学社会学系民政部综合计划司、婚姻管理司关于离婚率计算方法研讨结果的报告(1988年9月29日) 8月30

12、日召开了由15名统计、法律、婚姻、人口专家参加的离婚率计算方法研讨会参加会议的专家认为,目前国际、国内对离婚率的计算方法不一,无法对比,使用不便,因此确定一个科学的、可行的、国内外认可的离婚率计算方法十分必要。他们对国内外现行的各种计算方法进行了分析、比较和研究,阐明了各自的见解。基本上有两种倾向性意见。华中科技大学社会学系第一种意见:离婚的次数与总人口的比率。采用这种计算方法,大多数专家认为比较实际一是目前国际国内用的比较多,已成为一定的规范,联合国人口手册、联合国统计年鉴发布的离婚率都是采用这种计算方法,国内社会学词典、统计学词典以及民政部统计指标函义也是按此原理解释的二是有一定的可行性、

13、可比性。在社会生活中,人均国民生产总值、老年人口比率、出生率、死亡率、结婚率等,都是以总人口作为分母计算的,国家之间、地区之间能够相比,指标之间也能比较三是简便好懂、易采集数据。华中科技大学社会学系第二种意见:离婚次数与配偶健在的已婚夫妇对数的比率。这两者之间有内在的、必然的联系,具有科学性,但采集数据困难,目前人员素质和国家财力达不到。决定暂用第一种计算方法。即在一定时期内或按所给的年份,每一千人中离婚的数字。分母是总人口,分子是离婚次数,表示方法是千分率。其计算公式为:某年离婚次数某年离婚率某年平均总人口数华中科技大学社会学系徐安琪认为,有关部门公布和计算离婚率的方法值得质疑一些媒体公布的

14、最新调研报告是依据北京市统计年鉴公布的数据得出的结论,但年鉴中只有在民政部门登记离婚数5810对、法院离婚案结案数32946对的数据,因此,一般人就以为2002年北京市的离婚总数为以上两项相加共38756对。实际上,法院的离婚结案数还包括撤诉、调解和好和判决不准离婚数,如果将这些未被准予离婚的结案数去掉后,实际准予离婚数将减少1万多对。华中科技大学社会学系另外,还有一些地方统计将离婚“对数”改为离婚“人数”据徐安琪介绍,联合国国际人口学会编著的人口学词典对粗离婚率界定为“某一时期离婚件数与该时期平均人口数之比”,但一些地方公布的离婚率都是以该年的离婚人数作分子除以年平均人口,以致中国的离婚率一

15、直被人为地翻了一番,不少人口学和社会学者的文章中都因此得出大陆的离婚率高于日本、韩国、新加坡等亚洲国家和香港、台湾地区,以至引起社会对中国离婚率失控的忧虑。华中科技大学社会学系徐安琪指出:按照联合国人口统计年鉴统一规范的粗离婚率的国际标准,即年内离婚总数与年平均人口的比率,中国的粗离婚率刚过1,不及日本、韩国的二分之一,同时,新加坡的离婚率低于日本和韩国,更谈不上亚洲最高上海的离婚率自1980-2000年20年中粗离婚率增长了7倍,不是20倍,目前居全国第三而广东近年的离婚数仅为五至六万,离婚率始终低于全国平均数,排序第20位以后。华中科技大学社会学系再思考:中国近年来离婚率飙升的问题摆事实,

16、讲道理不能急于下判断华中科技大学社会学系二、统计学可能存在的误区数据可以有误或作假统计方法(有意或无意)使用不当可以误导。有低级误导和高级误导。常识判断和直觉是重要的在运用统计学工具时要以相关学科的知识为基础,以定性分析为前提。华中科技大学社会学系三、统计学素养与统计学精神1、重视事物的数量特征(用数据说话)华中科技大学社会学系2、相对性至上(不要把话说绝)统计的一个重要但又往往不易为人所理解的特点是统计从来不绝对地说“是”或者“不是”。统计只能够说可能,而且往往提供某事可能发生的概率。华中科技大学社会学系3、重视不确定性华中科技大学社会学系4、不要随意下判断、做结论大胆假设,小心求证统计需要

17、的是科学式的怀疑和发展的思维方式而不是顺从、盲从和服从也不能用固定的眼光来看自己和世界华中科技大学社会学系思考统计学精神与社会学精神不轻信、不盲从、不瞎说华中科技大学社会学系第二节 统计学概述统计学是应用数学的一个分支利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考华中科技大学社会学系一、统计学的发展历程统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文 statis

18、ta (国民或政治家)德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。 华中科技大学社会学系它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而

19、属于数学的范畴。 华中科技大学社会学系1、 “城邦政情”(Matters of state)阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根华中科技大学社会学系2、“政治算数”(Political athmetic)阶段 与“城邦政情”阶段没有很明显

20、的分界点,本质的差别也不大。 “政治算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。 1690年英国威廉配弟出版 (政治算数)一书作为这个阶段的起始标志. 威廉配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉配弟的(政治算数)被后来的学者评价为近代统计学的来源,威廉配弟本人也被评价为近代统计学之父。华中科技大学社会学系3、“统计分析科学”(Science of statistical analysis)阶段 在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。 十九世纪末,欧洲大学开设

21、的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程.当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。 “统计分析科学”课程的出现是现代统计发展阶段的开端. 1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。华中科技大学社会学系现代统计学的代表人物首推比利时统计学家阿道夫凯特勒(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任

22、何科学的一般研究方法. 现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。华中科技大学社会学系二、统计学历史中的学派(一)、统计学的创立时期 统计学的萌芽产生在欧洲。17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。 华中科技大学社会学系1、国势学派 国势学派又称记述学派,产生于1

23、7世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼康令和阿亨华尔康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授政治活动家应具备的知识阿亨华尔在格丁根大学开设“国家学”课程,其主要著作是近代欧洲各国国势学纲要,书中讲述“一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务华中科技大学社会学系因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础

24、随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。华中科技大学社会学系2、政治算术学派 政治算术学派产生于19世纪中叶的英国,创始人是威廉配第(1623-1687),其代表作是他于1676年完成的政治算术一书。这里的“政治”是指政治经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础马克思说:“威廉佩第政治经济学之父,在某种程度上也是统计学的创始人。” 华中科技大学社会学系政治算术学派的另一个代表人物

25、是约翰格朗特(1620-1674)他以1604年伦敦教会每周一次发表的“死亡公报”为研究资料,在 1662年发表了关于死亡公报的自然和政治观察的论著书中分析了60年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注他的研究清楚地表明了统计学作为国家管理工具的重要作用。 华中科技大学社会学系(二)统计学的发展时期 18世纪末至19世纪末是统计学的发展时期。在这时期,各种学派的学术观点已经形成,并且形成了两个主要学派,即数理统计学派和社会统计学派。 华中

26、科技大学社会学系1、数理统计学派 在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19世纪中叶,把概率论引进统计学而形成数理学派奠基人是比利时的阿道夫凯特勒(1796-1874)主要著作有:论人类、概率论书简、社会制度和社会物理学等他主张用研究自然科学的方法研究社会现象,正式把古典概率论引进统计学,为数理统计学的形成与发展奠定了基础。华中科技大学社会学系2、社会统计学派 社会统计学派产生于19世纪后半叶,创始人是德国经济学家、统计学家克尼斯(1821-1889),主要代表人物主要有恩格尔(1821- 1896)、梅尔(1841-1925)等人他们融合了国势学派与政治算术学派的观点,

27、沿着凯特勒的“基本统计理论”向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立华中科技大学社会学系(三)20世纪迅速发展的统计学 1、由描述统计向推断统计发展。描述统计是对所搜集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,如编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述推断统计,则是在搜集、整理观测的样本数据基础上,对有关总体作出推断其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断目前,西方国家所指的科学统计方法,主要就是指推断

28、统计来说的。 华中科技大学社会学系2、由社会、经济统计向多分支学科发展。在20世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。华中科技大学社会学系3、统计预测和决策科学的发展传统的统计是对已经发生和正在发生的事物进行统计,提供统计资料和数据20世纪30年代以来,特别是第二次世界大战以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了很大发展,使统计走出了传统的领域而被赋予新的意义和使命。华中科技大学社会学系4、信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一步得到发展和日趋完善5、计算技术和一系列新技术、新方法在统计领域不断得到开发和应用6统计在现代化管理和社会生活中的地位日益重要华中科技大学社会学系三、统计学分支华中科技大学社会学系第二节 社会统计学基本特点1、注重应用(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论