社会统计学笔记_第1页
社会统计学笔记_第2页
社会统计学笔记_第3页
社会统计学笔记_第4页
社会统计学笔记_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

创作时间:贰零贰壹年柒月贰叁拾日第一章科学方法与社会研究历程之吉白夕凡创作创作时间:贰零贰壹年柒月贰叁拾日1·社会学研究:就是运用科学的方法来采集和剖析社会事实,以理解社会现象之间的关系。2·科学研究:就是运用客观的、逻辑的和系统的方法来采集事实及剖析事实。3·社会学研究的整个历程,大概上能够分为三个阶段:(1)筹划,(2)履行,(3)总结。4·初步探究步伐:(1)采集有关的文件,(2)咨询那些对研究的题目有经验、有知识的人,进行认识,(3)察看个案。5·假定:就是依据我们对问题的认识,假定现象与现象之间的关系。就是假定某一现象的更改与另一种现象的更改拥有某种关系。假定的方式:函数式(要求变项之数值有高低之分)、差异式(不存在高低之分)6·较为常常使用的研究方式:实验法、社会检查法。(皆可考证假定)①实验法的逻辑:存心的改变A变项,而后看看B变项能否随着更改;假如B变项明显是跟着A变项的更改而更改,就说明A变项对B变项有影响。②社会检查法特色:在研究过程中不改变社会现状,只求就地取材,而后以统计方法计算变项与变项之间的关系。创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日7·能够有效地考证假定的实验法称为典型或理想实验法8·社会检查法能够分为两大类:一是表达性检查(要点是报道社会事实,较少剖析社会事实(即变项)之间的因果关系),一是解说性检查(目的是要证明分歧的变项之间能否有因果关系)。9·全体检查:就是从所有研究对象中采集资料。抽样检查:就是从全体的研究对象中科学的抽出一个数目较少的样本,而后据此样本的资料推论全体的状况。10·个案研究:就是选择一个或几个个案(即研究对象),作深入的接触和察看,目的是对所研究的问题作深入的认识。11·横剖研究:指的是在同一时期采集资料,目的是理解各样社会现象(即变项)在某时期的有关状况的研究。纵贯研究:是指在分歧时期采集的,目的在认识社会现象(即变项)在分歧时期中的改动状况的研究。12·纵贯研究分为两种:趋向研究、同组研究(指的是在分歧时期检查同样的样本)。同组剖析的问题:丢失个案的问题。同组研究要求检查同样的个案,但在第一次检查的样本可能在第二次检查时一部分已丢失。13·指标归并方法:种类法、指数组成法、尺度法①种类法:是将各指标交互分类。②指数组成法:是用简洁而合理的公式,来综合各指标。创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日③尺度法:是据各指标之间的关系来计算总值,使研究对象高低有序。14·个人变项:以个人为研究对象的变项。集体变项:以地域或集体为研究单位的。15·区群错误:以集体研究单位研究的出的结论推论到以个人为研究单位时所犯的错误。微体错误:以个人为研究单位,把研究结论推及于集体或整个社区时所犯的错误。16·定类条理:是指变项的值只好把研究对象分类,即只好决定研究对象是同类抑或分歧类,拥有=与/=的数学特质。定序条理:就是能确立值的序次,即变项的值能把研究对象摆列高低或大小,拥有>与<的数学特质。定距条理:就是能确立值与值之间的距离,即变项之值与值间的距离是能够知道的,因此拥有加与减的数学特质。定比条理:最高的测量条理,其数值中的零是绝对的、固定的,因此除了上边讲的特质以外,也拥有乘与除的数学特质。17·界定母体:就是清楚说明研究对象的范围,即所研究的人物、时间和地址。18·统计方法分两类:表达统计法(帮忙简化资料的方法)、推论统计法(就是依据抽样拿出的资料推论出母体的状况)。19·试点研究:即抽取若干研究对象来试验整套计划能否可行。20·采集资料的方法:接见、察看和档案资料。创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日固定答题:是由研究员早先设计了若干可能的答案,由答者选择。自由答题:就是让答者跟着自己的意思回答,研究员不供给可能的答案。优弊端比较:固定答题的利处是便于统计剖析,但所供给的答案纷歧定适合。自由答题的利处,是让答者充分表达他的意思,较为正确,但答者可能啰嗦和花式众多,接见时费时间且剖析起来也不简单。察看法:就是以耳闻目击的方式,实地认识研究对象的行为。察看法分为:介入察看法和非介入察看法。①介入察看法:就是研究员要介入所研究的活动,从而获得资料,其身份仿佛一位情报员。②非介入察看法:就是研究员的身份是旁观者。21·整理资料时,一般分为两步:校正(就是检查所采集的资料有没有错)、编码(把资料作简洁的记录和分类)。22·测量效度:是指所得的资料能否与测量的目标相符合。测量信度:是指用同样的方法重复测量变项时的资料能否符合。信度高不等于效度高,由于重复的测量所得的资料,即便是符合的(信度高),却可能是重复的错误(效度低)。第二章简化一个变项之散布1·集中趋向测量法:就是找出一个数值来代表变项的资料散布,以反应资料的集结状况。意义在于能够依据这个代表值(或创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日称典型值)来预计或展望每个研究对象(即个案)的数值。①众值:就是次数最多的值。(以长久来说,以众值做展望所犯的错误总数是最小的)②中位值:就是在一个序列的中央地点之值,即高于此值的有50%的研究个案,低于此值的也有50%。(长久来说,以中位值去预计定序变量的数值,所犯的错误总数是最小的)③均值:将变项的各个数值相加,求取一个均匀的数值。(长久来说,以均值预计定距变项的资料,错误最小)2·失散趋向测量法:是要求出一个值来示意个案与个案之间的差别状况。①离异比率:就是非众值的次数与所有个案数目的比率。②质异指数:其作用是求出各个类型之间在理论上最多的可能差别中实质上出现了多少差异。③四分位差:是将个案由低至高摆列,而后分为四个平分,则第一个四分地点的值与第三个四分地点的值的差异。3·失散趋向测量法与集中趋向测量法是有互补作用的。二法并用,就能够一方面知道资料的代表值,有助于预计和展望的工作,另一方面能够知道资料的差异状况,反应预计或展望时会犯的错误。4·尺度正态散布:以尺度差为单位的正态散布。均值是0,尺度差是1第三章简化两个变项之散布创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日1·有关:是指一个变项的值与另一个变项的值有连带性。换言之,假如一个变项的值发生更改,另一个变项的值也有更改,则两个变项就是有关了。正有关:是指一个变项的值增添时,另一变项也增添。负有关:是指一个变项的值增添时,另一变项的值却减少。2·分歧错误称关系:X影响Y,而Y不会影响X。对称关系:不确立或不划分影响的方向。3·交互分类:同时依照两个变项的值,将所研究的个案分类。列联表:综合了两个变项的共同散布的统计表。条件次数表的弊端:难于比较分歧条件下的次数散布,这是由于作为基数的边缘次数的值各不同样。所以,为求相互比较从而知道两个变项间的关系,就一定将各个基数尺度化。将所有基数都酿成100,各个条件次数就随而变为百分率。4·在拟订条件百分表时的准则:每个表的顶端要有表号和题目。绘表时所用的线条,要尽可能简短。在表上层的自变项每个值之下的%号,示意以下的数值都是百分率。表基层括弧内的数值,示意在计算百分率时所依据的个案总数。表内百分率数值的小数位要保留多少,视乎研究的需要,但最好是有一致性。以自变项作为计算百分率的方向,是社会学研究的老例。但是,也有例外的状况:假如依变项在样本内的散布不克不及代表其在整体内的散布,则百分率的计算要依据依变项的方创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日向。5·有关测量法:就是以一个统计值示意变项与变项之间的关系。这个值,往常称为有关系数。第四章有关测量法与测量条理1·Lambda有关测量法,又称为格特曼的可展望度系数,基本逻辑是:以一个定类变项的值来展望另一个定类变项的值时,如果以众值作为展望的准则,能够减少多少偏差。Lambda有关测量法的特色是:以众值作为展望的准则,不睬会众值以外的次数散布。2·级序有关法的基本逻辑是要求出:依据任何两个个案在某变项上的等级来展望他们在另一个变项上的等级时,能够减少的偏差是多少。同序对:某对个案在两个变项上的相平等级同样。异序对:若果不同样则称为异序对。3·肯德尔的tau系数的基本逻辑:计算同序对数与异序对数之差在所有的可能对数中所占的比率。4·斯皮尔曼rho系数的特色:是在计算每个个案在两个变项上的等级时,不只要差异二者的高低差异,并且还要计算二者差异确实切数值。基本逻辑:求出在最大可能的等级差异总值中,实质的等级差别所占的比率是多少。统计值是由-1到+1,其均匀值有PRE性质。创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日5·简单线性回归剖析法:依据一个直线方程式,以一个自变项的数值来展望一个依变项的数值。目的:是要找出一个错误最小的方法来展望依变项的数值。回归系数b的大小,就示意X对Y的影响有多少。假如b=0,示意X对Y没有影响,即X变但Y不变。假如b值越大,就暗示X更改时所惹起的Y更改愈大。b值有正负之分:假如是正当就示意X对Y有正向成效,即X增大,Y也增大;假如是负值就示意X对Y有负向成效,即X增大,Y却减少。值是示意自变项对依变项的影响的大小和方向。它是一个剖析分歧错误称关系的统计法。6·积矩有关系数r与b系数的分歧:r系数假定X与Y的关系是对称的,并且r的统计值是由-1到+1,同时r的平方值拥有PRE性质。这个r平方值,称为决定系数。系数的意义:r系数所要示意的,就是以线性回归方程式作为展望的工具时所能减少的偏差比率。所以,假如r系数值愈大,就示意线性回归途式的展望能力愈强。7·有关比率(eta平方系数):是以一个定类变项为自变项,以一个定距变项为依变项。它是依据自变项的每一个值来展望或预计依变项的均值。Eta系数由0到+1,其平方值拥有PRE性质。8·划分系数(又称theta系数)其基本逻辑:依据各个个案在定类变项上所属的类型来预计他们在定序变项上的相平等级,故创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日此时属于分歧错误称有关的测量法。其系数值是由0到+1,没有PRE性质。第五章抽样与统计推论1·统计值:从样本上当算出来的数值参数值:在整体中的数值。代表性样本:样本的统计值近似整体的参数值,这个样本能够称为代表性样本。2·抽样步伐:①界定整体(整体的定义,愈清楚愈好。有样本所得的研究结果,原则上只好推论到这个所界定的整体范围);②采集所有名单(一定审查其完好性和正确性);③决定样本的大小(决定样本大小的一般准则:依据所能付出的研究代价的最大限度抽取最大的样本);④选用样本个案;⑤在采集资料以后,评估样本之正误。3·抽样能够分为:随机抽样法与非随机抽样法,前者是跟着必定的几率来抽样,后者则不受几率的限制。二者之中,只有随机抽样法可作统计推论。非随机抽样法:立意抽样法;偶遇抽样法;定额抽样法。①立意抽样法(判断抽样法):是依照研究员的主观看法和判断,选用他以为是典型的个案。②偶遇抽样法(方便抽样法):是选用一些有时遇到的个案为样本。③定额抽样法:是依据某些尺度将整体分组,而后用立意或偶遇创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日抽样法由每组中选用样本个案。4·随机抽样法的特色:是依据已知的几率来抽取样本个案。①简单随机抽样:它要求每个个案被选用的时机是同样的。②系统随机抽样:第一将所有个案摆列起来,按抽样比率分红间隔,并在第一个间隔内选用第一个个案,而后每经一个间隔就选用一个个案。周期性偏差:当我们每隔若干个案便抽取一个时,这些被抽取的个案可能拥有某种特色,与不被抽取的个案有所分歧。解决方法:经过若干间隔此后,再用随机方式抽取个案,以新的次序代替本来的次序。③分层随机抽样:定比分层随机抽样;异比分层随机抽样。定比分层随机抽样:第一将整体按某些尺度分组,而后在每组中依照同样的比率用简单随机或系统随机抽样法选用个案。异比分层随机抽样:在分歧的组顶用分歧的比率来抽样。(假如在整体中某些组的个案数目特别少,按同样比率抽取的样本个案就会极少,致使影响统计剖析的正确性,此时采纳异比分层随机抽样)④集体抽样法:即随机的抽取若干集体,而后以它们所包括的全部个案作为研究的样本。评论:集体抽样的利处是代价小。特别合用于大规模的抽样调查。但是,以集体作为抽样的单位,所犯的抽样偏差会比较大,样本的代表性往常是比不上用简单或分层随机抽样法。一创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日般来说,假如每个集体内的各个个案之间的差异较小,而集体与集体之间的差异较大,则集体抽样法所犯的偏差会较大。相反的,假如集体内差异大,而集体间差异小,则抽样偏差会较小。⑤多段抽样:即先抽取若干集体,而后从所选用的集体中再抽取若干较小的单位。5·抽样散布:是依据几率的原则而建立的理论性散布,显示由同一整体中频频不断抽取分歧样本时,各个可能出现的样本统计值的散布状况。6·均值的抽样散布的特色:①假如样底细当大,则抽样散布靠近正态散布;②抽样散布之均值就是整体之均值,抽样的散布的尺度差称为尺度偏差。7·统计推论分为:参数预计和假定检定参数预计:依据一个随机样本的统计值来预计整体之参数值是对少。假定检定:第一假定整体的状况是如何的,而后以一个随机样本的统计值来查验这个假定能否正确。参数预计与假定检定,固然都是用来作统计推论,但在逻辑上略有分歧:前者是先看样本状况才问及整体的状况,后者则先构想整体的状况,而后才进行抽样和检定原来的假想能否正确。第六章参数值的预计1·点值预计:以一个最适合的样本统计值来代表整体的参数值。创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日2·间距预计:以两个数值之间的间距来预计参数值。至于间距的大小,就要取决于我们在预计时所要求的可信程度是多少。在样本大小同样的状况下,假如要求的可信度愈大,则间距就会愈大。这个间距往常称为“可信间距”间距的大小与可信度的高低成正比。3·可信度已经确立的前提下,提升间距预计的精准性的方法是加大样本容量。由于跟着样本容量的加大,S/√n将渐渐变小,所以间距预计的间距也渐渐变小,而精准度则渐渐加大。第七章假定检定:均值与百分率1·研究假定:假定在整体中存在某些状况,如假定X与Y是有关的。与研究假定相对峙的假定,在统计学上称为虚无假定。检定假定的基根源基础则:直接检定虚无假定,因此间接地检定研究假定,目的是清除抽样偏差的可能性。2·否认域:抽样散布内一端或两头的小地区,假如样本的统计值在此地区范围内,则否认虚无假定。3·明显度:示意否认域在整个抽样散布中所占的比率,也即示意样本的统计值落在否认域内的时机。明显度愈小,便愈难否认虚无假定,也即愈难证明研究假定是对的。4·甲种偏差:是指否认虚无假定,但实质上虚无假定是对的错误可能性。创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日乙种偏差:是指不否认虚无假定,但实质上虚无假定是分歧错误的错误可能性。甲种偏差与乙种偏差是对峙的,成反比的。5·统计法的检定力:是指该统计法能够正确的判断虚无假定的正误之能力。参数检定法的特色:是要求整体具备某些条件。非参数检定法(散布自由检定法)特色:不要求整体数值具备特别的条件。6·检定假定的步伐:①依据研究假定建立于其对峙的虚无假定。明确检定的目的就是要否认虚无假定,从而知道研究假定是对的可能性;②选择适合的检定统计法,并要列举其假定或要求;③确立抽样散布;④决定明显度,并依照研究假定的性质采用一端或两头检定,而后从抽样散布中求出否认域的地点和大小;⑤依据样本的资料计算检定值,从而作出决议。7·假定的检定的基本逻辑:先建立虚无假定,从而以此为基础来确立抽样散布。若是我们所抽取的一个随机样本中的均值,在以虚无假定为基础的抽样散布中出现的时机是很小的,那就理应否认虚无假定,改而接受研究假定。8·自由度:是指有多少个个案的数值能够任意改动。第八章假定的检定:两个变项之有关1·预期次数(e):是指在整体中两个变项没有关系的话,表内没格所应有的次数。简而言之,表内每格的预期次数(e),创作时间:贰零贰壹年柒月贰叁拾日创作时间:贰零贰壹年柒月贰叁拾日也就是相应的两个边缘次数的乘积除以样本的大小。2·单因方差剖析中的F检定其目的:是要计算在各组整体中的均值能否相等。3·异:有关测量法,目的是要理解两个变项在“样本”(随机与非随机样本均可)中的有关“强弱”程度。检定假定的方法,则是依据“随机”样本的资料来推论两个变项在“整体”中“能否”有关。检定假定方法的共同点是:只合用于随机样本,不克不及用于剖析非随机样本;其关怀的都是整体的状况,而不是样本的状况;目的都在认识在整体中能否有关,而不是有关的强弱程度。4·任何的假定检定法,都是样本愈大是愈简单否认虚无假定。两变项的测量条理有关测量法(PRE)假定的检定定类——定类λ,tau-yx2检定定类——定序G,dyZ检定或t检定定序——定序定类——定距EF检定或t检定定序——定距r,b定距——定距第九章详析模式与统计控制1·多变项剖析可依研究目的分为三大类:详析剖析;多因剖析;多项相互关系剖析。①详析剖析所关怀的是两个变项的关系,而引进其余变项的目的就是为了加深认识这两个变项的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论