一何为法律实证研究_第1页
一何为法律实证研究_第2页
一何为法律实证研究_第3页
一何为法律实证研究_第4页
一何为法律实证研究_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1主讲:赵臣臣2一、实证研究理论解析(一)何为法律实证研究(二)变量分类(三)统计方法二、实证研究应用(一)平台操作(二)变量梳理讲座提纲实证性研究方法可以概括为通过对研究对象大量的观察、实验和调查,获取客观材料,从个别到一般,归纳出事物的本质属性和发展规律的一种研究方法。其一要有研究所依之论据材料的经验性,其二研究方法是经验观察和量性分析,其三研究所论证之一般性判断的可证性。研究材料这一点许多学者都有所掌握可说模仿。但实证研究与现象分析、评述或说资料堆砌间的区别在于,实证研究是以形成经验性命题为研究目的的,而且其研究目的是具可证性的。这一研究目的的差异可以说是其三者间区别的关键点。定义:所谓法律实证分析,是指按照一定程序规范对一切可进行标准化处理的法律信息进行经验研究、量化分析的研究方法。法律实证分析≠实证法或法律实证主义应用范围:论文论证与大型课题研究科研结果质的飞跃:用数据说话:“我认为”→“结论是”能够反映两个层次的问题:第一个层次是用描述统计的方法计算出反映数据集中趋势、离散程度和相关强度的具有外在代表性的指标;第二个层次是在描述统计基础上,用推断统计的方法对数据进行处理,以样本信息推断总体情况,并分析和推测总体的特征和规律。3(一)何为法律实证研究?知道速度V,走过的路程是x,所花时间是y

路程等于时间乘于速度4(二)常用变量(Variable)简介收集数据之前,必须首先了解数据的种类。数据涉及到变量的取值,通常用变量的取值来描述数据。了解以下几种变量有助于选择适当的统计分析方法作实证研究。按作用划分因变量:如果一个变量由其他变量来描述,该变量为因变量或反应变量。自变量:如果一个变量与其他变量一起用于描述因变量,该变量为自变量或预测变量。自变量是“原因”,而因变量就是“结果”,自变量和因变量有时是相互的根据测量尺度划分:根据变量测量精度不同,变量由低到高划分为·定类变量

·定序变量

·定距变量

·定比变量5定类变量又称名义(nominal)变量。它的取值只代表观测对象的不同类别,例如“性别”变量、“职业”变量等都是定类变量。定类变量的取值称为定类数据或名义数据。定类数据的特点是用不多的名称来加以表达,最常用来综合定类数据的统计量是频数、比率或百分比等。定序变量又称为有序(ordinal)变量、顺序变量,它的取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如,“学历”变量的取值是:1—小学及以下、2—初中、3—高中、中专、技校、4—大学专科、5—大学本科、6—研究生以上。由小到大的取值能够代表学历由低到高。最适合用于综合定序数据取值的集中趋势的统计量是中位数。(二)常用变量(Variable)简介6定距变量又称为间隔(interval)变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。例如,“年龄”变量,其取值60与20相比,表示60岁比20岁大,并且可以计算出大40岁(60-20)。定距变量的取值称为定距数据或间隔数据。定距数据是一些真实的数值,具有公共的、不变的测定单位,可以进行加减乘除运算。定距数据的基本特点是两个相同间隔的数值的差异相等。例如,年龄的60岁与

50岁之差等于40岁与30岁之差。对于定距数据,不仅可以规定“等价关系”以及

“大于关系”和“小于关系”,而且也可以规定任意两个相同间隔的比值或差值。如果将每个数值分别乘以一个正的常数再加上一个常数,即进行正线性变换,并不影响定距数据原有的基本信息。因此,常用的统计量如均值、标准差、相关系数等都可直接用于定距数据。(二)常用变量(Variable)简介7定比变量又称为比率(ratio)变量,是区别同一类别个案中等级次序及其距离的变量。定比变量除了具有定距变量的特性外,还具有一个真正的零点,因而它具有乘与除(×、÷)的数学特质。例如年零和收入这两个变量,固然是定距变量,同时又是定比变量,因为其零点是绝对的,可以作乘除的运算。如A月收入是60元,而B是30元,我们可以算出前者是后者的两倍。智力商数这个变量是定距变量,但不是定比变量,因为其0分只具有相对的意义,不是绝对的或固定的,不能说某人的智商是0分就是没有智力;同时,由于其零点是不固定的,即使A是140分而B是70分,我们也不能说前者的智力是后者的两倍,只能说两者相差70分。因为0值是不固定的,如果将其向上移高20分,则A的智商变为120分而B变成50分,两者的相差仍是70分,但A却是B的2.4倍,而不是原先的两倍了。定比变量是最高测量层次的变量。当前的社会学研究所应用的统计方法还很少要求达到定比变量这一测量层次。(二)常用变量(Variable)简介8一般定类变量和定序变量用于描述定性数据,属于定性变量;而定距变量和定比变量用于描述定量数据,属于定量变量。同其他分类标准一样,一个变量在不同分析中可当作不同尺度的变量。例如,“年龄”在某些分析中(如回归分析)当作定距变量,而在另外一些分析中(如方差分析)可通过分组作为定类变量处理。(二)常用变量(Variable)简介对收集到的有关数据资料进行整理归类并进行解释就不得不用到统计学的几种常用方法。在接下来的操作中我们会以交通肇事类案件的分析为示例,讲解以上七种统计分析方法的使用。9(三)常用统计方法介绍单变量频次分析单变量频次分析是针对单个变量按照变量取值类型来统计每个取值类型出现的次数。卡方分析通过卡方检验,来分析变量不同取值是否对个数产生影响。回归分析回归分析显示了多个自变量对一个因变量综合影响情况。描述(演绎)性统计描述分析是针对数值型变量(定距变量)进行简单的归纳分析,来描述数据的状况,称之为描述性统计。交叉分析分析两个分类变量之间是否独立的一种统计分析方法。方差分析当需要检验某一个分类变量是否会因为不同的取值而导致一个数值型的因变量的取值发生不同的变化时,我们通过单因素方差分析来观察分类变量对因变量的影响。实证研究平台:自定义报表指统计报表的主词(行变量)、宾词(列变量)及统计项由用户自行选择,程序根据用户选择自动生成报表的一项功能。10一、实证研究理论解析(一)何为法律实证研究(二)变量分类(三)统计方法二、实证研究应用(一)平台操作(二)变量梳理讲座提纲11使用指南数据两种填充方式:系统自带:导入课题资源系统数据至“我的课题”→统计分析数据上传:逐条添加:新建课题→逐条自添数据→统计分析批量上传:上传本地数据至“我的课题”→统计分析自添数据和上传本地数据都需要按一定数据模板结构制作,才能有效导入,进行分析。而生成固定模板,需要先设定变量,模板则是根据预设的变量生成的。操作步骤:登录——新建课题——新建表——变量设置——数据制作——统计分析OR登录——导入资源数据——变量选择——自动生成表——统计分析了方便理解,我们结合实证研究平台,把实证研究分解成了以下步骤,首先说确定课题,然后对我们想要研究的变量进行设置,然后根据设置的变量确定选取相关的素材,然后对这些数据进行整理,并对这些数据根据设置的变量情况进行统计分析。最后再用统计的结果去进行实证研究分析。法律实证研究流程理想状态是全样本分析,但是实际中只可能抽样分析,只要抽样合理得当,一样能得到认可。点击"我的课题"导航,进入我的课题列表页14实证研究平台首页点击"新建"按钮,进入新建课题页;点击"维护"链接,进入课题修改页(与新建课题页相同,是对新建课题时填写的内容的修改);提示框关闭,我的课题列表刷新为删除后的列表,点击取消,提示框关闭,列表无变化。点击"详细"链接,进入课题详细页;点击"统计分析"链接,进入统计分析页;默认状态为不公开,状态为“个人”的课题,点击“公开”链接,状态变化为“待审核”,链接名称变化为“取消公开”,若管理员审核通过的,状态变化为“公开”,链接变化为“取消公开”,公开的课题会同时出现在课题资源公开课题资源列表中。取消公开不需要管理员审核。选中列表中的一条或者几条记录,点击删除按钮,弹出提示框:"确定要删除选中记录吗?"点击确定,提示框关闭,我的课题列表刷新为删除后的列表,点击取消,只提示框关闭,列表无变化。“我的课题”列表页范例1:交通肇事罪量刑及赔偿金额研究接下来,建表,进行变量设置。图1是我的课题列表页,在列表区中,点击“详细”,进入图2课题详细页点击图2课题详细页中的"新增"按钮,弹出表设置页新建表入口图1图2在本页面中输入内容,点击保存按钮,表设置页关闭,课题详细页刷新,如下图。表信息备注点击操作栏中的“变量明细”,弹出变量明细页。为选中的表新建字段,进行变量设置。可继续新增,建立多张表。变量设置入口输入变量名称,设置变量类型和变量字典后,点击变量列表左侧的添加按钮,一个变量就设置好了,全部变量设置好后,点击保存按钮,完成变量设置。如,变量名称栏输入“案号”,选择变量类型-文本型,点击变量列表框左侧的“添加”,数据呈现在列表框中。再继续添加变量”自首“,选择类型—定类型,设置变量字典,值内只能输入数字,进行描述,点右侧添加可以继续添加字典,一个值代表一个特定意义。设置完变量后点击”保存“。变量设置点击操作栏中的“数据导入”,弹出数据导入框,选择将本地数据上传导入表内,或者选择系统数据。如何上传数据?因为导入的excel表中的字段必须与之前变量设置页添加的变量、及变量的类型一致,格式不一致是无法成功导入数据的。不一致会弹出提示框:你选择的文件格式错误。一致就会有成功导入X条数据的提示。所以保持一致最简单的方法是点击”数据导出“,通过课题详细页中的导出模板功能,导出含有变量的excel至本地,然后在本地根据变量及变量类型添加数据导入进来。第一种方法——自添、上传实际上,自添数据上传的话需要先预设变量,再导出模板,再数据添加,上传。导出模板打开excel表,显示之前预设的变量,我们自添数据,保存,再本地上传数据。导出模板还有一种数据来源,将课题资源数据(系统数据)导入“我的课题”进行统计分析,选择”系统数据“,点击”确定“后,出现下图。选择左侧列表树中的”刑事裁判文书资源“第二种方法——直接导入系统数据选择结案主罪名——交通肇事罪,进行检索,出现以下记录,再选中”导入检索结果“,点击”导入我的课题“检索结果导入选择”已有课题“,交通肇事罪研究,点击下一步选择导入课题用户应在待选表中选中表的名称及表的字段,通过添加按钮,将选中的表名称、表字段添加到已选表中,若已选表中表名称、表字段有错误,用户可选中该数据,通过删除按钮将其删掉。选取导入字段在已选列表选择了表及字段,用户点击导入,就会显示以上提示框,成功导入多少条数据。用户可在课题详细页查看,导资源中的数据,选择字段,相当于重新建立了新表。导入成果接下来进行统计分析,从课题列表页,点击“统计分析”进入统计分析单变量频次分析是针对单个变量按照变量取值类型来统计每个取值类型出现的次数。比如我们需要分析交通肇事者的年龄分布情况,则可以针对交通肇事类案件犯罪人的年龄或者年龄段的频次分析,本示例中以年龄段作为统计字段,统计交通肇事类案件中不同犯罪年龄段的犯罪人人数各为多少,也即十四岁以上不满十六岁、十六岁以上不满十八岁、十八岁以上不满二十五岁、二十五岁以上不满六十岁、六十岁以上各为多少人。课题中式针对犯罪人的年龄段进行统计分析,则在待选变量区中选中“年龄段(人)”将其添加到分析变量中即可。分析变量设置完毕后,点击分析按钮,即可查看交通肇事类案件中各年龄段案件数量的统计结果。单变量频次分析分析结果说明:(1)变量说明:示例中的分析变量为犯罪人年龄段,则变量说明中为年龄段的字典及其对应序号。(2)分析结果:此部分是统计分析中的核心内容,里面记载了本次分析的全部成果,包括样本数据的抽取频次(指多少个样本数据符合当前年龄段),所占权重(指符合当前年龄段的数据量占样本数据总量的百分比)等,频次列前的数字与变量说明中年龄段取值的序号相对应,在示例分析结果中可以看到交通肇事类案件犯罪人年龄段的分布情况及其具体比例。(3)统计图:默认状态下为饼图,显示每一年龄段的数据值相对于总值的大小。百分比:是指各频数占总样本数的百分比。有效百分比:是指各频数占总有效样本数的百分比。这里的有效样本数应等于总样本减去缺失样本数。有效百分比能更加准确地反映变量的取值分布情况。积累百分比:指有效百分比逐级累加起来的结果。单变量频次分析结果描述分析是针对数值型变量(定距变量)进行简单的归纳分析,来描述数据的状况,称之为描述性统计。描述性统计通过求和、平均值、方差、标准差、众数、中位数、标准误差、观测数、最大值、最小值、第K大值、第K小值、峰度、偏度、区域(全距)、置信度等指标对数据的集中性、分散性、对称性、尖端性进行描述,归纳数据的统计特性。比如我们要针对法院在罚金方面的量刑进行分析,则可对案件中的罚金字段进行描述性分析,统计所有案件中法院判处罚金的平均值、最大值、最小值等数据。具体操作步骤如下:课题中是针对罚金进行统计分析,则在待选变量区中选中“罚金数额(人)”将其添加到分析变量中即可。分析变量设置完毕后,点击分析按钮,即可查看交通肇事类案件中罚金数额各项统计值。注意的是,有个描述统计设置,点击后是下图效果。描述分析平均置信度:简而言之,可以理解为调查结果的可信程度。95%是通常情况下置信度的设定值。33描述统计设置分析结果说明:平均值:为算术平均值,我们在日常学习中最常用到的平均值。标准误差:是对一组测量数据可靠性的估计。标准误差小,测量的可靠性大一些,反之,测量就不大可靠。中位数:是一组数据,依大小排列时的中间一个数,当样本数为偶数时,中位数为N/2与1+N/2的均值。众数:是一组数据中出现次数最多的数值,能代表绝大多数情况的数字。方差:是一组数据据内,每个数与平均数的差数的平方和的算术平均数。标准差:标准差等于方差的算术平方根。方差和标准差描述一组数据的差异情况和离散程度的统计量。方差或标准差越小,表明数据的离散程度越小,数据分布越集中整齐;反之,方差或标准差越大,表明数据离散程度越大,数据分布越参差不

齐。峰度:通常要假设样本的分布属于正态分布。偏度衡量的是样本分布的偏斜方向和程度;而峰度衡量的是样本分布曲线的尖峰程度。一般情况下,如果样本的偏度接近于0,而峰度接近于3,就可以判断总体的分布接近于正态分布。峰度是描述某变量所有取值分布形态陡缓程度的统计量。如果峰度数值等于0,说明分布为正态;如果峰度数值大于0,说明分布呈陡峭状

态;如果峰度值小于0,则说明分布形态趋于平缓。偏度:偏度(Skewness)是描述某变量取值分布对称性的统计量。偏度数值大于零,说明分布呈现右偏态;如果偏度数值小于零,说明分布呈左偏态。区域:最大值与最小值的区间?最大值:样本中出现的罚金金额最大的数值。最小值:样本中出现的罚金金额最小的数值。求和:样本中出现的罚金总和观测数:纳入统计的有效样本数量。描述分析结果卡方分析:通过卡方检验,来分析变量不同取值是否对个数产生影响。比如是否因为性别的不同会导致犯罪人人数不同,比如是否因为审级的不同是否会导致案件数的不同。卡方分析p>0.05

无显著差异0.01<p≤0.05有显著差异

p≤0.01有极其显著差异卡方分析结果是指当需要检验某一个分类变量是否会因为不同的取值而导致一个数值型的因变量的取值发生不同的变化时,我们通过单因素方差分析来进行分类变量对因变量的影响判断。比如我们要分析法院判决的刑期在多大程度上会受到罚金与否的影响,则可针对“有期徒刑刑期”和“罚金”两个字段进行方差分析。具体操作步骤如下:在待选变量区中选中将其添加到“罚金”将其添加到行变量中,选中“有期徒刑刑期”,添加到列变量即可。分析变量设置完毕后,点击分析按钮,即可查看交通肇事类案件中是否有罚金对刑期的影响的分析结果。方差分析观测数:纳入统计的有效样本数量。方差分析结果回归分析显示了多个自变量对一个因变量综合影响情况,并给出被选入的多个自变量能够多大程度上解释因变量的变化,每个自变量的回归系数是多少,每个自变量对因变量是否存在显著的影响,影响的方向和大小是多少。比如我们要分析被害人人身伤害类型等多个因素对刑期的综合影响情况,即可针对这些字段进行多元线性回归分析。具体操作步骤如下:在待选变量区中选中“人身伤害类型_死亡数量(人)”、“人身伤害类型_重伤数量(人)”、“人身伤害类型_轻伤数量(人)”、“人身伤害类型_轻微数量(人)”、“罚金数额(人)”,将这些字段添加到行变量中,将“有期徒刑刑期(人)添加到列变量中即可。分析变量设置完毕后,点击分析按钮,即可查看交通肇事类案件中以上多个变量对刑期是否存在显著的影响,影响的方向和大小是多少。回归分析回归分析结果是分析两个分类变量之间是否独立的一种统计分析方法。交叉分析是分析两个分类变量之间是否独立的一种统计分析方法。我们需要分析是否为未成年人与判决结果类型的关联性,则可在待选变量区中选中“情节-未成年人”,添加到行变量框中,选中“判决结果类型”,添加到列变量框。交互分析这种方法固然好,但是它存在一定的局限性。它最大的一个问题就是:假定其他关系不存在,只是一个自变量与一个因变量之间的交叉分析。比如它只分析婚姻是否成败和文化程度的关系,但是我们都知道婚姻的成败与否不仅仅与文化的程度有关系,它还和很多其他因素有关系。但是在交互分析中,它假定排除其他所有因素的影响,仅仅考虑文化教育程度与婚姻成败的关系,所以这个分析过程和结论在一定意义上是失真的。因为它将其他的有关系的因素全都屏蔽,这样就不能描述不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论