法学大数据分析平台_第1页
法学大数据分析平台_第2页
法学大数据分析平台_第3页
法学大数据分析平台_第4页
法学大数据分析平台_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

法学大数据分析平台北京大学实证法务研究所北京法意科技有限公司目录一、研发背景 3二、产品介绍 4(一)产品定义 4(二)平台特点 4(三)平台价值 5(四)模块介绍 5三、服务流程 14四、应用价值 15(一)面向院校:提供新颖的科研建设支持 15(二)面向科研者:提供全面的科研方法论与工具支持 16(三)面向教师:提供新型的科研教学支持 16五、服务介绍 17六、联系我们 17

一、研发背景大数据的浪潮正席卷全球。何为大数据?最普遍的定义是“一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理”。大数据时代,法律信息呈现数量大、速率快、多样化、不稳定等特点,大数据正在挑战传统科研方式,向法学领域渗透,这意味着一场新的机遇和挑战。从统计学角度而言,大数据分析思路源于实证研究,两者均需要收集选取一定的研究样本进行分析,但相对于实证研究中的抽样样本方式,大数据更强调“大样本”甚至“全样本”,从而尽可能减少抽样误差,提高分析结果的精确度。但目前法学大数据分析研究实操过程中存在如下障碍:(1)大数据分析方法的推进是较缓慢的过程,尤其在理解和应用上均需以统计学知识做基础,对文科领域来说有点令人望而生畏,虽然目前大数据分析概念得到越来越多的认同,但人们仍存在不少误解,在适合进行大数据分析的法学领域中,分析方法的选用也很不充分。(2)大数据分析的对象通常是散落于各处的文本信息,而基于文本的量化分析,一直以来都是横亘于社会科学和统计学之间的一个难题。法学研究者在数据收集方面面临着同样的问题:单凭个人力量收集研究样本比较困难,耗时耗力。主要有以下原因:①已有的研究数据积累非常少;②即使有官方数据的存在,也非常分散,不易收集。③以研究者个人身份,导致数据的获取途径受限等等。(3)研究者在数据处理方面任务非常艰巨,包括数据采集、筛选过滤、各个变量的提取和量化、变量的重新定义和编码转换等等工作,面对海量数据,单个研究者很难独立完成一项研究。比如一项1000个样本、10个变量的数据整理,需要进行数据处理工作10000次。如此一来,投入数据整理的时间过多,学术课题的研究周期相应拖长。(4)大数据分析需要掌握变量设计的技术和一定的分析方法。分析框架设计和统计方法是一种思维方法和工具,作为大数据分析的基础工具,它能够在大量经验数据中发现事物的结构和规律,而中国法学界对这种技术和工具的掌握并不理想。为了解决这些障碍,北大法意结合多年法律数据库研发和信息技术应用经验,协同北京大学实证法务研究所,推出法律大数据分析平台,旨在为研究者提供主题构建、变量设计、数据收集、统计分析的一体化法学实证分析支持服务,使大数据分析理念得到更好的传播和更广泛的应用,将研究人员从大量的资料整理和统计工作中解放出来,加快科研进度,提升研究成果价值含量。北大法意秉承着“实践法的精神”,愿与各大法律院校、科研机构、政法行业共同在大数据时代中开辟法学研究新领域尽绵薄之力。北京大学实证法务研究所北京法意科技有限公司二、产品介绍(一)产品定义“法学大数据分析平台”是北京大学实证法务研究所和北大法意专门面向法学院校或相关科研机构、政法行业开发的,集课题资源收集、数据统计分析、科研成果共享等于一体的科研服务平台。平台根据法律院系及专业科研机构的实证分析需求,为研究者提供主题构建、变量设计、数据收集、统计分析的一体化法学实证分析支持服务,并为研究者全面掌握实证研究方法、解决研究组织管理和数据分析等难题,针对性提供实证研究的培训材料、精彩范例、文献成果、课题数据和分析工具。(二)平台特点1.灵活定制、便利高效平台提供主题分析定制服务及解决方案,根据研究者课题研究方向和主要内容,构建分析框架、进行变量设计、收集分析样本,并根据变量设置情况,选择合适的分析方法进行统计分析、提供分析结果、推断研究结论,有效解决研究者实证分析难题。2.数据权威、收录全面围绕研究者主题分析需求,收集主题下全样本,涵盖各级人民法院审理、发布的判决文书,包括刑事、民事、行政、海事海商、知识产权等各种案件类型,为大数据分析提供最权威、最全面的数据样本,研究者不必再为收集数据投入过多的人力和财力。3.精准专业、行业独创平台将实证分析方法与法律大数据有机结合,以裁判文书为视角,用图表形式呈现数据的集中趋势、离散程度、概率大小,以及变量之间的相关强度、决定系数等等,透射立法精神、把握案件特征及审判规律,从而为司法裁判、行为预测、法学研究提供依据。4.功能强大,简单实用平台内嵌独创的法律数据挖掘组件,利用信息技术手段对文本信息项进行拆解、提取、转化和整合等处理,同时将常用数据分析方法内嵌于平台,直接选择变量和统计分析方法,即可一键式生成多维度分析报告。5.精彩成果、多维展示根据主题特性,通过饼状图、条形图、柱状图、折线图等多样式图表集中展示不同主题下宏观、中观或微观层面的分析成果,并对每一分析成果的样本来源、分析字段和目的进行说明,便于用户浏览与引用。(三)平台价值1、利用强大、先进的信息采集技术,提供裁判文书、法律法规、统计数据等多种法律数据资源,解决课题数据收集问题;2、提供主题构建、数据收集、变量设计、统计分析的一站式法学实证分析支持服务,解决科研过程中研究框架设计及分析方法选择的难题,加快了科研进度,提升了研究成果价值含量;3、利用智能文书分析引擎技术,对文本信息进行拆解、提取、转化和整合等处理,解决研究者人工整理、分析数据耗时难题,将研究人员从大量的资料整理和统计工作中解放出来,能够有更多的时间进行思考。(四)模块介绍法学大数据分析平台由五个模块组成:成果展示、主题分析、统计数据、文献成果、研究方法。其中,成果展示和主题分析是平台两大核心模块。成果展示集中呈现不同主题下多维度分析成果,包括法意精彩范例和用户定制主题的分析成果展示。主题分析与成果展示中用户定制主题相对应,根据用户需求提供符合主题要求的样本数据、待分析变量、分析方法和工具,用户可在数据资源基础上进行二次研究和自助分析,得出分析结果。研究方法、统计数据、文献成果从实证分析方法和大数据分析成果应用角度为研究者提供方法论支持及研究思路和方向。1、成果展示成果展示包括法意范例、公开主题、我的主题三个子模块。法意范例来源于历年实证分析服务成果,从宏观、中观、微观等分析角度,以饼状图、条形图、柱状图、折线图等多样式图表展示不同主题研究的分析成果,并对每一分析成果的样本来源、分析字段和目的进行说明,帮助用户寻找、借鉴分析角度,从而拓展研究思路。公开主题为促进不同院校的研究者之间科研成果交流与共享而设置,通过公开主题的查看,可以了解其他研究者的科研动态及研究内容,进行信息交换与成果共享。我的主题以用户所属机构为单位对本机构定制主题的分析成果进行集中查询与管理,与主题分析中各定制主题相对应,对分析成果可查看、下载及公开。2、主题分析主题分析分为统计分析模拟和定制主题分析两个板块。统计分析模拟提供基础数据、常用变量、统计分析方法和实操平台,便于用户对当年数据样本的常用变量进行多维度统计分析实验。定制主题分析则以用户所属机构为单位,为本机构定制主题提供主题样本数据、分析变量、统计分析方法和实操平台,其主题与成果展示中我的主题相对应,一方面用户通过主题分析可对成果展示中的分析结果进行验证,另一方面用户可利用所提供的主题数据、变量进行二次研究,自行开展其他分析工作。统计分析模拟和定制主题分析均由通用资源(主题资源)、课题资源、统计分析、分析报告四部分组成,提供课题新建、编辑、删除、检索、查看,课题数据筛选、删除、清空,实证分析,分析报告保存、下载、打印等功能。主要业务逻辑是在当前主题下建立我的课题,从主题资源中筛选待分析数据到课题资源,选择不同的研究变量,根据变量的特性选择相应的实证分析方法对课题数据进行统计分析,对于分析结果可进行保存、下载和打印,并可进行数据回溯。在数据筛选阶段,系统提供高级检索和自定义检索两种检索方式,在统计分析阶段,系统提供的统计分析方法有:单变量频次分析、描述分析、自定义报表和统计图工具等。其中,主题资源提供的裁判文书,来源于全国各级人民法院审理、发布的判决文书,包括刑事、民事、行政、海事海商、知识产权等多方面的内容。用户提出意向研究的主题数据获取需求,由我们专业服务团队对需求进行分析和处理,利用先进的信息采集、处理技术,提取最符合需求且最全面的法律数据样本,保证用户真正实现法学大数据分析目标。课题资源库的数据来源于主题资源,用户可以根据研究需要,将一个主题分解为多个子课题的研究,从主题资源中选入数据到课题资源库。同时可对课题数据进行检索和剔除,进一步筛选数据样本,还可以对课题数据进行清空。主题资源和课题资源两个标签页的检索区均分为高级检索和自定义检索,这两种不同的检索方法可以方便用户快速查找案例数据。同时可以将课题数据查询策略保存为检索模板,方便查看和下次检索时直接应用。同时,课题资源功能区设置的“统计分析”功能,可对当前列表的数据样本进行统计分析。点击后,进入实证分析页,在下拉选项中逐层点击分析项引导树,选择待分析变量,即研究对象,再根据待选变量的特性,选择适当的统计分析方法,即可对课题资源当前列表中的数据样本的变量情况进行统计分析。分析方法有以下4种:单变量频次分析:是对单个变量按照变量取值类型来统计每个取值类型出现的次数。单变量频次分析结果中,表格行(横向)依次显示所选定类(定序)变量各字典(包括缺失样本数及合计、总合计),表格列(纵向)显示各类字典的频次、百分比、有效百分比、累计百分比等数值情况。描述分析:是针对数值型变量(定距变量)进行简单的归纳分析,来描述数据的状况,又叫描述性统计。描述性统计通过求和、平均值、方差、标准差、众数、中位数、标准误差、观测数、最大值、最小值、第K大值、第K小值、峰度、偏度、区域(全距)、置信度等指标对数据的集中性、分散性、对称性、尖端性进行描述,归纳数据的统计特性。描述分析结果中,表格行(横向)显示所选数值型变量,表格列(纵向)显示该变量的样本总数、全距、最小值、最大值、平均值、标准差等数值情况。自定义报表功能:是指程序根据用户选择的主词(行变量)、宾词(列变量)自动生成报表的一项功能。自定义报表分析结果中,表格样式根据用户所选择的主词和宾词确定,表格行(横向)显示所选主词,表格列(纵向)显示所选宾词,主词和宾词相交叉的单元格中显示统计的案件数量或人数,统计数字可点击,点击后弹出数据回溯页。统计图工具:与单变量频次分析类似,根据用户所选择的变量,以所选图形-柱形图、条形图、饼状图、折线图的方式显示该变量的案件数或人数。选择分析方法后,自动生成分析报表,可对分析结果进行保存、下载和打印。分析报告入口放置在我的课题列表操作列,只要是研究者保存过的分析结果都会被收录到这个模块中,供研究者随时调用。3.统计数据统计数据库主要收录权威机构发布的司法相关统计数据,包括综合、刑事、民事、经济、行政、海事海商、交通运输、执行、赔偿、告申信访、特别程序等11个方面的内容,便于用户在实证分析报告中直接引用其中的统计数据。数据主要来源于权威性组织机构的网站和刊物,如:最高法院网、最高检察院网、公安部、最高院公报以及中华人民共和国法律年鉴等。本库提供标题、统计年份和类型三种检索方式,在统计数据的年份范围方面,主要是从1981年至2013年的数据。用户可对资料进行检索、查看、下载和打印等操作。4.文献成果文献成果集中展示法学大数据分析、法律实证研究相关示例和通过研究得出的一些典型分析结论、对实证研究成果的引用取得的科研成果等内容,数据主要来源于知名学者与法律实证分析相关的文献著作、北大法意历年参与和支持的课题研究成果等,为用户更好地理解大数据分析和实证研究方法提供帮助,并为其课题研究选题、变量设计提供灵感、思路和方向。用户可对资料进行检索、查看、下载和打印等操作。5.研究方法此模块为法律实证研究方法论介绍,用户在此页面可查看关于实证研究方法的相关说明,包括实证分析的定义、意义;如何应用、开展实证分析;常用统计分析方法介绍等。另外,提供北大法意资深顾问、国内法律实证研究专家、北大知名教授白建军老师的法律实证研究方法电子书,帮助用户进一步全面深入理解。三、服务流程步骤说明:1.确立研究主题。研究者首先需要确定研究主题,圈定研究的基本方向、主要内容。2.需求沟通确认。确立研究主题后,研究者向法意提出数据分析需求,法意对分析需求进行初步评估,提出主题分析解决方案,并与研究者就研究内容、分析目的、分析策略、变量模型等进行确认。3.主题分析实施。主题分析需求确认后,法意提供分析框架构建、变量设计、分析样本收集、统计分析等一体化服务。(1)研究框架设计(变量和分析维度设置)。根据主题研究内容和分析目的,进一步明确研究对象,将抽象的、理论性的要素转化为可测量的要素,进行变量设置;确定变量后,对其进行描述(变量的内涵和外延)、给变量定性(定类型、数值型、日期型、字符型、文本型)、赋值(不同取值代表不同分类)。变量设置的过程中要注意两个问题:一是如何从抽象的、描述性的情节中提炼出共性的东西和分离出差异的东西,进行变量的设置;二是设置的变量能够较全面地反映与主题研究相关的因果关系,即变量模型与研究目的直接相关。变量模型设置好后,一个实证分析课题的框架就建立完成了。(2)样本资源获取。根据设置的变量及变量模型确定选取相关的数据样本,做好数据收集、筛选和整理工作。(3)变量规则制作。运用文书分析算法,制作变量提取规则,并将分析配置内置平台。对可分析变量,以层级引导树的形式呈现,便于研究者直接选取。(4)变量统计分析。根据变量设置情况,为样本数据选择合适的分析方法进行统计分析,得出分析报表。(5)统计图形配置。根据分析报表特性,将其配置成饼状图、条形图、柱状图、折线图等多样式图表,集中展示不同主题下宏观、中观或微观层面的分析成果(6)分析结果说明。图形配置完毕,对每一分析成果的样本来源、分析字段和目的进行说明。4、分析结果发布。研究者根据统计分析结果推断研究结论,应用于论文写作或者课题报告中。四、应用价值(一)面向院校:提供新颖的科研建设支持1.促进科研建设平台利用信息技术手段对文书信息项进行拆解、提取、转化和整合等处理,同时将统计学上常用数据分析方法内置于系统,对法律信息形态进行量化分析,其中涉及到统计学知识的理解和应用,为法律院校及科研工作者提供了一种全新科研模式,为院校提供相应的教学科研建设和改革的具体实施方案。2.完善科研管理学校可以借助平台,完善院校科研机制,重构法学科研能力评价标准体系,减少科研管理成本,使法学科研管理工作进一步系统化和规范化。3.提升科研水平大数据的支持及实证分析方法的应用可进一步提升院校科研水平,增强其核心竞争力。法学大数据分析方法的应用程度在一定意义上可成为行业科研水平的度量衡。(二)面向科研者:提供全面的科研方法论与工具支持1.大数据分析方法平台提供大数据分析方法相关论文和书籍资料,让更多用户了解相关研究方法及其相关知识,帮助用户加强对法学大数据分析与法律实证研究应用的深入理解。2.研究样本资源平台围绕研究者主题分析需求,提供主题研究全样本,研究者不必再为收集数据投入过多的人力和财力。3.研究变量提取平台提供智能化文书检索和分析引擎,将检索项和待分析变量以层级引导树的形式呈现,并对所有可分析变量进行定性、赋值,只需根据课题研究目的,直接选取使用,解决了数据信息提取和变量设置难题。4.统计分析支持平台提供主题构建、变量设计、数据收集、统计分析的一体化法学实证分析支持服务,尤其提供统计分析工具,帮助研究者者发现事物之间的因果联系,加快了科研进度,提升了研究成果价值含量。5.科研交流分享平台从历年实证分析服务成果中摘选精彩范例,从宏观、中观、微观等分析角度为研究者提供不同分析成果的展示,同时提供主题公开服务和文献成果,帮助用户推广研究成果、了解其他研究者的科研动态,进行信息交换与成果共享。(三)面向教师:提供新型的科研教学支持1.理论教学补充传统的讲授式教学模式过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论