毕业设计(论文)基于EXCEL的回归分析在足迹分析上的应用_第1页
毕业设计(论文)基于EXCEL的回归分析在足迹分析上的应用_第2页
毕业设计(论文)基于EXCEL的回归分析在足迹分析上的应用_第3页
毕业设计(论文)基于EXCEL的回归分析在足迹分析上的应用_第4页
毕业设计(论文)基于EXCEL的回归分析在足迹分析上的应用_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于excel的回归分析在足迹分析上的应用xxx警官高等专科学校本科毕业论文系: 公安技术系 专业: 刑事科学技术 学生: 指导教师: 完成日期: 2009年5月15日 高等专科学校毕业设计(论文)题目基于excel的回归分析在足迹分析上的应用总计 毕业设计(论文) 17 页表格 3 个插图 3 幅毕业论文任务书姓 名专 业刑事科学技术毕业论文方向: 痕迹检验题 目: 基于excel的回归分析在足迹分析上的应用完成日期: 2009-5-15题目来源: 自拟在校内或校外以何种形式进行: 校内在老师指导下独立完成论文主要内容:回归分析预测法可以从各种痕迹数据之间的相互关系出发,通过对与预测对象有联

2、系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种预测方法,通过对与预测对象()有联系的多个因素建立多元线性回归模型。本文给出了两方面的检验:一方面为实际意义检验。即利用痕迹理论所拟定的期望值与刑警人员的经验结果相比较是否相符。另一方面为统计检验:分别为拟合优度检验(r平方检验)、方程显著性检验(f检验)、变量显著性检验(t检验)。excel是一种办公系统软件,本文给出了运用它的强大数据分析功能,只输入一次原始数据,而后全部以鼠标操作即可自动生成的操作方法。计划进度:1、收集数据,收集参考资料。(4月10日4月20日)2、阅读文献,拟定提纲。(4月214月30日)3、结论分析,完成初稿

3、。(5月1日5月8日)4、交由指导老师审阅,修改。(5月9日5月15日)5、最后定稿。(5月16日5月20日)参考文献:1 王清举新编足迹步法检验基础知识指导手册中国人民公安大学出版社2005 年版2 曹彬等概率论与数理统计哈尔滨工业大学出版社指导教师 系(部)主任签 字 签 字目 录摘要1前言3一、多元线性回归模型3二、多元线性回归模型的检验42.1 实际意义检验42.2 统计检验42.2.1 拟合优度检验( 检验)42.2.2方程显著性检验( 检验)62.2.3变量显著性检验( 检验)6三、现场足迹的提取、分析和运用73.1 现场足迹的提取73.1.1 灰尘减层、加层足迹的提取73.1.2

4、 泥水加层足迹的提取73.1.3 平面客体上赤脚、穿袜子足迹的提取83.1.4 平面客体上血迹加层足迹的提取83.2 现场足迹的分析83.2.1 利用足迹分析年龄83.2.2 利用足迹分析身高83.2.3 利用足迹分析性别8四、excel在足迹数据分析上的应用举例94.1 相关分析94.2 建立回归模型10五、小结12参考文献13摘 要在足迹分析技术中,推测足迹与诸多因素的关联十分重要。例如,人的足长与身高、手长有关联;又如足长与内虚沿长有关联等,本文重点用excel统计分析功能研究足长与身高之间的关联。回归分析预测法可以从各种痕迹数据之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的

5、分析,推算预测对象未来状态数量表现的一种预测方法,通过对与预测对象()有联系的多个因素建立回归模型。求出的回归模型是否合理,是否符合变量之间的客观规律性,引入相关因素是否有效,变量之间是否存在线性相关关系,模型能否付诸应用,这要通过检验决定。本文给出了两方面的检验:一方面为实际意义检验。即利用痕迹理论所拟定的期望值与实际结果相比较是否相符。另一方面为统计检验:分别为拟合优度检验(r平方检验)、方程显著性检验(f检验)、变量显著性检验(t检验)。回归分析预测法的计算,数据繁琐计算复杂,工作量较大,尤其是当需要复检时更是如此,非常复杂且容易出错。计算机的迅猛发展让这些计算变得简单准确,尤其是exc

6、el办公系统软件,本文给出了运用它的强大数据分析功能,只输入一次原始数据,而后全部以鼠标操作即可自动生成的操作方法。最后本文以一组足长与身高的数据分析为例,加以检验。以期得到广大公安刑侦人员的关注,使之在刑事技术中发挥它应有的作用。关键词:足迹 excel检验f检验 检验回归方程abstractin the technology of traces analysis, guessing the link of traces and a number of factors is very important. for example, the persons foot length is ass

7、ociated with his stature and hand length, also associated with. using excel function, this paper focused on statistical analysis of the correlation between foot length and stature. the method of regression analysis predicting can predict the future state of the object by analyzing the trend of pheno

8、mena correlative to the predicted objects, and is based on the relationship between all kinds of traces data. it can establish regression model by several factors which are correlative to the predicted object(). the regression model obtained should be tested. the test contains whether the model is r

9、easonable, whether it accords with the objective law, whether the relevant factors are efficient, whether there is linearity correlativity between the factors and whether the model can be put to practice. in this paper, two aspects of testing are given. on the one hand, the practical significance te

10、st can compare the accordance between the expected value presumed by the trace theory and the reality. on the other hand, in the statistical test, the author tests the model with goodness-of-fit test (r-square test), equation significance test (f test), variables significance test (t test). the calc

11、ulation of regression analysis prediction method is difficult because of its cumbersome data computational complexity and large workload, especially when the review is needed, quite easy to make mistakes. but the rapid development of the computer makes these calculations easy, especially using the e

12、xcel office system software. this paper make the use of its powerful data analysis functions, with only once raw data input, and the rest of work can be automatically generated by the operation of mouse. finally, an example of the analysis of a group of trace length and stature is given and tested.

13、expect it can arouse the wider concerns of the public security investigators, and play its due role in criminal technology.keyword: trace excel test f test t test regression equation 前 言在足迹分析技术中,某一推测数据常与多因素的有关联。例如,人的身高与足长有关联。因此,要研究该数据就应从事物变化的因果关系出发,寻找它与其他因素之间的内在联系,这就是因果关系分析法。在因果关系分析法中最常用的方法之一就是回归分析法

14、。回归分析预测法就是从各种痕迹数据之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种预测方法。根据回归分析中所考虑因素的多少,可将回归分析分为一元回归分析和多元回归分析。例如,对于如身高与足长的相关关系的分析问题就属于一元回归分析;而对于人的身高与足长、手长等的相关关系的分析问题就属于多元回归分析。一元回归分析实质上是多元回归分析的一种特例。一、多元线性回归模型设所研究的对象 受多个因素 的影响,假定各个影响因素与 的关系是线性的,则可建立多元线性回归模型: 式中 代表影响因素,通常是可以控制或预先给定的,故称为解释变量或自变量; 代表各种随机因

15、素对 的影响的总和,称为随机误差项,根据中心极限定理,可以认为它服从正态分布,即 ; 就是所研究的对象,即预测目标,称为被解释变量或因变量。 根据n组观测值 则有 写成矩阵形式 其中 利用最小二乘法可得回归系数向量 的估计值 为 故回归分析模型为 二、 多元线性回归模型的检验求出的回归模型是否合理,是否符合变量之间的客观规律性,引入相关因素是否有效,变量之间是否存在线性相关关系,模型能否付诸应用,这要通过检验决定。一般讲,回归模型应通过二方面的检验:实际意义检验、统计检验。只有当所有检验都通过时,所做的回归模型才成立。才能利用连贯性、相关性和类推性原则,根据过去和现在的规律预测未来。当然,还应

16、从现场角度上分析模型的预测值是否合理?是否符合现实规律?是否可行等等。2.1 实际意义检验 首先需要检验模型是否符合实际意义,检验求得的参数估计值的符号与大小是否合理,是否与根据刑警人员的经验和痕迹理论所拟定的期望值相符合。如果不符,则要查找原因和采取必要的修正措施,重新建立模型。 2.2 统计检验统计检验是运用数理统计的方法,对方程进行检验、对模型参数估计值的可靠性进行检验。这主要包括拟合优度检验、方程显著性检验、变量显著性检验,即常用的 检验、f检验和 检验。 2.2.1 拟合优度检验( 检验):检验所有解释变量与被解释变量之间的相关程度 拟合优度检验就是检验回归方程对样本观测值的拟合程度

17、。常用的方法是 检验,又称为复相关系数检验法,它是通过对总变差(总离差) 的分解得到。 其中 总变差平方和 是各个观察值与样本均值之差的平方和,反映了全部数据之间的差异;残差平方和 是总变差平方和中未被回归方程解释的部分,由解释变量 中未包含的一切因素对被解释变量 的影响而造成的;回归平方和 是总变差平方和中由回归方程解释的部分。 显然,对于一个好的回归模型,它应该较好地拟合样本观测值, 中 越小越好。于是可以用: 对回归方程的拟合优度进行检验。如果所有样本观测值都位于回归方程上,即: 此时回归方程完全拟合了样本观测值, 等于1。当然,完全拟合的情况是不可能的, 不可能等于1,但毫无疑问, 越

18、接近1,回归方程的拟合优度越高。 通常, 称为复可决系数,取值范围为0 1,其平方根 称为复相关系数(当解释变量的个数为1时, 称为相关系数)。这里, 说明了在被解释变量 的总变差中,由一组解释变量 的变动所引起的百分比; 则描述了一组解释变量 与被解释变量 之间的线性相关程度。例如 =0.93,可以说 值的变化有93%因 的变化而产生。因此,若 的值愈接近1,则表示 与 的关系愈密切。 由于 是一个随解释变量个数的增加而递增的增函数,所以为使拟合优度检验指标不仅能反映已被解释的变差与总变差的关系,而且能反映回归模型中所包含的解释变量个数的影响,需要调整 ,记为 。 式中 为残差平方和 的自由

19、度, 为总变差平方和 的自由度。根据 与 的定义式可推导出两者的关系式为: 从上式可以看出:当 时, ,这说明 中包含了解释变量个数的影响,随着解释变量个数的增加, 总是小于 ;尽管 总是非负的,但 却可能为负,若遇到 为负数的情况, 取值为零。 在实际应用中, 到底多大时回归模型才算通过了拟合优度检验呢?这并无绝对标准,要根据具体情况而定,因为拟合优度并不是检验回归模型的唯一标准,有时为了使模型有较合理的现实解释,可能会在某种程度上牺牲拟合优度。这就是说模型的合理的现实解释是第一位的。 2.2.2方程显著性检验( 检验):判断被解释变量与所有解释变量之间是否线性关系 对于多元线性回归方程,方

20、程显著性检验就是对总体的线性关系是否显著成立作出推断,即检验被解释变量 与所有解释变量 之间的线性关系是否显著,这就要检验假设: :至少有一个 不为零 应用数理统计理论可以证明: 与 相互独立,且当 为真时, 与 分别服从自由度为 的 分布,故有: 即 统计量服从以( )为自由度的 分布。 首先根据样本观测值及回归值计算出统计量 ,于是在给定的显著性水平 下,若 ,则拒绝 ,判定被解释变量 与所有解释变量 之间的回归效果显著,即确实存在线性关系;反之,则不显著。 比较 统计量与 检验值可以看出,在 一定时, 大,即拟合优度高, 统计量的值也大,容易通过方程显著性检验,拟合优度检验与方程显著性检

21、验是一致的,只是前者比较模糊,后者更加定量化。一般来说,当拟合优度 0.80时,相应的 统计量的值将达到两位数,只要样本容量 适当,通过方程显著性检验是没有问题的。 2.2.3变量显著性检验( 检验):挑选重要因素,剔除可有可无的因素 前面讲的 检验和 检验都是将所有的解释变量作为一个整体来检验它们与被解释变量 的相关程度以及回归效果,但对于多元回归模型,方程的显著性并不意味每个解释变量对被解释变量 的影响都是重要的。如果某个解释变量并不重要,则应该从方程中把它剔除,重新建立更为简单的方程。所以必须对每个解释变量进行显著性检验。这等价于对每个解释变量检验假设 其中 。 应用数理统计理论可以证明

22、:当 为真时,统计量 服从自由度为 的 分布,即: 在给定的显著性水平 下,若 ,则拒绝 ,说明解释变量 对被解释变量 有显著影响,即 是影响 的主要因素;反之,接受 ,说明解释变量 对被解释变量 无显著影响,则应删除该因素。 需要说明的是,当影响 的主要因素只有一个变量 时,问题变成了一元回归分析,此时 检验和 检验的作用是一样的,因此可以不用再做 检验了。 三、现场足迹的提取、分析和运用足迹是犯罪现场最常见的痕迹物证之一,不仅能反映出案犯在犯罪现场活动的轨迹,也隐含着大量的犯罪分子个体信息。技术人员可以通过对现场足迹的发现、提取和分析、利用推断犯罪嫌疑人信息,服务破案。3.1 现场足迹的提

23、取3.1.1 灰尘减层、加层足迹的提取对承痕客体上灰尘层面厚、灰尘细腻且粘附性较强、足迹反映清晰,各种特征反映明显、稳定的,可以直接拍照或利用静电吸附器吸附后再拍照提取。对承痕客体上灰尘层面薄,但承痕面平滑,如桌椅面、地板面、水泥地面等客体上的足迹,受光的散射影响,一般目见有痕,但反映的足迹形态、步法及细节特征较差,难以直接拍照提取。3.1.2 泥水加层足迹的提取作案人选择雨天作案,进入现场时鞋子带有泥水,形成泥水加层鞋印,此类鞋印干燥后,用静电吸附器处理难以吸附起来,对于这类鞋印的提取通常采用照相法。对泥水量粘附较多且粘附牢固,各种形态及特征反映明显的足迹,可直接拍照提取。对泥水量粘附较少或

24、干涸后泥质色泽与承痕客体表面反差较弱,不易拍照提取的可采用水浸法。3.1.3 平面客体上赤脚、穿袜子足迹的提取若承痕客体表面湿度较大,应先行做风干处理;若客体面过于干燥,可先行加湿处理,然后采用粉末、荧光剂刷显或502 熏显,必要时再做染色加强反差,以便拍照提取。操作中需要注意的是,粉末的目数要求应考虑承痕客体的湿度、平滑度、渗透性等性能,湿度大、平滑度高、渗透性强,粉末的目数要求就低,否则,目数要求就大。荧光剂的使用以能增强与承痕客体的反差为要求,必要的时候要对痕迹做染色处理。3.1.4 平面客体上血迹加层足迹的提取与提取血手印的方法类似,可依据承痕面的色泽,选择四甲基联苯胺、茚三酮、无色孔

25、雀绿或鲁米诺等显现方法,以取得最佳的反差效果,再拍照提取。3.2 现场足迹的分析足迹分析是侦查破案的决策依据。当案件现场留有犯罪嫌疑人的足迹时,经过全面科学分析,即可得出相应的分析意见,大大缩小侦查范围,从目前刑事案件现场提取率最高的足迹来说用于侦查破案,排查犯罪嫌疑人,为侦查破案指明侦查方向具有重大意义。3.2.1 利用足迹分析年龄利用足迹分析年龄。有二种方法。一是蹬痕分析法。痕迹形状多为不规则倒三角,起缘在掌前缘呈弧形止缘在掌后缘呈“v”形。泥土地上的足迹多表现为向后抛土。蹬痕部位分析年龄方法,蹬痕直径乘五法。二是压痕分析法。痕迹多为圆形或类圆形,表现为不同深度凹陷及受力部位的物质颗粒粗细

26、、松密、虚实、干湿、光泽增减等。主要有30 岁基线法、鞋掌斜条压计算法。3.2.2 利用足迹分析身高利用足迹推断身高的方法,利用足迹与步幅的长短等特征与人的身高存在比例关系和内在联系的特点进行对身高推算判定的方法。一是单个赤脚足迹推算身高法。指利用单个、平面、立体、局部赤脚足迹推断人身高度的方法。二是单个穿鞋足迹推算身高法。指利用现场的鞋或足迹推测出赤脚长度,然后按照赤足长去推算身高的方法。注意:用此方法推算身高,首先要了解各种机制鞋的大小与全国统一鞋号的关系。3.2.3 利用足迹分析性别主要是根据男女足迹的不同特点进行分析。以中等身高、体态的青壮年为例:男性足迹宽大、步长,起落脚有力,常出现

27、蹬、挖痕,足底压力面凸凹不均,重点突出,边沿轻重不一,多偏外压,脚弓略高。女性足迹短小,步长也短,起落脚平稳,压力均匀,边沿整齐,脚弓低,外起脚的多,并伴有轻微短擦。一般青少年妇女,小外展直线步多。挖痕不甩土或甩土不远。在判断性别时,还可以参考足迹中反映的鞋底式样,一般女性穿的鞋小,后跟高而又窄,鞋的内边沿弧度大,多穿认脚鞋。鞋底钉掌很少,鞋底花纹细。四、excel在痕迹数据分析上的应用举例在多元回归分析预测法的计算,虽然可以用常用的函数型计算器也能解决痕迹分析中有关的数据的统计处理,但是显得有点复杂和繁琐,工作量较大,尤其是当需要复验时更是如此,非常复杂且很容易出错。excel是美国微软(m

28、icrosoft)公司的一种办公系列软件,excel有友好的用户界面,卓越的数据处理和数据分析能力,它预装的各种函数多达245个,单是统计函数就有80个,用户还可以自行编辑各种公式,或将各个函数组合使用,各种图标化的提示与仅用鼠标就可进行的操作使一般人可以很快掌握基本的操作,无须经过培训。方便的智能型复制功能,极大地减轻了计算工作量,并使大部分结果可以自动生成。我们现在以技术系04级一组100名学生的足迹痕迹数据为例,用excel对已有数据进行回归分析。本例只有一个自变量:左足长。下面先分析它与身高的相关性。具体操作步骤如下: 4.1 相关分析先把已有数据表1输入到excel的表格中,a列为足

29、长,b列为身高。左足长身高左足长身高左足长身高左足长身高23.81732818225.518725.418024.717924.217322.716626.818526.417926.218724.116325183.524.317524.517824.516222.316024.717523.917322.216022.817024.717726.117524.718021.216926.518024.817526.218023.216325.717527.3182.32417921.916324.617724.317523.516823.317325.217722.316225.91752

30、7.217424.1173241722317025.417524.718725.417824.617521.516024.317721.516324.617425.518025.518322.417224.717925.317423.217522.116225.217927.51792417823.416222.616025.117225.217823.616925.318024.917425.917122.616426.618324.116022.816423.816525.817124.717425.41862316922.516523.116924.9169231752718024.31

31、7525.2184.52718525.418026.518124.31782617625.51752316423.217023.617426.118228.518524.417025.11772517421.6160表1再选择工具栏中的数据分析对话框。在分析工具列表框中,选相关系数工具,在输入框中指定输入参数。在输入区域指定数据所在的单元格区域;因输入数据是以列方式排列的,所以在分组方式中选择逐列;因指定的输入区域包含标志行,所以选中标志位于第一行复选框。 在输出选项框中指定输出选项。本例选择输出区域,并指定输出到当前工作表以f3为左上角的单元格区域。 单击确定按钮。产生表2足长身高足长1身高

32、0.7600146371表2从表2所给出的相关系数可以看出,赤足内虚沿长与足长有较强的相关性。因此,需要利用回归分析工具进一步建立关系式。4.2 建立回归模型通常,在相关分析的基础上必须拟合回归模型,以便进行推算、预测。建立回归模型的具体操作步骤如下: 选择工具菜单中的数据分析命令,弹出数据分析对话框。 在分析工具列表框中,选回归工具。 这时,将弹出回归对话框,指定输入参数。在输入y区域、输入x区域指定相应数据所在的单元格区域,并选定标志复选框,在置信水平框内键入95%。指定输出选项。这里选择输出到新工作表组,并指定工作表名称为“回归模型”,选定残差(即随机误差项)和正态分布中的所有输出选项,以观察相应的结果。 单击确定按钮。 最后得到回归分析的计算结果:summary output回归统计multipl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论