面向车联网数据的相关性分析方法_第1页
面向车联网数据的相关性分析方法_第2页
面向车联网数据的相关性分析方法_第3页
面向车联网数据的相关性分析方法_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    面向车联网数据的相关性分析方法    董俊龙 关利海 郝成龙摘 要:车联网数据包括车辆数据、驾驶员数据、出行数据以及环境数据。分析、挖掘车联网数据之间的相关性,发现数据潜在规律,可以更好的指导业务策划以及产品决策。本文归纳总结了相关性分析常用方法,并阐述每种方法的适用范围、优缺点以及如何应用于车联网数据。关键词:车联网;大数据;相关性分析1 前言相关分析(analysis of correlation)是数据分析常用的分析方法之一。通过对不同特征或数据间的关系进行分析,发现数据之间的关联性,并通过这种强关联关系,可以对未来趋势进行预测。相关分析的

2、方法很多,图表描绘可以直观发现数据之间的关系,如正相关,负相关或不相关。数值计算的方法可以对数据间关系的强弱进行度量,如完全相关,不完全相关等。模型拟合的方法可以将数据间的关系转化为数学模型,并通过模型对未来的趋势进行预测。关联规则挖掘的方法可以挖掘数据之间的关联关系。本文结合车联网数据,着重介绍几种数据相关性分析的基本方法。2 车联网数据类型车联网数据举例说明,如表1所示:3 相关性分析方法3.1 数据可视化通过数据可视化的方法分析数据之间的相关性,如散点图、折线图等,适合定性分析,可直观的表达数据之间联系、模式或趋势。优点是对相关关系的展现清晰,缺点是无法对相关关系进行准确的度量,缺乏说服

3、力。比如,展现车速与转速之间的关系,可以通过散点图直接表现。3.2 协方差协方差用来衡量两个变量的总体误差,如果两个变量的变化趋势一致,协方差为正,说明两个变量正相关。如果两个变量的变化趋势相反,协方差为负,说明两个变量负相关。如果两个变量相互独立,那么协方差就是0,说明两个变量不相关。协方差用于定性分析,描述两组数据之间关系的方向性。优点在于可用数值表示相关性,缺点是无法对相关程度进行度量。3.3 相关系数相关系数(correlation coefficient)是反应变量之间关系密切程度的统计指标,相關系数的取值区间在1到-1之间。1表示两个变量完全线性相关,-1表示两个变量完全负相关,0

4、表示两个变量不相关。相关系数包括pearson、spearman、kendall三种计算方法,优点在于可以定量分析,描述数据之间的单调关系,可通过数值对变量的相关性及强弱进行度量,缺点是无法利用这种关系对数据未来趋势进行预测。如分析驾驶员体征数据与驾驶数据之间的关系。3.4 卡方独立性检验独立性检验,又称卡方检验是统计学的一种检验方式,与适合性检验同属于x2检验,它是根据次数资料判断两类因子彼此相关或相互独立的假设检验。卡方独立性检验,两个类别变量的独立性检验回归分析,优点可通过数值对变量的相关性进行度量,缺点是无法利用这种关系对数据进行预测。卡方检验仅适用于分类型数据,如性别、天气、开关状态

5、等。3.5 回归分析回归分析(regression analysis)是确定两组或两组以上变量间关系的统计方法。回归分析按照变量的数量分为一元回归和多元回归,它可以用于研究数据之间具体模型关系。回归分析优点是对变量间的关系用数学表达式确定,可进行数据预测。适用范围:需要确定自变量和因变量。可应用于如车辆故障诊断预测、驾驶行为风险预测等。3.6 关联规则关联规则(association rules)是数据挖掘中较为常用的方法,它是从大量数据中挖掘频繁项集之间的有趣联系或相关关系。关联规则的任务就是为了发现数据集中不同数据项之间的关系,如数据项对另一数据项的影响。如分析驾驶员情绪对驾驶行为的影响。4 总结本文总结了数据之间相关性计算方法,并以车联网数据为例,说明每种方法的优缺点以及适用范围。相关性分析是进行机器学习、数据挖掘工作之前,前

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论