大数据时代下统计学的挑战与发展探究_第1页
大数据时代下统计学的挑战与发展探究_第2页
大数据时代下统计学的挑战与发展探究_第3页
大数据时代下统计学的挑战与发展探究_第4页
大数据时代下统计学的挑战与发展探究_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据时代下统计学的挑战与发展探究随着科学技术的迅速发展,大数据时代来临,从科 学角度看,大数据通过对信息的整合分析处理,形成快捷全新的数据 分析方法,这为大数据与统计学架起互通的桥梁。 大数据时代的变革 为统计学发展起到了重要的推动作用, 未来挑战与机遇同在。文章首 先对大数据时代下的统计学做出概述,接着陈述统计学在大数据时代 影响下的变革,再次分析大数据时代下统计学面临的挑战, 最后解读 大数据时代下统计学的发展与机遇,以期为相关领域的研究提供有价 值的参考。一、大数据时代下统计学概念概述教科书上对统计学给出了这样的定义 有效搜集整理分析随机性 数据,对考察问题给出推断与预测,最终为行动提

2、供数据支持”,这就是统计学。从根本上看,统计学是一门与数据有关的学科。众所周 知,美国总统奥巴马通过数据团队的帮助得到连任的机会,阿里巴巴的马云很早就把大数据作为企业发展战略。 随着我们走进大数据时代, 网络科技给搜集数据带来方便,传统的设备已经无法容纳大量的数据, 我们对其进行更新,通过对大数据的分析,我们为社会传递出有效的、 有价值的信息,这一切为社会的发展起到了不可替代的推动作用。统计是社会各界乃至各环节不可或缺的因素, 在商品交换过程中, 统计有先导作用,市场经济信息也需要统计学的帮助,大数据时代, 我们的统计数据不再局限于随机抽样调查, 电话调查等高成本的搜集 方式,通过互联网及移动

3、终端,我们可以获得更多数据样本,可以说 我们的社会进入高速发展的时期, 大数据时代下的统计学也进入全新 的发展阶段。二、统计学在大数据时代影响下的变革1. 从样本的角度看,样本概念得到深化我们知道统计学离不开样本, 有效的样本能够正确反映情况, 大 数据时代样本概念与传统不再相同, 通常我们得到诸多网络数据, 一 种为静态,即直接在客户端创建的数据, 无需提取即可使用, 成本低, 另一种为动态数据, 即数据随着时间的推移而变化, 最终表现为所有 数据的总和, 可见此时的样本不局限于随机抽样, 直接可以做选定分 析。2. 从类型方面看,呈扩大之势在过去数据通常指结构化数据, 有固定的标准, 大数

4、据时代数据 不仅局限于固定的结构, 还有异构数据, 再有存储方式也发生了改变, 大数据可以直接将探测的信号容纳进去, 由网络系统作为工具, 可以 识别各类结构或非结构的数据并进行快速存储。3. 收集概念得到扩展传统的统计过程中,我们有目的的进行数据收集,效率低,成本 高,随着大数据时代来临, 我们将收集步骤化,第一预先处理好数据 的识别与处理,第二做好分析,提炼出所需要的信息, 最后做好存储, 就这么简单。面对大量的数据,我们的分析、识别等都需要注意,大 数据不代表万能, 我们还是要注意数据的安全性, 尽量控制收集成本。4. 数据来源较传统不同曾经我们根据研究目的去做统计收集数据, 这些数据源

5、都是已知 的,在核对方面相对容易。大数据时代,我们得到数据变得容易,但 通过互联网收集数据后,目的性变弱,大多数记录没有源头,很难识 别记录身份,可见,大数据时代做好数据来源登记开始变得重要。5. 量化方式也发生变化对于传统的结构化数据, 量化方式是成熟的, 可以将收集到数据 直接分析得出结果, 大数据时代, 很多异化结构数据几乎无法做直接 分析取得结论,当下,很多结算及专家在研究处理非机构化数据,力争将大数据时代统计推向新的高端。6. 分析思维发生改变从分析过程看,传统分析需要进行三步走,即定性、定量,最终 定性。大数据时代,统计分析过程仅需要两步即定量、定性;从证实分析方面看,传统思路为假

6、设、验证,事实证明传统证实分析有很大 误差,而大数据时代,我们的思维为发现,总结,这是整合,发现最 终定论的过程,在此过程中会有很多发现。7. 统计软件变得越来越多传统统计学中,我们比较熟悉的软件有 SPSS SAS STATA等,大数据时代,我们分析技术为非关系型,主要以数据中心为基础,将 软件与大数据结合,分析过程得到很大简化。综上,大数据时代给了 我们更多的主动权, 这些更促使我们推动大数据时代统计的发展进步。三、大数据时代下统计学面临的挑战大数据时代给我们带来了更多的好处, 统计学的大数据化是大势 所趋,但传统与更新的交错间还有一些不相容的方面, 对于革新我们 还是要从各个方面做谨慎考

7、虑与慎重调整。首先从样本标准的角度看, 大数据时代我们可以轻松得到很多样 本,此量大到可以视为总体,随着互联网科技的不断发展,大样本标 准也应随着发展,传统统计学将界限定在 30,大于 30 为大样本,小 于 30 为小样本,大数据时代这个界限略显低,没办法清除干净干扰 信息,这会影响分析结果, 因此,加强数据来源的同时还要更新大样 本标准,将更大规模的样本数量代替旧有的数量, 以适应大数据时代 的要求。其次从样本选取与形式的角度看, 传统统计学固定结构化数据内 藏着一定的统计规律, 尽管我们能够发现研究对象的数量关系, 但并 不是所有的事物都有量化指标, 一些被量化的指标也不一定能够清楚 的

8、解读研究对象, 目前大数据采集数据超过 80%为有结构数据, 传统 的统计数据库没有办法对这些数据做很好的处理, 而大数据通过建立 非结构数据库,对数据做有效转化,发挥多元化分析作用,无形中降 低了样本的选取标准,将统计范围扩大化。最后统计软件的开发是一项挑战。 我们常用的统计软件主要以构 建模型之间的变量与数量关系的方式分析研究对象,如我们熟悉的 SPSS等。大数据时代,我们很多以数据为基础做非关系分析技术, 谷 歌利用MAPREDUC实现了月处理400PB数据的工作量,雅虎也利用 云计算平台实现了 100PB的存储工作,未来大量的数据处理需要更快捷更科学的软件,对于软件的研发与升级将是一种

9、挑战。四、大数据时代下统计学的发展与机遇1. 大数据时代下统计质量更高从国际数据标准SDDS中得到的统计质量标准可以看到,适用、 准确、时效、平衡是统计质量的内涵。其中适用是指统计信息符合要 求,统计信息最大化的满足客户的用途, 大数据的覆盖很大程度上促 进适用功能的提升 ;传统角度我们说时效性主要指统计的时间更短, 让客户及时了解统计信息, 大数据时代网络化完全满足时效性各类要 求;准确是指估值与真值之间的差别,数据中存在误差在一定范围内 属于正常, 大数据时代我们的全面性最大程度包容了误差, 也缩小的 了误差,统计更加真实可信 ;平衡性也被称之为协调性, 大数据时代, 数据结果的核对与检验都经得起客户的不断核查, 可以使数据的平衡 性得到很大提升。2. 大数据时代统计成本降低首先,从数据收集角度看, 大数据时代可以不再依靠人力做电话 调查或问卷调查,甚至有些普查动用全国力量,耗费大量人力财力, 通过互联网、移动通信等,我们大大降低人力成本,数据收集快,成 本低,准确性也高 ;其次从数据利用角度看,传统统计过程中,一旦 资料过期就需要再起启动抽样分析过程,对外公布手段也有局限性, 大数据时代,我们收集数据更轻松,且数据可多次被利用, 综合比算, 数据的成本大大降低。3. 大数据时代统计学作用范围扩大传统统计学有各种局限性,比如受成本、观念等影响,统计学主 要用于行业

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论