2023学年完整公开课版数据准备_第1页
2023学年完整公开课版数据准备_第2页
2023学年完整公开课版数据准备_第3页
2023学年完整公开课版数据准备_第4页
2023学年完整公开课版数据准备_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据准备理解数据数据来源0102理解数据理解数据扎实的数据分析基本功不单是指会使用数据分析工具,更重要的是对数据有深入的认识和解读。因此,对数据的理解是数据分析的一个重要前提。数据类型数据表字段与记录理解数据——字段与记录字段是事物或现象的某种特征。比如成绩表中的“学号”“姓名”“总分”等都是字段,在统计学中称为变量。记录是事物或现象某种特征的具体表现。比如成绩表中的“性别”可以使男或女,“总分”可以是273或者230等,记录也称为数据或变量值。学号姓名性别语文数学英语总分总评1赵鹏男898584258良好2郭楠女908895273优秀3杨洋男757578228及格4楚中天男788270230及格6邓博涵女839080253良好……………………某学期学生考试成绩表(字段与记录)字段记录理解数据——数据类型1.字符型数据不具有计算能力的文字数据类型。包括中文字符、英文字符、数字字符(非数值型)等字符。例如前面成绩表的“姓名”“性别”“总评”等三个变量均为字符型数据。2.数值型数据直接使用自然数或度量单位进行计算的数值数据。例如成绩表中的“语文”“数学”“英语”三科成绩汇总即得到“总分”这个字段。这些数据就是数值型数据。对于数值型数据,我们可直接用算术方法进行汇总和分析,这一点是区分数据是否属于数值型数据的重要依据。数据类型可以归结为两大类理解数据——数据表序号要求1数据表由标题行和数据部分组成2第一行是表的列标题(字段名),列标题不能重复3第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列4数据表中不能有合并单元格存在5数据表与其他数据之间应该留出至少一个空白行和空白列6数据表需要一组的形式存储,但是在实际操作中接触的数据往往是以二维表的形式存在的,此时应将二维表转化为一维表的形式存储数据数据表的设计要求理解数据——数据表一维表与二维表的区别地区2006年2007年2008年北京7861935310488上海103661218913698山东220772596631072广东261603108435696浙江157431878021487地区年份GDP北京20067861北京20079535北京200810488上海200610366上海200712189上海200813698山东200622077山东200725966山东200831072广东200626160广东200731084广东200835696浙江200615743浙江200718780浙江200821487二维表一维表数据来源数据来源前面我们介绍了数据特点及其要求,下面就来介绍如何获取数据。获取数据的方式可以分为两种:导入外部数据和自己录入数据。导入数据问卷录入要求数据来源——导入数据文本1网站数据来源2导入的外部数据最常见的来源有两种:数据来源——问卷录入要求数值题单选题多选题排序题开放性文字题数值题一般要求被调查者填入相应的数值,或者打分。录入人员只需要输入被调查者实际填入的数值即可。单选题的特征就是答案只能有一个选项,所以编码时只需要定义一个变量,即给该题留一列进行数据的录入。多选题的录入有两种方式:二分法和多重分类法。对于排序题需要对选项重要性进行排序,先定义录入的数值,然后按照被调查者的顺序录入选项。对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论