贾俊平统计学第三章课后思考题答案_第1页
贾俊平统计学第三章课后思考题答案_第2页
贾俊平统计学第三章课后思考题答案_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、思考题1.数据的预处理包括哪些内容?答:数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。(1)数据审核就是检查数据中是否有错误。对于通过调查取得的原始数据,主要从完整性和准确性两个方面去审核;对于通过其他渠道取得的二手数据,则应着重审核数据的适用性和时效性(2)数据筛选是根据需要找出符合特定条件的某类数据。(3)数据排序是按一定顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。除此之外,排序还有助于对数据检查纠错,以及为重新归类或分组等提供方便。2.分类数据和顺序数据的整理和图示方法各有哪些?答:(1)分类数据的整理方法:首先列出分类数据所分的类别,然后计算出每一类别的频数、频率或比例、比率等,即可形成一张频数分布表。图示方法:条形图、帕累托图、饼图和环形图。(2)顺序数据的整理方法:首先按照一定的顺序将数据进行分类,然后计算出每一类别的频数、比例、百分比、比率等,对于顺序数据,除了可使用分类数据的整理和图示技术外,还可以计算累积频数和累积频率(百分比)。图示方法:条形图、饼图、帕累托图、累积频数分布图和环形图。3.数值型数据的分组方法有哪些?简述组距分组的步骤。答:(1)数据分组的方法有单变量值分组和组距分组两种。①单变量值分组是把每一个变量值作为一组,这种分组通常只适合离散变量,且变量值较少的情况下使用;②在连续变量或变量值较多的情况下,通常采用组距分组。它是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。(2)组距分组步骤①确定组数。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数不应少于5组且不多于15组,即5≤K≤15;②确定各组的组距。组距是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数;③根据分组编制频数分布表。4.直方图与条形图有何区别?答:直方图与条形图的区别:(1)条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义;(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列;(3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。5.绘制线图应注意哪些问题?答:绘制线图时应注意:(1)时间一般绘在横轴,观测值绘在纵轴;(2)一般应绘成横轴略大于纵轴的长方形,其长宽比例大致为10:7;(3)图形过扁或过于瘦高,不仅不美观,而且会给人造成视觉上的错觉,不利于对数据变化的理解;(4)一般情况下,纵轴数据下端应从“0”开始,以便做比较。如果数据与“0”之间的间距过大,可以采取折断的符号将纵轴折断。6.饼图和环形图有什么不同?答:环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示。饼图只能显示一个样本或总体各部分所占的比例,而环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环,有利于对构成做比较研究。7.茎叶图与直方图相比有什么优点?它们的应用场合是什么?答:(1)茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。(2)直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。8.鉴别图表优劣的准则有哪些?答:鉴别图形优劣的准则有:(1)一张好图应当精心设计、有助于洞察问题的实质;(2)一张好图应当使复杂的观点得到简明、确切、高效的阐述;(3)一张好图应当能在最短的时间内以最少的笔墨给读者提供最大量的信息;(4)一张好图应当是多维的;(5)一张好图应当表述数据的真实情况。9.制作统计表应注意哪几个问题?答:制作统计表时要注意以下几点:(1)要合理安排统计表的结构,比如行标题、列标题、数据资料的位置应安排合理。当然,由于强调的问题不同,行标题和列标题可以互换,但应使统计表的横竖长度比例适当,避免出现过高或过宽的表格形式。(2)表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出统计表的内容,一般需要说明统计数据的时间(When)、地点(Where)以及内容(What),即标题内容应满足3W要求。如果表中的全部数据都是同一计量单位,可在表的右上角标明。若各变量的计量单位不同,则应放在每个变量后或单列出一列标明。(3)表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目。通常情况下,统计表的左右两边不封口,列标题之间在必要时可用竖线分开,而行标题之间通常不必用横线隔开。总之,表中尽量少用横竖线。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论