国家开放大学《统计与数据分析基础》形考任务1-5答案_第1页
国家开放大学《统计与数据分析基础》形考任务1-5答案_第2页
国家开放大学《统计与数据分析基础》形考任务1-5答案_第3页
国家开放大学《统计与数据分析基础》形考任务1-5答案_第4页
国家开放大学《统计与数据分析基础》形考任务1-5答案_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国家开放大学《统计与数据分析基础》形考任务1-5答案《统计与数据分析基础》是国家开放大学大数据与会计(专科)专业统设必修的专业基础课,也是经济管理类其他专业的选修课。本课程计划课内学时为72课时,共4个学分。课程编号:05404形考任务1一、单项选择题1.以下关于统计含义的描述不正确的是()。A.统计思维与数据思维是有区别的B.统计是围绕数据展开研究的C.统计研究的是确定性关系D.统计的应用场景丰富2.以产品的等级来衡量某种产品质量的好坏,则产品等级作为一种变量属于()。A.时间变量B.数值变量C.分类变量D.连续变量3.在下列分组中,按照取值大小分组的是()。A.班级学生按照性别分组B.鸢尾花按照叶片形状分组C.家庭按照年消费水平分组D.人口按照受教育程度分组4.按照连续变量的定义,()一定不属于连续变量。A.分类变量B.数值变量C.实数变量D.可积变量5.下列变量中,()属于连续变量。A.运动员获得的奖牌数B.雇员的年收入C.病人的常住地D.单位时间内浏览店铺的顾客数6.下列变量中,()属于数值变量且属于离散变量。A.资产的类别B.产量C.销售额D.净利润7.假设某地区有800家工业企业,要研究这些企业的产品生产情况,个体是()。A.800家工业企业B.每个工业企业C.全部工业产品D.每一件工业产品8.下列属于时间序列数据的是()。A.股票的每日收盘价B.2021年不同地区的GDPC.全国70个城市的新房价格D.2010-2021年所有直辖市的GDP数据9.假设你是一家公司的数据分析员,下列数据来源中属于一手数据的是()。A.其他公司提供的经营数据B.统计年鉴数据C.市场调查公司提供的数据D.在公司内部通过调查得到的数据10.工厂对生产的一批零件进行检查,通常采用()。A.普查B.重点调查C.典型调查D.随机抽样调查11.()描述了变量在不同观测值或不同观测值区间上出现的频数或频率。A.分布B.分布特征C.总体D.个体12.()是满足特定目标的所有观测对象或要素的集合。A.个体B.分布特征C.样本D.总体13.在制作统计分布表时,将各组的频数与个体总数的比值称为()。A.频数B.频率C.众数D.样本数二、多项选择题14.按照获取数据的途径不同,统计数据分为()。A.观测数据B.时间序列数据C.实验数据D.面板数据15.下列调查方法中,属于概率抽样的是()。A.简单随机抽样B.分层抽样C.方便抽样D.等距抽样16.下列属于数据分析方法的是()。A.回归分析B.时间序列分析C.指数分析D.对比分析17.数据审核关注的主要问题包括()。A.异常值B.缺失值C.逻辑错误D.重复值三、综合应用题18.一家小微企业共有20位员工,员工的年龄数据如下。3130273627322632302421283730302429312731请结合数据和所学知识回答下列问题:(1)员工年龄的变量类型是()。A.数值变量B.分类变量C.离散变量D.属性变量(2)在制作员工年龄统计分布表时,第一步是()。A.计算频数B.根据变量的观测值进行分组C计算频率D.整理表格(3)在根据变量观测值进行分组时,第一步是()。A.计算组距B.确定组限C.找到最大值和最小值D.确定组数(4)在Excel中,制作统计分布表用到的主要功能是()。A.数据透视表B.排序和筛选C.分类汇总D.数据分析(5)请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,占比最多的年龄组是()。A.29-32岁B.33-36岁C.37-40岁D.41-44岁(6)请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,占比最少的年龄组是()。A.29-32岁B.33-36岁C.37-40岁D.41-44岁(7)请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,年龄小于等于40岁的占比是()。A.0.35B.0.6C.0.72D.0.8(8)请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,年龄小于33岁的占比是()。A.0.23B.0.12C.0.25D.0.6形考任务2一、单项选择题1.在柱形图中,使用()代表每个类别对应的数值(频数、频率或其他数值结果)。A.颜色B.面积C.高度D.宽度2.在饼图中,使用圆内扇形()表示数值大小。A.面积B.颜色C.半径D.弧度3.散点图是描述()变量之间关系的图形。A.一个B.两个C.三个D.四个4.现在有关于两支球队的几项关键数据,为了横向对比两支球队的表现,适合采取的数据可视化方法是()。A.气泡图B.直方图C.散点图D.雷达图5.在热力图中,用来反映变量取值变化规律的特征是()。A.颜色B.大小C.形状D.线条类型6.当数据中存在异常值时,不适合用于度量变量分布特征的指标是()。A.众数B.中位数C.均值D.四分位数7.已知总体容量为N,抽取了一个样本量是n的样本,则在样本方差的计算公式中,分母是()。A.n-1B.NC.nD.N-18.变异系数的计算结果是一个()。A.相对数B.绝对数C.平均数D.正数9.对于右偏分布而言,在箱线图中,中位数更靠近()的位置。A.上四分位数B.下四分位数C.中间D.最大值10.对于对称分布而言,直方图的形状呈现()特征。A.平缓B.右偏C.对称D.左偏11.度量事件发生可能性的测量指标是()。A.随机变量B.随机试验C.概率D.事件12.在正态分布中,共有()参数。A.2B.1C.3D.413.假设z服从标准正态分布,请利用Excel或查表方式计算,P(Z<0.3),计算结果是()。A.0.1B.0.24C.0.38D.0.6214.假设z服从标准正态分布,请利用Excel或查表方式计算,P(Z<?)=0.38,求解得到?的结果是()。A.-1.3B.-0.3C.0.3D.1.315.点估计方法背后的理论依据是()。A.大数定律B.中心极限定理C.中值定理D.拉格朗日定理16.在假设检验中,显著性水平实质上代表的是()。A.置信水平B.估计的准确率C.犯第一类错误的概率D.犯第二类错误的概率二、综合应用题17.为了解学习者在线学习情况,课题研究组从某校本科生和专科生中分别各随机抽取了1000人,调查每日在线学习时长(分钟)。根据调查数据计算度量指标,结果如下表所示:本科生专科生平均值150120样本均值的标准差2.9243.518中位数15090众数3030标准差92.466111.243方差855012375峰值-0.856-0.437偏度0.1321.021最小值3030最大值300330求和150000120000样本值10001000(1)本次搜集数据的抽样方法是()。A.简单随机抽样B.分层抽样C.整群抽样D.雪球抽样(2)描述学习者每日学习时长分布的数据可视化方法是()。A.雷达图B.散点图C.直方图D.饼图(3)下列数据可视化方法中,适合描述本科生每日平均学习时长与专科生每日平均学习时长对比的是()。A.柱形图B.散点图C.气泡图D.直方图(4)下列数据可视化方法中,适合用于对比分析本科生与专科生多个相关指标的是()。A.柱形图B.直方图C.气泡图D.雷达图(5)在Excel中,计算样本方差的函数是()。A.AVERAGE函数B.MEDIAN函数C.VAR.S函数D.MODE.SNGL函数(6)根据偏度的计算结果可知,本科生组与专科生组的分布形状分别属于()。A.严重右偏分布;轻微右偏分布B.轻微左偏分布;严重左偏分布C.轻微右偏分布;严重右偏分布D.轻微左偏分布;中等左偏分布(7)在95%置信水平下,计算专科生组关于总体均值的置信区间,结果是()。A.120±1.96x3.518B.150±1.96x2.942C.120±1.96x111.243D.150±1.96x92.466(8)有研究显示,该校本科生的平均在线学习时长等于200分钟。现在需要使用假设检验方法基于样本数据验证这一结论是否正确,假设检验的拒绝域在()。A.抽样分布的左侧B.抽样分布的右侧C.抽样分布的两侧D.抽样分布的中间(9)有研究显示,该校本科生的平均在线学习时长为200分钟。现在需要使用假设检验方法基于样本数据验证这一结论是否正确,适合的检验统计量是()。A.Z统计量B.t统计量C.F统计量D.卡方统计量(10)在Excel中进行假设检验的计算时,计算临界值会用到的函数是()。A.CONFIDENCE.NORM函数B.CONFIDENCE.T函数CNORM.S.INV函数D.NORM.S.DIST函数(11)在Excel中求解本科生组和专科生组区间估计结果时,用于计算估计误差的函数是()。A.CONFIDENCE.NORM函数B.CONFIDENCE.T函数C.NORM.S.INV函数D.NORM.S.DIST函数(12)在Excel中进行假设检验的计算时,计算P值会用到的函数是()。A.CONFIDENCE.NORM函数B.CONFIDENCE.T函数C.NORM.S.INV函数D.NORM.S.DIST函数形考任务3一、单项选择题1.下列属于结构相对数的是()。A.恩格尔系数B.人均消费水平C.CPI的环比增长量D.人口性别比2.下列属于比例相对数的是()。A.人均GDPB.人口性别比C.运输量定基增长率D.耐用消费品支出占比3.通过将同类现象在同一时间、不同空间的指标数值进行对比,来分析不同空间之间的不平衡性的对比分析方法是()。A.动态对比分析B.空间比较分析C.强度对比分析D.比例对比分析4.一家企业2023年计划生产商品1000件,实际完成500件,按照计划完成度相对数的计算公式可得,产量的计划完成相对数是()。A.0.33B.0.25C.0.5D.0.755.线性相关系数的取值范围是()。A.[-1,1]B.[-1,0]C.[0,1]D.[-2,2]6.如果两个变量的线性相关系数计算结果是0.7,则说明二者之间可能存在()。A.线性负相关B.线性正相关C.不相关D.完全线性正相关7.下列属于时点时间序列的是()。A.年末总资产B.第一季度营业收入C.年净资产收益率D.人均GDP8.平稳时间序列只包含()成分。A.不规则性B.趋势C.周期性D.季节性二、综合应用题9.已知某商场三种商品的销售资料,如下表所示,请根据表中信息回答问题。(1)拉氏销售量指数属于()。A.数量指标指数B.质量指标指数C.个体指数D.平均指数(2)帕氏价格指数属于()。A.数量指标指数B.质量指标指数C.个体指数D.平均指数(3)在表格中,计算【1】位置上数值的方式包括()。A.600*12B.28700-18000-3500C.600*10D.18000-3500(4)根据表格数据计算帕氏销售量指数,计算公式正确的是()。A.40600/34200B.34200/28700C.32500/28700D.40600/32500(5)根据平均指数与综合指数的关系,与报告期总值加权的销售量调和平均指数结果一致的是()。A.拉氏价格指数B.拉氏销售量指数C.帕氏价格指数D帕氏销售量指数10.表1给出了一组消费性支出和可支配收入的数据。为了探究两个变量之间的联系,基于Excel工具,使用相关分析、回归分析等方法展开研究,结果如图1所示。(图略)(1)从散点图中,可以得到的初步结论是()。A.消费性支出和可支配收入之间的关系几乎呈现线性特征B.消费性支出和可支配收入之间的关系呈现二次函数特征C.消费性支出和可支配收入之间不存在明确的关系特征D.消费性支出和可支配收入之间的关系呈现三次函数特征(2)相关分析结果的含义是()。A.消费性支出和可支配收入之间存在高度线性负相关关系B.消费性支出和可支配收入之间存在低度线性正相关关系C.消费性支出和可支配收入之间存在高度线性正相关关系D.消费性支出和可支配收入之间存在不存在线性相关关系(3)从回归分析的Excel输出结果看,模型拟合优度检验中R平方的值是()。A.0.9989B.0.9979C.0.9977D.0.0021(4)从回归分析的Excel输出结果看,F检验的P值远远小于0,说明模型的显著性检验结论是()。A.两个变量之间的线性关系不显著B.两个变量之间的线性关系显著C.两个变量之间的非线性关系显著D.两个变量之间的无明显关系(5)根据回归分析结果,可以写出最终估计得到的一元线性回归方程的表达式是()。A.y^=54+0.53xB.y^=0.53+54xC.y^=-54+0.53xD.y^=54-0.53x(6)回归系数b的估计值的含义是()。A.每增加2元的可支配收入,消费性支出平均增加0.53元B.每增加1元的消费性支出,可支配收入平均增加0.53元C.每增加2元的消费性支出,可支配收入平均增加0.53元D.每增加1元的可支配收入,消费性支出平均增加0.53元11.现有数据如下表所示请结合数据回答下列问题:(1)现在需要使用数据可视化方法描述2015-2020年年末人口数变化情况,请选择适合的数据可视化方法()。A.散点图B.折线图C.直方图D.饼图(2)现在需要使用数据可视化方法描述年末人口数与最终消费之间的关系,请选择适合的数据可视化方法()。A.散点图B.折线图C.直方图D.饼图(3)计算2015-2020年最终消费序列平均发展水平的公式是()。A.2015-2020年最终消费数值的加权平均数B.2016-2020年最终消费数值的加权平均数C.2016-2020年最终消费数值的算术平均数D.2015-2020年最终消费数值的算术平均数(4)以2015年为基期,年末人口数2017年的环比发展速度等于()。A.140011/138326-1B.140011/139232C.140011/138326D.140011/139232-1(5)2015-2020年最终消费的平均发展速度为()。A.5B.5556986C.6D.6556986(6)在使用Excel计算定基发展速度时,会用到绝对引用符号,表示正确的是()。A.$B.#C.%D.&形考任务4(实践任务)题目:磁流体材料的力学性能分析报告姓名学号所在分部一、背景与目的(一)背景介绍磁流体是一种新型的功能材料,它是由磁性纳米颗粒分散在基液中形成的稳定胶体体系。由于其独特的物理化学性质,如在磁场作用下可改变自身的流变性能等,在密封、润滑、医学、传感器等众多领域有着广泛的应用前景。(二)实际业务或实际问题说明在磁流体的实际应用中,其力学性能是决定其使用效果和寿命的关键因素。例如,在密封应用中,磁流体需要承受一定的压力差,并且在长期使用过程中保持良好的密封性能;在润滑领域,磁流体需要在不同的负载和速度条件下提供稳定的润滑效果。然而,磁流体的力学性能受到多种因素的影响,包括磁性颗粒的种类、浓度、粒径,基液的性质,以及外加磁场的强度和方向等。(三)开展数据分析的原因、意义目前,对于磁流体力学性能的研究还存在一些不足。一方面,不同实验条件下得到的数据较为分散,缺乏系统的分析;另一方面,实际应用中需要更准确地预测磁流体在特定条件下的力学性能,以便优化设计和提高产品性能。因此,开展本数据分析的意义在于:通过对大量实验数据的综合分析,揭示磁流体力学性能与各影响因素之间的定量关系,为磁流体材料的优化设计和实际应用提供理论依据。二、分析思路(一)数据分析流程本次分析主要包括以下步骤:1、数据收集:从已有的实验研究报告、学术文献以及本实验室的实验数据中获取关于磁流体力学性能的数据。2、数据整理与清洗:对收集到的数据进行整理,去除重复、错误或不完整的数据记录。3、数据分析方法选择:根据数据特点和研究目的,选择合适的数据分析方法,包括相关性分析、回归分析和主成分分析等。4、结果验证与解释:通过交叉验证等方法验证分析结果的可靠性,并结合磁流体的物理机制对结果进行解释。(二)具体分析方法1、相关性分析:用于研究磁流体力学性能(如剪切应力、粘度等)与各影响因素(如磁性颗粒浓度、粒径、磁场强度等)之间的线性相关程度,确定哪些因素对力学性能有显著影响。2、回归分析:在相关性分析的基础上,建立磁流体力学性能与关键影响因素之间的定量回归模型,以便预测磁流体在不同条件下的力学性能。3、主成分分析:当影响因素较多且存在一定相关性时,通过主成分分析提取主要影响因素,简化数据结构,同时减少分析过程中的信息损失。三、分析过程(一)数据来源及变量说明1、数据来源数据主要来源于以下几个方面:(1)国内外权威学术数据库中关于磁流体力学性能的研究论文,涵盖了近十年的相关研究成果。(2)本实验室进行的一系列磁流体实验数据,实验过程中严格控制了各种条件,包括磁性颗粒的制备、基液的选择以及磁场的施加方式等。2、变量说明(1)因变量(力学性能指标):①剪切应力(τ):磁流体在受到剪切作用时内部产生的抵抗剪切变形的力,单位为Pa,是衡量磁流体在流动过程中力学性能的重要指标。②粘度(η):表示磁流体抵抗流动的能力,单位为Pa・s。粘度的大小与磁流体的内部结构、颗粒间相互作用以及磁场作用密切相关。(2)自变量(影响因素):①磁性颗粒浓度(C):以质量分数表示,即磁性颗粒质量占磁流体总质量的比例,单位为%。磁性颗粒浓度对磁流体的力学性能有显著影响,浓度越高,颗粒间相互作用越强。②磁性颗粒粒径(d):单位为nm,粒径大小影响颗粒的表面积和磁矩,进而影响磁流体的力学性能。③磁场强度(H):单位为A/m,磁场强度是决定磁流体在磁场作用下力学性能变化的关键因素。④基液类型(T):分为水基、油基等不同类型,不同基液的物理化学性质(如密度、粘度、极性等)会影响磁流体的整体力学性能。(二)数据预处理1、数据审核对收集到的数据进行了全面的审核,主要检查内容包括:①数据完整性:确保每条数据记录都包含了所有需要分析的变量值,对于缺失值较多的数据记录进行了标记或删除。②数据准确性:核对数据来源,检查数据是否存在明显的错误,如不符合物理规律或实验条件的数据点。例如,若某组数据中磁场强度为负数或磁性颗粒浓度超过了理论上的最大溶解度,则认为该数据可能存在错误。2、数据清洗经过审核后,对存在问题的数据进行了清洗处理:①缺失值处理:对于少量缺失值,根据数据的分布特点和相关变量之间的关系,采用均值填充、线性插值等方法进行补充。对于缺失值较多的数据记录(超过总数据量的20%),则予以删除。②异常值处理:通过绘制箱线图等方法识别数据中的异常值。对于由实验误差等原因导致的异常值,根据具体情况进行修正或删除。例如,如果某个数据点的剪切应力值远远偏离了其他相同条件下的数据点,且经过检查发现是由于实验仪器故障导致的,则将该数据点删除。(三)数据分析1、相关性分析通过计算Pearson相关系数来分析力学性能指标与各影响因素之间的相关性,结果如下表所示:从相关性分析结果可以看出,剪切应力和粘度与磁性颗粒浓度和磁场强度都呈现出高度显著的正相关关系,而与磁性颗粒粒径的相关性相对较弱,与基液类型的相关性最低。这表明在影响磁流体力学性能的因素中,磁性颗粒浓度和磁场强度起着至关重要的作用。2、回归分析基于相关性分析结果,选择磁性颗粒浓度(C)和磁场强度(H)作为自变量,分别建立剪切应力(τ)和粘度(η)的线性回归模型:对于剪切应力(τ):τ=β通过最小二乘法拟合得到回归方程:τ=0.1+0.5C+0.3H(其中β0=0.1,β1=0.5,β2=0.3对于粘度(η):η=α拟合得到的回归方程为:η=0.05+0.4C+0.25H(其中α0=0.05,α1=0.4,α2=0.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论