2024年CDA数据分析师认证题库_第1页
2024年CDA数据分析师认证题库_第2页
2024年CDA数据分析师认证题库_第3页
2024年CDA数据分析师认证题库_第4页
2024年CDA数据分析师认证题库_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CDA等级考试模拟題库:《基础理论部分》第一部分:判断題记录學是研究社會领域和自然领域的规律的实质性科學。大量观测法是记录研究的最基本的措施。總体單位的属性既可以用数值表达,也可以用文字表达。對任何一事物進行记录研究的前提是构成记录總体的各個個体單位必须具有的差异性。构成總体的各個個体單位至少在某一属性上相似,才能精确地确定總体范围。记录學与哲學相似,属于认识客观世界的最一般的措施论科學。运用记录措施E以研究和解释事物发展的原因和规律。總体的同质性、变异性、大量性是平均法的应用前提。在用计算机数据進行汇總時,往往将男性用“1”来表达,女性用“0”来表达,因此可以讲性别视為量别变量。在人工干预或操作状况下搜集的数据称為试验数据。截面数列按分组標志不一样可以分為品质数列和变量数列。同龄人的身高,用频数曲线描述一般体現為钟型分布。欲掌握我国人口与否具有老龄化特性,對人口按年龄分组,适合采用等距式分组。14.對在校大學生的年龄進行分组适合采用组距式分组。在组距式分组中,采用组中值作為每组一般水平的代表值。直方图仅合用于显示持续型分组数据。茎叶图不仅可以反应数据的分布状况,還能显示数据的原始信息。频数分布表中的组距在茎叶图中称為步長。变异指標与集中趋势指標成正比。箱索图的長处是便于同步比较多组数据的分布特性。假如一组数据呈正态分布,则算术平均数的大小不會受极端值的影响。计算加权算术平均数時,若各组权数相似,权数對算术平均数成果没有影响。若一•组数据的众数不小于算术平均数時,该数据呈右偏分布。當一组数据分布明显偏斜時,不适宜采用算术平均数作為中心趋势的测度值。當一组数据的各個观测值与该组数据的算术平均数的离差平方和等于零。中位数与众数相似,具有唯一性的特點。根据组距式分组数据计算的加权算术平均数有時會产生较大的误差。任一•组数据都可以计算算术平均数、众数和中位数三個集中趋势指標。第二部分:單项选择題调查城镇居民對政府服务的满意度,需要抽取足够的居民,這种措施称為()随机抽样法记录分组法回归分析法大量观测法用部分数据推断總体数据的措施,属于()理论记录學的内容应用记录學的内容推断记录學的内容描述记录學的内容构成一种记录總体,必须具有若干特性,下列不属于记录總体特性的是()A.数量性 B.同质性C.变异性 D.大量性下列不属于原始数据来源的是()行政记录记录调查记录年鉴试验在進行普查時,必须要规定原则時间,其目的是為了()防止登记的反复和遗漏确定调查對象的范围确定调查單位保证调查的及時性某出口企业對其产品质量進行检查,采用的调查方式是()普查 B.随机抽样调查判断抽样调查 D.以便抽样调查理解居民消费水平的变化状况,一般采用入户调查。确定样本户的方式是()系统抽样分层抽样整群抽样多步抽样抽样调查与普查的主线区别是()选用观测值的措施不一样 D.精确度不一样在抽样调查中,()不會出現登记性误差,只會出現代表性误差會出現登记性误差,不會出現代表性误差既會出現登记性误差,也會出現代表性误差既不會出現登记性误差,也不會出現代表性误差记录调查表中的调查项目就是()记录指標 B.记录数值记录分组 D.记录標志街頭拦截获得样本数据的方式属于()普查 B.以便抽样调查判断抽样调查 D.随机抽样调查普查中的標志時间是指()進行调查工作的時间 B.调查数据所属時间C.记录数据的時间 D.数据上报的時间某次调查搜集了300名學生的性别、专业和月手机支出额的数据,這项调查的变量個数有()1個B.2個C.3個D.300個构成截面数据的两個要素是()A组距和各组频数 B组限和各组频数C组中值和各组频数 D分组標志和各组频数在全距既定的状况下()组数越多则组距越大组数越多则组距越小组数越少则组距越小组数与组距無對应关系适合编制單值数列的数据是()持续型变量且数据变動范围较小离散型变量且数据变動范围较小持续型变量且数据变動范围较大离散型变量且数据变動范围较大在编制等距式分组数列時假如全距57,组数為7,為了计算以便,组距应當取()8.1 B.8 C.7 D.10在平面直角坐標轴中,横轴刻度表达直方图的()A.频数 B.组中值C.组距 D.组限對数据進行分组時,采用等距分组還是异组距分组,取决于()变量值的多少次数的多少研究現象的特點组数的多少對工业企业按經济类型分组和按利润额分组()A.都属于质别標志分组都属于量别標志分组前者属于质别標志分组,後者属于堇别標志分组前者属于量别標志分组,後者属于质别標志分组集中趋势描述指標中最常用的是()算术平均数B.几何平均数C.众数D.中位数在离中趋势的描述指標中,最轻易受极端值影响的是()A变异系数 B方差C全距 D原则用组中值来计算均值時,假定各组变量()次数相等组限是封闭的在组内均匀分布或對称分布组中值是整数两组数据的均值不等,但原则差相等,则()A.均值大的一组数据差异程度大 B.均值小的一组数据差异程度大C.两组数据的差异程度相似 D.無法對两组数据進行比较已知甲班學生“记录學”的平均成绩為86分,原则差是12.8分,乙班學生“记录學”的平均成绩是90分,原则差是10.3分,下列表述對的的是()乙班平均成绩的代表性高于甲班甲班平均成绩的代表性高于乙班甲、乙两班平均成绩的代表性相似甲、乙两班平均成绩的代表性無法比较對同一变量数列,以不一样集中趋势指標為中心计算原则差,原则差数值最小的是()A.以中位数為中心计算的原则差以算术平均数為中心计算的原则差以众数為中心计算的原则差以几何平均数為中心计算的原则差某地区城镇居民家庭年收入最多的是7.2萬元,家庭年收入的平均数是8萬元,该地区家庭年收入的分布為()A.左偏分布B.右偏分布C.J型分布D.對称分布权数對算术平均数的影响取决于( )。A权数的總和B权数的绝對值C权数的平均数D权数的相對数某市有各类書店500家,其中大型50家,中型150家,小型300家。為了调查该市图書销售状况,拟抽取30家書店進行调查。假如采用分层等比例抽样法,下列在大型、中型、小型書店中样本的對的分派量為()5、15、10 B.7、10、13C.10、10、10D.3、9、18抽样调查中,無法防止和消除的是()登记误差 B.系统性误差C.随机误差 D.测量工具误差估计量的数學期望等于總体参数這一性质称為()A.一致性 B.無偏性C.有效性 D.随机性總体均值的置信区间等于样本均值加減估计误差,其中的估计误差等于置信水平的临界值乘以()样本均值的抽样原则差 B.样本標志差C.样本方差 D.總体標志差下列有关记录量的表述中,不對的的是()A.记录量是样本的函数估计同一總体参数可以用多种不一样记录量记录量是随机变量记录量的数值是唯一的某品牌袋装白糖每袋重量的標志是500±5克。為了检查该产品的重量与否符合原则,現從某曰生产的這种糖果中随机抽查10袋,测得平均每袋重量為498克。下列說法中錯误的是()A.样本量為10 B.抽样误差是2克C.样本平均每袋重量是估计量D.點估计值為498克對一部贺岁片收视率進行调查,随机抽取100人,其中有20人没有看過该部贺岁片,则看過该部贺岁片人数點估计值為()20% B.20 C.80 D.80%某企业根据對顾客随机抽样的信息得到對该企业产品表达满意的顾客比率的95%置信度的置信区间是(56%,64%)o下列對的的表述是( )。總体比率的95%置信度的置信区间為(56%,64%)總体真实比率有95%的也許落在(56%,64%)中区间(56%,64%)有95%的概率包括了總体真实比率由100次抽样构造的100個置信区间中,约有95個覆盖了總体真实比率第三部分:多选題记录學的内容包括( )决策的措施 B.数据的描述措施C.数据的推断措施 D.数理的分析措施数据的整顿措施记录数据必须具有的特點是( )C.详细性C.详细性D.通用性E.總和性描述记录學的内容包括( )搜集数据的措施整顿数据的措施用集中趋势量数描述数据用离中趋势量数描述数据用样本数据對總体数据進行推断推断记录學的内容包括( )搜集数据的措施怎样從總体中抽取样本用集中趋势量数描述数据怎样控制样本對總体的代表性误差用样本数据對總体数据進行推断记录数据的特點( )大量性客观性详细性總合性数量性记录数据按来源分类,可以分為( )质别数据次级数据量别数据初级数据截-面数据在抽样调查中,产生非抽样误差的原因有( )錯误地定义调查總体 B.問卷设计的不合理C.抽样措施不對的 D.被调查人员的配合程度调查人员的工作态度和业务水平调查過程中产生登记误差的原因是( )调查者记录数据有误调查者计算数据有误调查者汇總数据有误被调查者提供数据有误调查样本分布不合理對采集来的初级数据在整顿之前应當進行( )有关性审核完整性审核時效性审核合用性审核精确性审核调查的目的 B.确定调查的對象C.确定调查项目和调查表D.确定调查時间和地點确定调查的组织计划對于次级数据,应當進行如下某些方面的审核( )A.完整性 B.精确性C.時效性 D.合用性E.合理性记录分组应當遵照的基本原则是( )穷尽合用互斥合理随机有关离散型变量,下列表述對的的是( )可以采用單值分组可以采用组距分组相邻组的上下限可以间断相邻的上下限可以重叠可按“上限不在组内”原则处理上下限相似的变量编制频数分布表的目的是()A.显示数据的差异显示数据的分布状况显示数据的中心显示数据的互相关系显示数据的属性编制组距数列時,對于组限确实定,( )最小组的下限应不小于最小变量值最小组的下限应略不不小于最小变量值最大组的上限应不不小于最大变量值最大组的上限应略不小于最大变量值最小组的下限和最大组的上限应分别等于最小和最大变量值下列可以表达持续型变量的记录图有( )A.条型图 B.直方图C.折线图 D.饼图E.茎叶图對的计算组中值的措施是( )(上限+卜限)/2上限+下限/2上限■下限/2上限.邻组组距/2下限+邻组组距/2计算变异系数是為了比较( )不一样变量数列的相對集中趋势不一样变量数列的相對高中趋势不一样变量数列的绝對离中趋势均值不一样的变量数列的相對集中趋势均值不一样的变量数列的相對离中趋势茎叶图包括如下信息( )变量的原始数据信息变量的频数信息累积频数信息数据的分布形态信息数据的众数信息一组数据的原则差数值越小,阐明该组数据的( )A分布遠离集中趋势指標 B集中趋势指標具有较高的代表性C分布比较靠近集中趋势指標 D集中趋势指標具有较低的代表性E分布呈均匀分布箱索图是用一组数据的五個次序记录量来描述数据的分布状况的,這五個记录量是()A中位数 B众数 C四分位数D极值 E算术平均数TOC\o"1-5"\h\z变异系数抽象了( )總体指標数值多少的影响B.總体單位数多少的影响C.標志变動度的影响D.平均水平的影响E.计量單位的影响不一样總体间的原则差不能简朴地進行比较,是由于( )计量單位不一样 B.离差平方之和不一样 C.總体單位数不一样 D.平均指標不一样 E.標志差不一样A.是数据排序後处在中间位置的数值 B.不受极端数值的影响是-•组数据一般水平的代表值當数据高度偏斜時更能描述集中趋势 E.是根据所有標志值计算出来的有关众数,下列說法對的的有( )是数据中出現次数最多的標志值不受极端数值的影响是-•组数据一般水平的代表值對一种变量数列来說不一定存在是根据所有观测值计算出来的基本的随机抽样设计有( )整群抽样分层抽样简朴随机抽样系统抽样多步抽样下列哪些状况符合使用正态分布的条件?()從正态總体中抽取小样本,總体標志差已知從正态總体中抽取大样本,總体標志差LL知從非正态總体中抽取小样本,總体原则差已知從非正态總体中抽取大样本,總体標志差未知從正态總体中抽取小样本,總体原则差未知A.一致性B.把握性C.有效性 D.無偏性E.正态性在對總体均值進行区间估计時,影响置信区间宽度的影响是( )總体中各個数据的差异程度抽取样本的方式样本容量的大小估计的可靠性總体数量的大小要提高抽样判断的精度,可采用的措施有()增長样本單位数目減少样本單位数目缩小观测值之间的差异程度改善抽样的组织方式改善抽样的措施《SPSS部分》(一)單项选择題SPSS重要应用于如下哪种类型的数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论