版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、社会统计学复习题社会统计学复习题 一、名词解释 1、社会统计学 2、中位数 3、众数 4、点估计:所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。 5、区间估计:所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。 6、置信区间:置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。 7、消减误差比例:变量间的相关程度,可以用不知 Y 与 X 有关系时预测 Y 的EE,再将其化为比例来度量。的误差 X 有关系时预测 Y 误差,减去知道 Y 与10将削减误差比例记为 PRE。 8、因果关系:变量之
2、间的关系满足三个条件,才能断定是因果关系。1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。 9、正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。 10、散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察 X 与 Y 的相互关系,即得相关图,又称散点图。 X?XY?Y,则中看到的是,在 X 序列时,如果看到
3、Y11、同序对:在观察jjii称这一配对是同序对。 X?XYY,则 Y12、异序对:在观察 X 序列时,如果看到中看到的是,在jiji称这一配对是异序对。 13、大数定理:当我们的观察次数 n 趋向无限时,随机事件可能转换为不可能事件或必然事件。即,在大量观察的前提下,观察结果具有稳定性。 二、选择题二、选择题 6下面能进行除法运算的测量尺度是( ) A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 7教育程度是( )的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 8智商是( )的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 9籍贯是( )的测量 A
4、定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 10在社会统计学中, ( )是反映集中趋势最常用、最基本的平均指标。 A 中位数 B 算术平均数 C 众数 D 几何平均数 11关于学生 t 分布,下面哪种说法不正确( B ) 。 A 要求随机样本 B 适用于任何形式的总体分布 ? 代替总体标准差 D 可用样本标准差 S 可用于小样本 C 12在统计检验中,那些不大可能的结果称为( D )。如果这类结果真的发生了,我们将否定假设。 A 检验统计量 B 显著性水平 C 零假设 D 否定域 13在用样本指标推断总体指标时,把握程度越高则( B ) 。 A 误差范围越小 B 误差范围越大 C 抽样
5、平均误差越小 D 抽样平均误差越大 14当 x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说 x与 y 之间存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 15评价直线相关关系的密切程度,当 r 在 0.50.8 之间时,表示( C ) 。 A 无相关 B 低度相关 C 中等相关 D 高度相关 17关于相关系数,下面不正确的描述是( B ) 。 ?r?10 时,表示两变量不完全相关; A 当 B 当 r=0 时,表示两变量间无相关; 两变量之间的相关关系是单相关;CD 如果自变量增长引起因变量的相应增长,就形成正相关关系。 18欲以图形显示
6、两变量 X 和 Y 的关系,最好创建( D ) 。 A 直方图 B 圆形图 C 柱形图 D 散点图 19两变量 X 和 Y 的相关系数为 0.8,则其回归直线的判定系数为( C ) 。 A 0.50 B 0.80 C 0.64 D 0.90 20在完成了构造与评价一个回归模型后,我们可以( D ) 。 A 估计未来所需样本的容量 B 计算相关系数和判定系数 C 以给定的因变量的值估计自变量的值 D 以给定的自变量的值估计因变量的值 21两变量的线性相关系数为 0,表明两变量之间( D ) 。 A 完全相关 B 无关系 C 不完全相关 D 不存在线性相关 23在相关分析中,对两个变量的要求是(
7、A ) 。 A 都是随机变量 B 都不是随机变量 C 其中一个是随机变量,一个是常数 D 都是常数 24在回归分析中,两个变量( D ) 。 A 都是随机变量 B 都不是随机变量 C 自变量是随机变量 D 因变量是随机变量 25一元线性回归模型和多元线性回归模型的区别在于只有一个( B ) 。 D 判定系数 C 相关系数 A 因变量 B 自变量 D ) 。 26以下指标恒为正的是( 复相关系数 D C 斜率 b r A 相关系数 B 截距 a ) 。A 27下列关系中,属于正相关关系得是( 产品与单位成本 B A 身高与体重 D 商品的零售额和流通费率 C 正常商品的价格和需求量 )28、下列
8、变量中属于定序变量的是( 、身高 C、职称等级 D 、学生学号 A、门牌号 B )29、用具有频数最多的变量值来表示变量的集中值被称为( 、四分位差 D 、均值 C 、中位值 B 、众值 A30、标准差数值越小,则反映变量值( ) A、越分散,平均数代表性越低 B、越集中,平均数代表性越高 C、越分散,平均数代表性越高 D、越集中,平均数代表性越低 31、下面不属于正态分布图特征的是( ) A、有一条对称轴 B、有一条渐近线 C、有一个顶点 D、有 2 个单位的面积。 32、直方图具备的特征是( ) A、高度代表频次 B、宽度代表频次 C、面积代表频次 D、各分段组可以分开 33、采用回置法,
9、从一副 52 张扑克牌里抽取两次,抽中两张红桃的概率为( ) A、1/52 B、1/16 C、1/13 D、1/4 34、下列属于定类层次相关分析法的是( ) A、斯皮尔曼系数 B、Lambda 系数 C、Gamma 系数 D、eta 系数 35、当样本量 n=25 时,我们对其进行均值检验时,应该选用( )方法进行。 A、Z 检验 B、F 检验 C、T 检验 D、上述三者都可以 36、如果,XX ,YY,那么,就称被调查者 i 和 j 这一配对为( ) 。 jiijA、异序对 B、同序对 C、X 的同分对 D、Y 的同分对 37、一般认为:积差系数 r 值等于 0.3 为( ) 。 A、完全
10、相关 B、高度相关 C、中等相关 D、无相关 38、下列变量中不属于定类变量的是( ) 。 A、车牌号 B、手机号 C、学历 D、性别 39、数列 2、3、5、1、7、9、2 的中位值是( ) 。 A、5 B、3 C、2 D、1 40、两个正态分布分别为:N(1,25)和 N(5,36) ,将两个正态分布作图,下列说法错误的是( ) 。 A、前者图形的顶端更细小 B、前者图形更靠左 C、后者图形的顶端更细小 D、后者图形更靠右 41、直方图里,频次由( )来表示。 、组距 D 、宽度 C 、高度 B 、面积 A42、从一副 52 张的扑克牌中抽一张牌,抽到一张红桃或者方块的概率是( ) 。 A
11、、1/5 B、1/4 C、1/3 D、1/2 43、下列属于定类层次相关分析法的是( ) A、斯皮尔曼系数 B、Lambda 系数 C、Gamma 系数 D、eta 系数 44、从某公司抽取 200 名员工作为样本进行调查,进行推论分析时,除了( )外,其他三个都是我们采用 Z 检验法的原因。 A、样本容量数符合小样本要求 B、总体符合正态分布 C、满足大数定理要求 D、样本容量达到大样本要求。 45、如果,XX ,YY,那么,就称被调查者 i 和 j 这一配对为( ) 。 jiijA、异序对 B、同序对 C、X 的同分对 D、Y 的同分对 46、区间估计里,置信区间内的置信度大小为( ) 。
12、 A、 B、 C、1- D、1- 47、简单线性回归分析中,两变量的层次分别为( ) A、定类定类 B、定类定序 C、定序定距 D、定距定距 三、填空题 1 ( )和中心极限定理为抽样推断提供了主要理论依据。 2抽样推断中,判断一个样本估计量是否优良的标准是(无偏性) 、 (一致性) 、(有效性) 。 3在一副扑克牌中单独抽取一次,抽到一张红桃或 K 的概率是( 1/4 ) ;在一副扑克牌中单独抽取一次,抽到一张红桃 K 的概率是( 1/52 ) 。 5不论总体是否服从正态分布,只要样本容量 n 足够大,样本平均数的抽样分布就趋于(正态)分布。 6统计检验时,被我们事先选定的可以犯第一类错误的
13、概率,叫做检验的( 显著性水平 ),它决定了否定域的大小。 7假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越( 大 ) ,原假设为真而被拒绝的概率越( 小 ) 。 8参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计 。 ) 区间估计 和(9变量间的相关程度,可以用不知 Y 与 X 有关系时预测 Y 的全部误差 E,减1去知道 Y 与 X 有关系时预测 Y 的联系误差 E,再将其化为比例来度量,这就是2( 削减误差比例 ) 。 10依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)Y是服从( 实际观察值 Y 围绕每个估计值) ; c11
14、根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ) ,并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 ) 12、变量层次一般分为 、 、 和 。 13、统计按其内容主要包括两个方面: 分析和 分析。 14、定类层次主要的集中趋势法是 ,定序层次主要的离散趋势法是 。 15、统计推论分为参数估计和 ,其中参数估计又分为 和 。 16、置信区间与可信度之间是成 关系,即估计的区间越大,则可信度也就 越 。 17、根据样本计算出来的一切统计数字特征值被称为 ,总体值称为 。
15、18、众数运用 层次变量的集中趋势分析,中位数用于 层次变量 的集中趋势分析,均值用于定距层次变量的 分析,标准差用于定距层次 变量的 分析。 19、正态分布图的形状和位置主要由 和 决定。 20、测量两个变量的相关系数时,首先考虑的是变量的 ,其次考虑变量 间是否对称,最后最好选用具备 意义的相关系数。 21、以样本的统计值来估计总体的参数值,有两大类做法,一类是 ,另一 类是 ,二者均要求样本是以 方法抽取的。 22、某一孕妇生男生女纯属偶然现象,但全市出生的婴儿性别比例一直维持在50%左右,这种现象称为 定理。 23、假设检验时,首先需要做出 假设和被择假设,并以 假设为基础进 行数据推
16、导,如果我们的统计检验值落在 ,我们就应该接受被择假设。 三、判断题三、判断题 1社会统计描述,即通过部分研究对象的统计资料对研究对象的总体的性质进行推论与归纳。 ( ) 2推论统计需要的统计资料相对而言较少,所以在人力、物力及时间等方面比较经济,研究和应用的范围也拓宽了许多。 ( ) 3无论分布曲线是正偏还是负偏,中位数都居算术平均数和众数之间。 ( ) 4在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危险不变的情况下,减少犯第二类错误的危险。 ( ) 5统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。 ( ) ?表示)用被定义为能允许犯第一类错误的概率
17、,它决定了 6检验的显著性水平(否定域的大小。 ( ) 7第一类错误是,零假设 H 实际上是错的,却没有被否定。第二类错误则是,0零假设 H 实际上是正确的,却被否定了。 ( ) 08每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合适。 ( ) 9.进行区间估计,置信水平总是预先给定的。 ( ) 10由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。 ( ) r1 时,变量 X 和变量不管相关关系表现形式如何,当 Y 都是完全相关。11( ) r0 时,变量 X 和变量 Y12 都是完全不相不管相关关系表现形式如
18、何,当关。 ( ) 13通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布Y的相对频数条件分布必然存在着的比较进行的。而如果两变量间是相关的话,相同,且和它的相对频数边际分布相同。 ( ) 14如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于 0,?从而无法显示两变量之间的相关性。 ( ) 从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而15回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。 ( ) 16、离散趋势是测量数据间的差异程度。 ( ) 17、两个定类变量间的相关系数范围在1,1间。 ( ) 18、相关系数 r 等于1,说
19、明变量之间不存在相关关系。 ( ) 19、标准正态分布的曲线对称轴为 X=0。 ( ) 20、当样本量 n30 时,无论 n 如何增大,样本的统计值倾向稳定。 ( ) 21、参数估计就是在一定的抽样误差内设一个可置信的区间,然后联系到这个区间的精度,将样本的统计值推断为总体的参数值。 ( ) 22、假设检验与参数估计最终关心的都是总体的参数状况。 ( ) 23、利用样本对总体进行区间估计时,置信度越高,则区间就越窄。 ( ) 24、假设检验过程中,如果统计检验值大于临界值,则拒绝零假设。 ( ) 25、在积矩相关分析结果 r=0,则说明两变量不呈直线相关。 ( ) 26、根据研究需要,可以将定
20、距变量降格为定类变量进行分析。 ( ) 27、某公司员工的月收入标准差为 100 元,说明该公司员工收入差距大。 ( ) 28、直方图用于定类层次的变量作图。 ( ) 29、推论统计关注的是样本的统计值而不是总体的参数值。 ( ) 30、对大样本的假设检验选用 Z 检验法,主要是因为它满足正态分布。 ( ) 31、两端假设检验中,否定域的大小为 。 ( ) 32、样本容量多少与研究容许的误差大小呈正比。 ( ) 33、从同一总体中抽出的多个大样本的均值组成的数列满足正态分布。 ( ) 34、如果两个变量是呈相关关系,那么它们一定呈因果关系。 ( ) 35、在积矩相关分析结果 r=0,则说明两变
21、量不相关。 ( ) 四、计算题 1某工厂 50 名职工每周工资数分配情况如下表,试求:(1)算术平均;(2)中位数;(3)众数。 工资数(元) 人数 3 62 60 10 65 6320 68 6613 71 694 74 750合计 2、某车间职工工资分布情况如下表,求该车间职工的平均工资,职工工资的中位数以及标准差。 100-120 120-140 140-160 160-180 180-200 按月工资分组 6 21 30 18 15 工人人数 为了验证该统计报表的正确性,元,3、某单位统计报表显示,人均月收入为3030 问能否 100 作了共人的抽样调查,样本人均月收入为 3060 元
22、,标准差为80 元, 。 05)0 说明该统计报表显示的人均收入的数字有误(取显著性水平 ,经过戒烟宣传之后,进行了抽样调查,发现了、某地区成人中吸烟者占754 人是吸烟者,问戒烟宣传是否收到了成效?( 名被调查的成人中,有63100 0.05) 061635、从某校随机地抽取 81 名女学生,测得平均身高为厘米,标准差为 厘米,试求该校女生平均身高 95的置信区间。 人,调 2006、对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为转化为相对频数的联合分布列联表转查结果示于下表,试把该频数列联表:指出对于民族音乐的态度与被调查者的年岁化为相对频数的条件分布列联表; 有无关系,并说明理
23、由。 )年岁(X 对于民族音乐的 态度(Y) 青 中 老 喜 欢 38 38 30 15 33 46 不喜欢 7、以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之 Gamma 系数。 文化程大中小婚姻美 5169 满 18 30 8 一 般 7 4 3 不美满 X8、两变量、Y 之间的关系如下表, 12 4 2 6 8 10 X 4 7 5 Y 14 10 9 (1)求回归方程;(2)求相关系数。 【Y=-0.957X+14.867】 【r=0.98】 9、试就下表所示资料,计算关于身高和体重的皮尔逊相关系数。 N 体重(千克) 身高(厘米)0 1 160 51 56 161 2 59 3 165 66 4 1656316757061706971727381748017696510180 10、某工厂 50 名职工每天工资数分配情况如下表,试求 :(1)众数所在的组;(2)中位数;(3)平均数。 工资数(元) 人数 3 79 709 89 8020 99 9014 109 1004 119 11050 合计 位员工工作满意度和企业归属感的调查数据,请求出其 4011、下表是对 Gamma 系数,并解释其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电子商务专业顶岗实习报告(5篇)
- 会计实习报告范文汇编7篇
- 大学毕业生个人自我评价
- 护士转正述职报告集锦15篇
- 函授大学生毕业自我鉴定
- 小学二年级数学教案15篇
- 生物下学期工作计划
- 2024年太阳能光伏组件高空清洗高空作业人员安全生产责任认定合同3篇
- DB45T 2652-2023 食用植物油生产主要工序单位产品能源消耗限额
- 2025年新版购房协议合同模板范文
- 《学前教育科学研究方法》全套课件(完整版)
- MATLAB二分法和牛顿迭代法实验报告
- 初二物理速度计算题及答案
- 心电图机操作(课堂PPT)
- 财产清查课件
- 广告牌拆除施工方案
- 某机械厂降压变电所电气初步设计
- 2014附件3杆塔高处作业防坠技术措施0825
- 建筑工程挂靠协议书范本3篇
- 细胞信号传导
- 工程设计变更管理台账
评论
0/150
提交评论