统计分析软件 试题及答案 共3套_第1页
统计分析软件 试题及答案 共3套_第2页
统计分析软件 试题及答案 共3套_第3页
统计分析软件 试题及答案 共3套_第4页
统计分析软件 试题及答案 共3套_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析软件课程模拟试卷(1)(时间:年月日,共100分钟)48学时,3学分,闭卷,总分100分,占总评成绩50%注:此页不作答题纸,请将答案写在答题纸上一、填空题(本题20分,每小题2分)1.x=c(7,12,9,15,8,7,14),则R命令median(x)返回结果是:2.在R命令行键入setwd("d:/R32")的含义是3.x<-c(23,42,15,26,37),则R命令sort(x)的输出结果是4.R命令temp=c(4,6,3),则rep(temp,3)的输出结果是5.R命令any(c(1,3,5,7)>3)的输出结果是6.R程序a<-c(1:3,seq(2));print(a)的输出结果是7.已知a<-1:100,取出向量a中偶数位置上的元素的R表达式应为8.现有R函数:color<-function(t)switch(t,r='red',g='green',b='blue'),则color('b')的运行结果为9.Python中的可变数据类型有10.Python列表对象aList的值为[3,4,5,6,7,9,11,13],那么aList[3:]得到的值是二、单项选择题(本题20分,每小题2分)1.根据所采用的计量尺度不同,可以将统计数据分为( )   A. 分类数据、顺序数据、间隔数据和比率数据  B. 原始数据与二手数据   C. 观测数据与实验数据  D. 时序数据与横截面数据2.关于R语言save.image命令,下面说法正确的是()A.可以保存工作区对象B.可以保存工作区代码C.可以同时保存工作区对象和代码D.可以保存图像3.已知a<-c(1:5,7:10),则R语言max(a[6:8]<-3:1)的结果是()。A.1 B.3 C.9 D.104.若a<-matrix(1:12,c(3,4)),则apply(a,1,function(x)x^2)的运行结果为:A.[,1][,2][,3][1,]149[2,]162536[3,]496481[4,]100121144B.[,1][,2][,3][,4][1,]11649100[2,]42564121[3,]93681144C.[,1][,2][,3][,4][1,]14916[2,]25364964[3,]81100121144D.[,1][,2][,3][1,]12581[2,]436100[3,]949121[4,]16641445.对于下面的R函数 new1<-function(a=10,b=5,c=2){ result<-a*b+c print(result) }则调用new1(2)的运行结果为:A.22 B.12 C.52 D.426.Python语句"ab"+"c"*2的运行结果是()A.'abc2'B.'abcabc'C.'abcc'D.'ababcc'7.关于Python字符串下列说法错误的是()A.字符应该视为长度为1的字符串B.字符串以\0标志字符串的结束C.既可以用单引号,也可以用双引号创建字符串D.在三引号字符串中可以包含换行回车等特殊字符8.关于Python内存管理,下列说法错误的是()A.变量不必事先声明 B.变量无须先创建和赋值而直接使用C.变量无须指定类型 D.可以使用del释放资源9.以下不能创建一个字典的语句是()A.dict1={} B.dict2={3:5}C.dict3={[1,2,3]:"uestc"} D.dict4={(1,2,3):"uestc"}10.调用以下函数返回的值()defmyfun():passA.0B.出错不能运行C.空字符串D.None三、简答题(本题20分,共4题,每小题5分)1.向量x=c(7,NA,14,12,9,NA,9,15,NA,8),编程实现将全部缺失值替换为紧邻该缺失值后面的元素的值,如第1个NA的值用x[3]的值14替换。写出对应的R语句。2.Shiny是R中常见的交互式web应用框架。写出Shiny应用程序app.R中的ui和server对象的主要概念或功能。3.试采用逆变法随机生成100个分布服从概率密度函数为的随机数,写出生成对应随机数的R语句。4.阐述R语言公式y~0+x和y~x表示的意义(x为自变量,y为因变量)。四、分析题(本题15分)有两组雌鼠,分别饲以高蛋白和低蛋白饲料,8周后记录各鼠体重增加量如下#高蛋白组体重增量high<-c(134,146,104,119,124,161,107,83,113,129,97,123)#低蛋白组体重增量low<-c(70,118,101,85,107,132,94)x<-c(high,low)a<-factor(c(rep(1,12),rep(2,7))) #语句avar.test(x~a) #语句bt.test(high,low,paired=FALSE) #语句c1.语句a的作用是什么?(3分)2.语句b的作用是什么?如何解释语句b得到的如下结果(6分):F=1.0755,p-value=0.97883.语句c的作用是什么?如何解释语句c得到的如下结果(6分):t=1.9107,p-value=0.07821五、改错题(本题10分)下面R程序实现打开data子目录的"data.csv"文件,对该文件中的数据进行处理后,将结果写回"results.csv"文件。#readinputinput_data<-read.csv(data/data.csv)#getnumberofsamplesindatasample_number<-nrow(input_data)#generateresultsresults<-some_other_function(input_file,sample_number)#writeresultswrite.csv(data/results.csv,results)请指出上述程序中的错误,并给出正确的写法。六、编程题(本题15分)编写R语言rmblanks函数,删除给定字符串(mystr)首尾空格。如mystr="hello,world",调用函数rmblanks(mystr)的结果应为"hello,world";mystr="IloveR",调用函数rmblanks(mystr)的结果应为"IloveR".

模拟试卷(1)答案一、填空题(每题2分,共20分)1.92.设定“d:/R32”为工作目录34634634635.TRUE6.123127.a[seq(2,100,2)]8.‘blue’9.列表、字典10.[6,7,9,11,13]二、单项选择题(每题2分,共20分)题号12345678910答案AABABCBBCD(无严格标准答案,以下内容可供参考)三、简答题(20分,每题5分)1.x[which(is.na(x))]=x[which(is.na(x))+1]2.ui主要包括用户界面,server主要包括后台服务器运行的有关函数。3.set.seed(123);u=runif(100);x=2*sqrt(u)4.y~x表示y对x进行回归,包括截距项,y-0+x,y对x进行回归,不包括截距项四、分析题(15分)1.(3分)表示把语句数据进行分组,第一组赋为1,第二组赋为22.(6分)方差齐性检验。结果表示,不能拒绝两组方差相等的原假设。3.(6分) T检验。结果表示,在alpha=0.05的置信水平下,不能拒绝原假设,即两组体重增加量不显著。五、改错题(10分)存在两处错误:1、input_data<-read.csv(“data/data.csv”)(5分)2、write.csv(results,“data/results.csv”)(5分)六、编程题(15分)mystr="hello,world"rmblanks<-function(mystr){mystr=strsplit(mystr,split="")n=length(mystr[[1]])i=0for(min1:n){if(mystr[[1]][m]=='')i=i+1elsebreak}j=0for(minn:1){if(mystr[[1]][m]=='')j=j+1elsebreak}paste((mystr[[1]][(i+1):(n-j)]),collapse='')}rmblanks(mystr)统计分析软件课程模拟试卷(2)(时间:年月日,共100分钟)48学时,3学分,闭卷,总分100分,占总评成绩50%注:此页不作答题纸,请将答案写在答题纸上一、填空题(本题20分,每小题2分)1.x=c(19,8,16,20,14),则R命令mean(x)返回结果是:2.在R命令行键入setwd()的含义是3.x<-c(18,15,57,50,37),则R命令sort(x)的输出结果是4.R命令temp=c(1,2,3),则rep(temp,c(1,2,3))的输出结果是5.R命令which(c(1,3,5,7)<7)的输出结果是6.R程序a<-c(1:4,seq(2,4,2));print(a)的输出结果是7.已知a<-1:100,取出向量a中偶数位置上的元素的R语句应为8.把数据集UGdata的行名改为空的R语句应为9.Python语句bb=[1,2,3,4];则bb.index(2)结果为10.Python语句字典dic={‘abc’:123,‘def’:456,’ghi’:789},删除一个键值‘abc’:123的语句为_____________二、单项选择题(本题20分,每小题2分)1.下面哪一个是绘制饼图的R命令()A.barplot(X)B.boxplot(X)C.pie(X)D.plot(X)2.table(x)命令的含义是()

A、显示属性向量x的取值及频数

B、显示属性向量x的取值

C、显示向量x的频数

D、显示向量x取值的频率3.已知a<-c(1:5,7:10),则R语言max(a[6:8]<-3:1)的结果是()。A.1 B.3 C.9 D.104.若a<-matrix(1:12,c(3,4)),则>apply(a,2,sum)的运行结果为:A.222630B.6152433C.232731D.71625345.下列赋值语句错误的是()。A.a<-1 B.a=1 C.A_1<-”1” D.1=a6.Python单行注释和多行注释分别用什么表示().A.######B.#C."""

"""D.???7.下面哪一个不是Python语言的合法命名:()A._AIB.IC.3_1D.tempStr8.foriinrange(0,3):print(i)上述Python程序的输出结果是:()A.0123B.12C.123D.0129.以下这段代码的执行结果是()a="alex"b=a.capitalizeprint(b)A.alexB.AlexC.ALEXD.以上结果都不对10.给出如下代码

TempStr="Hello

World"

可以输出“World”子串的是

A.

print(TempStr[-5:])

B.

print(TempStr[-5:0])C.

print(TempStr[-5:-1])D.

print(TempStr[-4:-1])三、简答题(本题20分,共4题,每小题5分)1.由1,2,…,16构成两个4x4的矩阵,其中矩阵A按列输入,矩阵B按行输入2.对题1中的矩阵A和B做如下运算:C=A+B,D=BA3.简述R语言的优点。4.试采用逆变法随机生成100个分布服从概率密度函数为fx四、分析题(本题15分,每一问5分)模拟产生统计学专业学生名单(学号区分),记录回归分析、统计软件俩科成绩,然后进行统计分析。假设有90名学生,起始学号为1303160001,回归分析成绩为均匀分布随机数,都在70分以上。统计软件成绩为正态分布,平均成绩75,标准差为15。把正态分布中超过100分的成绩变成100分,且各科成绩取整。写出模拟产生上述成绩随机数的代码。写出把上述信息组合成数据框,并写到文本文件中(保存为“学号.csv”)的代码写出使用apply函数计算各科最高分和个人总分的代码。五、改错题(本题10分)小明用R语言编写了一个检验一个数字是不是3和5的公倍数的函数,fun<-function(x){if(x%3==0&x%5==0){print('即是3的倍数又是5的倍数')}else{print('不是3或5的倍数')}}请指出上述程序中的错误,并给出正确的写法。六、编程题(本题15分)编写R语言程序:输入一个文件"A.csv", A中每行包含若干数值.生成文件"B.txt", B文件中每行是A中对应行的数值的最大值。

试卷答案一、填空题(每题2分,共20分)1.15.42.设置工作目录31223335.1236.1234247.a[seq(2,100,2)]8.rownames(UGdata)<-NULL9.110.deldic['abc']二、单项选择题(每题2分,共20分)题号12345678910答案CABBDCCDBA(无严格标准答案,以下内容可供参考)三、简答题(20分,每题5分)1.A=matix(1:16nrow=4);B=matix(1:16,mow=4,byrow=T);2.C=A+B:D=A%*%B3.优点:免费,永远正版,资源公开(不是黑匣子),可以在UNIX,Windows和MacosX上运行,R有优秀的内在帮助系统,R有优秀的画图功能,学生能够轻松地转到商业支持的S-Plus程序;R语言有一个强大的,容易学习的语法,有许多内在的统计函数(每答对一点的一分,5分为止,言之有理即可)4.set.seed(123);u=runif(100);x=sqrt(u,2)(最后一步3分,前两步各一分)四、分析题(15分)1.(5分)set.seed(1234)(1分)num<-seq(1:90)+1303160000regression<-round(runif(90,min=70,max=100))software<-round(rnorm(90,mean=75,sd=15))software[which(software>100)]<-100(4分)2.(5分)grade<-data.frame(num,regression,software)write.csv(grade,file="学号.csv")3.(5分) high<-apply(grade[c("regression","software")],2,max)s.sum<-apply(grade[c("regression","software")],1,sum)五、改错题(10分)存在两处错误:1、%应改成%%(5分)2、else挪到上一行的花括号}后面(5分)六、编程题(15分)mydata=read.csv(“A.csv”)b<-c(rep(0,dim(mydata[1])))for(iin1:dim(mydata)[1])b[i]=max(mydata[1,])write.csv(“B.txt”)统计分析软件课程模拟试卷(3)(时间:年月日,共100分钟)48学时,3学分,闭卷,总分100分,占总评成绩50%注:此页不作答题纸,请将答案写在答题纸上一、填空题(本题20分,每小题2分)1.x=c(7,12,9,15,8,7,14,16),则R命令median(x)返回结果是:2.在R命令行键入rm()的含义是3.x<-c(23,42,25,25,37),则R命令rank(x)的输出结果是4.R命令2*c(1,NA,2)的输出结果是5.R语句age=c(89,20,10,66);c('A','B')[(age>65)+1];的输出结果是6.在R循环语句中,__________语句的作用是提前结束本层循环。7.在Python中__________表示空类型。8.Python中用pip工具升级科学计算扩展库numpy的完整命令是______________9.Python语句aa=[1,2,3,4];aa.pop();则aa.index(3)结果为10.Python语句a=2;b=14;c=b**a;则c的值为:二、单项选择题(本题20分,每小题2分)1.R语言中,下列()不可以作为变量名。A.1a2b B.a1b2 C.a_b D.a.b2.下列R语句中()不能生成向量([1]1234512345)。A.rep(1:5,2) B.sequence(rep(5,2))C.1:10%%6D.(0:9%%5)+13.已知a<-1:100,若要取出向量a中的偶数位置上的元素,表达式应为()。A.a[2:100] B.a/50C.a[seq(2,100,by=2)] D.a/24.若a<-matrix(1:12,c(3,4)),则>apply(a,1,sum)的运行结果为()A.222630 B.6152433C.232731 D.71625345.‎R语言中,为变量修改元素名称的函数是()A.changeName B.ModifyNameC.name D.names6.有如下两个R语言函数: g<-function(){ x<-2} f<-function(){ x<-1 g() return(x)}则f()的运行结果是()A.1B.2C.程序报错D.以上均不正确7.R语言中,下列命令中哪一条不能实现:A.X<-matrix(1:10,nrow=2,ncol=5);Y=X-XB.X<-matrix(1:10,nrow=2,ncol=5);Y=X%*%XC.X<-matrix(1:10,nrow=2,ncol=5);Y=X*XD.X<-matrix(1:10,nrow=2,ncol=5);Y=X+X8.‎Python3.x环境创建Python脚本文件时,需要将文件编码格式设置为()。A.UNICODEB.ANSIC.GBKD.UTF-89.已知在‎Python脚本文件N.py中有函数调用“A.B.C.d()”,则import语句的正确写法是()。A.importA.B.C.dB.importA.B.CC.fromA.B.CimportdD.fromA.BimportC10.关于Python中的函数,以下描述错误的是()。A.函数能完成特定的功能,对函数的使用不需要了解函数内部实现原理,只要了解函数的输入输出方式即可。B.使用函数的主要目的是减低编程难度和代码重用。C.Python使用del保留字定义一个函数。D.函数是一段具有特定功能的语句组。三、简答题(本题20分,共4题,每小题5分)1.用R函数rep()构造一个向量x,它由5个3,10个2,98个1构成,写出对应的R语句。2.R语言中表述概率分布的函数前分别加有d、p、q、r四个前缀,分别表示该分布的什么功能?3.R语言中,对lm()函数返回的对象使用plot()函数可生成评价模型拟合情况的四幅图形,请简述这些图形的主要作用。4.简述Python中元组、列表和字典的区别。四、分析题(本题20分)用Pearson拟合优度卡方检验验证学生成绩是否服从正态分布,R代码如下:X<-c(25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84,84,84,85,86,86,86,87,89,89,89,90,91,91,92,100)A<-table(cut(X,br=c(0,69,79,89,100)))#代码Ap<-pnorm(c(70,80,90,100),mean(X),sd(X))pnew<-c(p[1],p[2]-p[1],p[3]-p[2],1-p[3])#代码Bchisq.test(A,p=pnew)#代码C1.Pearson拟合优度卡方检验的基本思想是什么?(5分)2.代码A的主要功能是什么?(5分)3.代码B的主要功能是什么,为什么要这么处理?(5分)4.代码C的运行结果如下:data:AX-squared=8.3,df=3,p-value=0.04据此,你的结论是什么?(5分)五、改错题(本题10分)下面R程序用循环实现求x1,若x1达到允许误差范围内停止循环。x0<-1;tol<-1e-8while{x1<-computeEstimate()#计算x1值的函数if(abs(x1-x0)<tol){continue}else{

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论