数据采集1+x初级模考试题含答案_第1页
数据采集1+x初级模考试题含答案_第2页
数据采集1+x初级模考试题含答案_第3页
数据采集1+x初级模考试题含答案_第4页
数据采集1+x初级模考试题含答案_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级模考试题含答案一、单选题(共41题,每题1分,共41分)1.()不是用来查询、添加、修改和删除数据库中数据的语句A、DROPB、INSERTC、UPDATED、DELETE正确答案:A2.服务器端响应状态码中,表示“MoveTemporarily临时移动”的是A、304B、200C、404D、302正确答案:D3.Apache服务器运行后会生成两个日志文件,其中,()是记录Web服务器的所有访问活动的文件。A、error_log(错误日志)B、/usr/local/tomcat/logsC、access_log(访问日志)D、logs正确答案:C4.使用Xpath获取一篇HTML文档中所有超链接的href属性,Xpath代码为()。A、/a/@hrefB、//a/@hrefC、//@hrefD、/a/href正确答案:B5.HTTP协议是A、应用层协议B、传输层协议C、网络层协议D、会话层协议正确答案:A6.查找表结构用以下哪一项A、FINDB、SELETEC、ALTERD、DESC正确答案:D7.XPath于1999年11月16日成为()标准?A、W3CB、XMLC、ROMCATD、以上都不对正确答案:A8.网络运营者收集、使用个人信息,应当遵循()的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意。A、不用合法B、严格C、合法、正当、必要D、不正当正确答案:C9.关于“user-agent”(用户代理)的描述错误的是A、代表用户发起HTTP请求的客户端程序B、所有发布Web请求的应用程序都是HTTPAgent代理C、Web浏览器也是一种HTTPAgent代理D、网络爬虫只是一段程序,并不是代理正确答案:D10.CSS技术中盒子模型的()属性设置边框和内部元素之间的距离的属性。A、borderB、paddingC、backgroundD、margin正确答案:B11.关于Python的lambda函数,以下选项中描述错误的是()A、可以使用lambda函数定义列表的排序原则B、lambda用于定义简单的、能够在一行内表示的函数C、lambda函数将函数名作为函数结果返回D、f=lambdax.y:x+y执行后,f的类型为数字类型正确答案:D12.centos7中超级用户的命令提示符是()A、%B、&C、#D、$正确答案:C13.外链和反链的区别,说法正确的是()A、外链对SEO有帮助,反链没有任何帮助B、外链是对于全站而言,反链只是指首页的链接C、外链是指外部的网站指向本网站,反链则是指向本页面的内部或外部链接D、两者含义相同,只是不同名字而已正确答案:A14.Scrapy中,用于运行项目中的爬虫的命令是()。A、runspiderB、genspiderC、crawlD、以上全是正确答案:C15.在Windows操作系统中,()命令可以释放全部(或指定)适配器的由DHCP分配的动态IP地址。A、ipconfig/renewB、ipconfig/releaseC、ipconfig/flushdnsD、ipconfig/all正确答案:B16.Tomcat的默认端口是()。A、8089B、8080C、7070D、80正确答案:B17.按企业编号bno分组统计出“staff”表中各企业人数大于1的企业编号和企业人数的SQL命令()。A、SELECTbno.COUNT(sno)FROMstaffGROUPBYbnoWHERECOUNT(sno)>1;B、SELECTbno.COUNT(sno)FROMstaffGROUPBYbnoHAVINGSUM(sno)>1;C、SELECTbno.COUNT(sno)FROMstaffGROUPBYbnoHAVINGCOUNT(sno)>1;D、SELECTbno.COUNT(sno)FROMstaffORDERBYbnoHAVING正确答案:C18.系统管理员常用的二进制命令文件,一般放置在()目录下。A、/usr/sbinB、/bootC、/sbinD、/root正确答案:C19.以下选项中,不是Python语言特点的是A、变量声明:Python语言具有使用变量需要先定义后使用的特点B、平台无关:Python程序可以在任何安装了解释器的操作系统环境中执行C、黏性扩展:Python语言能够集成C、C.++等语言编写的代码D、强制可读:Python语言通过强制缩进来体现语句间的逻辑关系正确答案:A20.以下xpath代码中,能够获取页面中title标签的内容的是()。A、//title/textB、//title/text()C、//title/@textD、//title/@text()正确答案:B21.下列不属于ELK范畴的是()A、ElasticSearchB、KibanaC、LogstashD、Lucene正确答案:D22.下列表达式的值为True的是()A、"abc">"xyz"B、5+4j>2-3jC、3>2>2D、(3.2)<("a"."b")正确答案:D23.requests库中,()对象可以实现跨请求保持数据A、RequestB、CookieC、SessionD、Response正确答案:C24.Python中,下列标识符中哪个是合法的?()A、i'mB、3QC、forD、_正确答案:D25.下列叙述中哪一项不是计算机硬件()A、CPUB、显示器C、键盘D、Windows10正确答案:D26.数据库管理系统(DBMS)的主要功能是A、修改数据库B、定义数据库C、应用数据库D、保护数据库正确答案:B27.关于异步请求的说法错误的是A、通常用于获取页面局部的数据,但需要对页面整体进行刷新B、能够提升用户的体验C、通过XMLHttpRequest对象可以实现与服务器的异步交互D、通常使用JSON格式进行数据的交互,但也有可能是其它格式正确答案:A28.在Linux环境下的Tomcat容器数据的采集中,启动Tomcat容器的代码是()。A、startup.shB、logstashC、httpdD、filebeat正确答案:A29.正则表达式“[a-z_]”表示的含义是()A、取所有小写英文字母以及_中的任意多个。B、取“a、-、z、_”中的任意多个。C、取“a、-、z、_”中的任意一个。D、取所有小写英文字母以及_中的任意一个。正确答案:D30.搜索引擎优化和网络营销的缩写分别是()A、SEM和SEOB、UEO和SEMC、SEO和SEMD、SEO和UEO正确答案:C31.用以表示网页服务器超文本传输协议响应状态的3位数字代码,通常称之为HTTP状态码,其中表示请求成功的是()A、404B、201C、500D、200正确答案:D32.下列表达式的值为True的是()A、"abc">"xyz"B、3>2>2C、(3.2)<("a"."b")D、5+4j>2-3j正确答案:C33.SEO的核心基础是A、内容、外链B、结构、外链C、内容正确答案:A34.将网络认为局域网、城域网、广域网三种,是按照哪种方式进行分类的A、按传输技术分B、按拓扑结构分C、按使用范围分D、按地理范围分正确答案:D35.()法律中说明“国家支持网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作,提高网络运营者的安全保障能力。”A、《中华人民共和国网络安全法》B、《中华人民共和国安全法》C、《民法总则》D、《电信和互联网用户个人信息保护规定》正确答案:A36.logstash默认端口号为()。A、8089B、7070C、8080D、5044正确答案:D37.若k为整形,下述while循环执行的次数为()k=1000whilek>1:print(k)k=k/2A、11B、9C、10D、1000正确答案:C38.删除用户账号命令是()A、DROPUSERB、DROPTABLEUSERC、DELETEUSERD、DELETEFROMUSER正确答案:A39.关于Python,算法是指()A、解决问题的精确步骤B、程序设计语言的语句序列C、数学的计算公式D、对问题的精确描述正确答案:A40.通过在路径表达式中使用()运算符,您可以选取若干个路径?A、.B、空白C、|D、/正确答案:D41.python编写爬虫过程中,需要将爬取的网页内容转换为哪种类型的对象才可以使用etree模块的xpath方法()A、DOMB、HTMLC、ElementD、Response正确答案:C二、多选题(共21题,每题1分,共21分)1.以下CSS中,属于font属性的是()。A、font-sizeB、font-weightC、sizeD、font-style正确答案:ABD2.关于Python的特点,包括()A、是免费和开源的B、具有良好的跨平台特性C、功能强大D、支持面向对象正确答案:ABCD3.以下哪几个方法与AlertDialog中的按钮设置有关()A、setPositiveButton()B、setNegativeButton()C、setAffirmationButton()D、setNeutralButton()正确答案:ABD4.关于socket编程,对于服务端编程的主要步骤包括()A、打开socketB、监听客户端连接C、读写数据D、绑定到一个地址和端口正确答案:ABCD5.以下属于半结构化数据的是A、MySQL中的数据表B、XML文档C、日志文件D、JSON格式文档正确答案:BCD6.衡量网络性能的主要指标包括()A、转发B、路由C、带宽D、延迟正确答案:CD7.计算机网络通信威胁行为中属于主动攻击行为的是()A、篡改B、拒绝服务C、恶意程序D、截获正确答案:ABC8.关于Python异常,以下描述不正确是()A、程序运行时有异常抛出,程序立即终止B、拼写错误会导致程序运行中断C、程序运行中,抛出异常不一定终止程序D、缩进错误会导致程序运行中断正确答案:ABD9.按照数据发生的主体不同,数据采集范围主要包括()。A、感知设备数据采集B、数据库采集C、系统日志采集D、网络数据采集正确答案:ABCD10.以下属于常用爬虫框架的是()。A、Spring框架B、Scrapy框架C、Pyspider框架D、CoB框架正确答案:BCD11.以下关于索引的说法正确的是()。A、可以加快表与表之间的连接B、索引不需要花费代价占用存储空间就可以实现检索速度的提高C、唯一性索引可以保证数据记录的唯一性D、可以加快数据的检索速度正确答案:ACD12.以下属于数据采集范畴的是()。A、互联网应用数据B、数据库数据C、业务系统日志数据D、容器日志数据正确答案:ABCD13.下列哪些函数属于聚合函数()A、str()B、count()C、sum()D、max()正确答案:BCD14.根据网页内容获取方式不同.可以将网页分为()。A、静态页面B、标记型网页C、专业型网页D、动态页面正确答案:AD15.在Python中提供了哪些技术用于获取网页数据()A、Urllib模块B、Requests模块C、BeautifulSoup库D、lxml库正确答案:BC16.关于Python注释,以下选项中描述正确的是()A、注释可以辅助程序调试B、Python注释语句不被解释器过滤掉,也不被执行C、注释可用于标明作者和版权信息D、注释用于解释代码原理或者用途正确答案:ACD17./etc/passwd文件中包含的信息有()。A、shellB、gidC、uidD、用户主目录正确答案:ABCD18.表的两种约束是()A、外键B、主键C、索引D、内键正确答案:AB19.数据采集的类型包括()A、结构化数据B、半结构化数据C、非结构化数据D、以上都不属于数据采集的类型正确答案:ABC20.正则表达式中,下列哪些可以匹配由英文字母组成的字符串()。A、^[A-Z]+$B、^[a-z]+$C、^[A-Za-z]+$D、^[A-Za-z]正确答案:ABC21.常见的URL分隔符包括()A、$(美元符号)B、/(反斜杠)C、*(星)D、_(下划线)正确答案:BD三、判断题(共37题,每题1分,共37分)1.jQuery中,hide()可以隐藏元素,show()可以显示隐藏的元素A、正确B、错误正确答案:A2.文件共享是指系统允许多个用户或者进程去共享同一个文件,文件共享只限于系统内共享。A、正确B、错误正确答案:B3.del命令只可以删除列表中的一个元素,不能删除整个列表。A、正确B、错误正确答案:B4.SNMPv2既支持高度集中化的网络管理模式.又支持分布式的网络管理模式。A、正确B、错误正确答案:A5.Xpath通配符不可以用来选取未知的XML元素。A、正确B、错误正确答案:B6.数据采集以手动方式为主,避免使用自动化的手段。A、正确B、错误正确答案:B7.Apache容器是中间件。A、正确B、错误正确答案:A8.查看数据表的结构信息,可以在指定的数据库中使用“describe表名;”语句,通常简写为“desc表名;”A、正确B、错误正确答案:A9.x=[1,2,1,1]foriinx[:]:ifi==1:x.remove(i)print(x)运行结果显示:[2,1,1][2,1,1][2,1][2]A、正确B、错误正确答案:A10.创建表用createtable关键字A、正确B、错误正确答案:A11.设备控制器是计算机和中央处理器(CPU)之间的接口,它会接收CPU的指令,然后去实现对设备的控制A、正确B、错误正确答案:A12.shell中case结构化语句必须以esac作为语句的结束。A、正确B、错误正确答案:A13.Android系统除非不能保证前台进程或可视进程所必要的资源,否则不强行清除服务进程。A、正确B、错误正确答案:A14.加密信息的保密性仅取决于加密所用密钥的复杂程度A、正确B、错误正确答案:B15.Python标准库中的re模块提供正则表达式的全部功能,可以直接引入。A、正确B、错误正确答案:A16.堆叠是用专用的端口把交换机连接起来,当作一个交换机使用。A、正确B、错误正确答案:A17.CRM是指利用计算机网络实现的以“资源”为中心的系统。A、正确B、错误正确答案:B18.创建一个包含数据1,2,3,4,5的set集合,可执行语句:set([1,2,3,4,5])A、正确B、错误正确答案:A19.操作系统中,绝对路径名都是从根目录开始。A、正确B、错误正确答案:A20.ADSL为用户提供的上行和下行带宽是对称的A、正确B、错误正确答案:B21.城域IP网可以采用与局域网大体相同的技术,也可能采用与局域网完全不同的技术。A、正确B、错误正确答案:A22.JavaScript中标识符首字母不能为数字A、正确B、错误正确答案:A23.电信业务经营者、互联网信息服务提供者不得收集其提供服务所必需以外的用户个人信息或者将信息用于提供服务之外的目的,不得以欺骗、误导或者强迫等方式或者违反法律、行政法规以及双方的约定收集、使用信息

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论