数据采集1+x中级习题含答案_第1页
数据采集1+x中级习题含答案_第2页
数据采集1+x中级习题含答案_第3页
数据采集1+x中级习题含答案_第4页
数据采集1+x中级习题含答案_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x中级习题含答案一、单选题(共63题,每题1分,共63分)1.下列Python标识符中哪个是合法的?()A、forB、i'mC、_D、3Q正确答案:C2.关于urlopen方法,描述错误的是A、可以发送HTTPhead消息B、可以向服务器发送参数数据C、默认发送GET请求D、可以使用Request对象作为参数正确答案:A3.网络监测技术sFlow报文采用什么协议封装A、UDPB、IPC、TCPD、HTTP正确答案:A4.jQuery中,定义array的语法错误的是()A、newArray(size);B、newArray(ele0.ele1.....ele);C、newArray();D、newArray[];正确答案:D5.数据库系统的数据独立性是指A、不会因为数据的变化而影响应用程序B、不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序C、不会因为存储策略的变化而影响存储结构D、不会因为某些存储结构的变化而影响其他的存储结构正确答案:B6.启动Android系统的内置的Web浏览器,需要在Intent中指定的ACTION为()A、ACTION_PICKB、ACTION_SEARCHC、ACTION_WEBD、ACTION_VIEW正确答案:D7.以下选项中不可用作Python标识符的是A、3.14B、PiC、NameD、姓名正确答案:A8.匹配1~99的正整数表达式A、[1-9][0-9]?B、[1-9][0-9]C、[1-9][0-9]+D、[1-99]正确答案:A9.启动Apache服务命令为()。A、ServicehttpdstartB、ServicestartC、ServiceHttpstartD、Httpdstart正确答案:A10.以下关于程序设计语言的描述,错误的选项是:A、编译和解释的区别是一次性翻译程序还是每次执行时都要翻译程序B、Python语言是一种脚本编程语言C、汇编语言是直接操作计算机硬件的编程语言D、程序设计语言经历了机器语言、汇编语言、脚本语言三个阶段正确答案:D11.()是一种专业的网络文件存储设备,它基于LAN.按照TCP/IP协议进行通信,以文件的I/O方式进行数据传输。A、NASB、NAC、NASSD、NS正确答案:A12.下面对HBase的描述哪些是错误的?()。A、不是开源的B、是面向列的C、是分布式的D、是一种NoSQL数据库正确答案:A13.哪个轴可以选取当前节点的所有子元素?A、childB、parentC、childsD、以上都不对正确答案:A14.数据库系统的核心是()。A、数据库B、数据库管理系统C、软件工具D、数据模型正确答案:B15.以下哪个是关系型数据库()。A、NoSqlB、MySQLC、HbaD、Redis正确答案:B16.()用来建立数据库、建立表等,主要包括CREATEDATABASE、CREATETABLE等语句。A、DML(DataManipulationLanguage,数据操纵语言)B、DDL(DataDefinitionLanguage,数据定义语言)C、DQL(DataQueryLanguage,数据查询语言)D、DCL(DataControlLanguage,数据控制语言)正确答案:B17.re模块所提供的方法中,搜索整个字符串,以迭代器的形式返回结果的是A、finditerB、matchC、findallD、search正确答案:A18.IPv4地址由()位二进制数值组成。A、16B、64C、128D、32正确答案:D19.FTP的主要特点不包括()。A、只提供文件传送的一些基本的服务B、可减少或消除在不同操作系统下处理文件的不兼容性C、使用客户服务器方式,可同时为多个客户进程提供服务D、使用UDP的运输服务正确答案:D20.哪个轴可以选取当前节点?A、ancestorB、ancestor-or-selfC、selfD、以上都不对正确答案:C21.数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指A、多种应用、多种语言、多个用户相互覆盖地使用数据集合B、同一个应用中的多个程序共享一个数据集合C、多个用户共享一个数据文件D、多个用户、同一种语言共享数据正确答案:A22.关于MongoDB集合命名规则错误的是()。A、不能以“system.”开头,因为这是系统集合的保留前缀B、集合名中不能含有保留字符$C、不能含是空字符串D、集合名称最大值200字节正确答案:D23.设置Apache安装目录代码为()A、ServerRoot"/usr/local/apacheB、SetServerRoot"/usr/local/apache"C、SetServerRootD、SetMyServerRoot"/usr/local/apache"正确答案:A24.在计算机网络中,能将异种网络互连起来,实现不同网络协议相互转换的网络互连设备是()。A、路由器B、网关C、交换机D、中继器正确答案:A25.密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线)是哪个?A、^[a-zA-Z]w{5.17}B、^[a-zA-Z]{5.17}$C、^[a-zA-Z]w{5.17}$D、^[a-zA-Z]w{6.18}$正确答案:C26.数据采集相关法律中限定数据信息收集的对象与范围是哪个法律()A、《中华人民共和国安全法》B、《电信和互联网用户个人信息保护规定》C、《民法总则》D、《中华人民共和国网络安全法》正确答案:B27.在Windows中,对文件夹进行复制时会复制哪些内容A、只复制文件夹名,不复制其内容B、复制文件夹名的其下所有的文件和子文件夹C、只复制文件夹名和其下的文件,不复制其下的文件夹D、复制文件夹名和其下所有的文件和子文件夹,但不复制子文件夹下的文件正确答案:B28.Android开发中,以下哪个属性不用于表格布局()A、android:layout_rowB、android:shrinkColumnsC、android:stretchColumnsD、android:layout_column正确答案:A29.关于Python,两次调用文件的write方法,以下选项中描述正确的是()A、连续写入的数据之间默认采用换行分隔B、连续写入的数据之间无分隔符C、连续写入的数据之间默认采用逗号分隔D、连续写入的数据之间默认采用空格分隔正确答案:B30.关于Python语句P=–P,以下选项中描述正确的是A、P和P的绝对值相等B、P的值为0C、给P赋值为它的负数D、P和P的负数相等正确答案:C31.保障信息安全最基本、最核心的技术措施是()A、网络控制技术B、反病毒技术C、信息确认技术D、信息加密技术正确答案:D32.一个网站的关键词密度保持在多少为最佳?A、2%~8%B、10%~15%C、15%以上D、顺其自然正确答案:A33.CSS3中,无法将样式表加入到网页中的是()A、嵌入外部样式表B、链接外部样式表C、定义内部样式D、索引方式正确答案:D34./etc/shadow文件中存放()A、用户口令的加密信息B、文件系统信息C、用户账号基本信息D、用户组信息正确答案:A35.哪个命令可以将普通用户转换为超级用户()A、passwdB、superC、suD、tar正确答案:C36.以下不属于HTTP请求报文结构中数据组成部分的是A、请求体B、分割行C、请求头D、请求行正确答案:B37.httpd采用()模块化设计方法A、core+modulesB、modulesC、core+moduleD、core正确答案:A38.()是进行数据清洗的工具。A、filebeatB、logstashC、tomcatD、apache正确答案:B39.获取html页面中的所有含有id属性的div标签,xpath代码为A、/div[id]B、//div[@id]C、/div[@id]D、//div[id]正确答案:B40.Android开发中,关于Service的描述不正确的是()A、它是Android系统的四个重要的组件之一B、Service是运行在后台,不和用户交互的应用组件C、可以在Service中直接运行耗时较多或者阻塞的操作D、Service和其他的应用组件一样,运行在进程的主线程中正确答案:C41.()又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据。A、深层页面爬虫B、聚焦网络爬虫C、通用网络爬虫D、增量式网络爬虫正确答案:C42.想给同组用户添加对文件的权限,应使用什么命令?A、chownB、suC、chmodD、yum正确答案:C43.匹配m-n位的数字?A、^d{m.n}$B、^d{m.n}$C、d{m.n}$D、^d{m.n}正确答案:B44.以下聚合函数中,用来统计平均值的函数为()A、countB、sumC、minD、avg正确答案:D45.匹配字符串“abc123def”中的数字部分,正则表达式定义为A、[0-9]B、[0-9]?C、[0-9]+D、[123]正确答案:C46.NoSQL数据库的特点不包括()。A、分布式B、不基ACIDC、支持严格事务D、易拓展正确答案:C47.下列可以匹配身份证号(15位或18位数字)的是()。A、^d{15}|d{18}$B、^d{15}|d{18}C、^d{15}d{18}$D、^d{15}|d{18}$正确答案:A48.清空yum源的缓存命令是()A、yumrepolistB、yumdeleteC、yumcleanallD、yumreset正确答案:C49.Tomcat容器运行的界面为()。A、aspB、phpC、cD、jsp正确答案:D50.多个进程的实体能存在于同一内存中,在一段时间内都得到运行。这种性质称作进程的()A、并发性B、异步性C、动态性D、调度性正确答案:A51.数据采集中,数据加工内容不包括()A、数据过滤B、数据去噪C、数据挖掘D、数据拆分正确答案:C52.下列哪个可以匹配一年的12个月(01~09和1~12)?A、^(0[1-9]|1[0-2])$B、(0?[1-9]|1[0-2])$C、^(0?[1-9]|1[0-2])D、^(0?[1-9]|1[0-2])$正确答案:D53.数据库(DB)、数据库系统(DBS)和数据库管理系统(DBMS)三者之间的关系是A、DBS包括DB和DBMSB、DDMS包括DB和DBSC、DB包括DBS和DBMSD、DBS就是DB,也就是DBMS正确答案:A54.以下哪种方式可以将外部CSS样式文件嵌入网页()A、<linktype="text/cssrel="stylesheet"src="外部样式表的文件名称">B、<linktype="text/css"rel="stylesheet"href="外部样式表的文件名称">C、<linkhref="外部样式表的文件名称">D、<linksrc="外部样式表的文件名称">正确答案:B55.在给定文件中查找与设定条件相符字符串的命令为()A、sortB、gzipC、grepD、find正确答案:C56.scrapy的哪个命令可以测试爬取网页的整个过程A、scrapyfetchB、scrapybenchC、scrapyviewD、scrapyshell正确答案:B57.给出如下代码,下述代码的输出结果是()s="Aliceprint(s[::–1])"A、ALICEB、ecilAC、AlicD、Alice正确答案:B58.Python中,执行下列语句后的显示结果是什么?()>>>frommathimportsqrt>>>print(sqrt(3)*sqrt(3)==3)A、FalseB、sqrt(3)*sqrt(3)==3C、TrueD、3正确答案:A59.关于Python赋值语句,以下选项中不合法的是()。A、x=1;y=1B、x.y=y.xC、x=(y=1)D、x=y=1正确答案:C60.下面列出了路由器的各种命令状态,可以配置路由器全局参数的(即配置模式)是()A、router#B、router(config-if)#C、router﹥D、router(config)#正确答案:B61.Apache的安装在linux下使用命令()A、setB、installC、yumD、unset正确答案:C62.用于解析域名的协议是A、HTTPB、DNSC、FTPD、SMTP正确答案:B63.关键词分布中对SEO有危害的是A、左导航B、隐藏文字C、锚节点D、标题正确答案:B二、多选题(共17题,每题1分,共17分)1.在xpath中,基本值是()节点。A、无子B、无父C、有根D、没有根正确答案:AB2.数据采集的类型包括()A、结构化数据B、半结构化数据C、非结构化数据D、以上都不属于数据采集的类型正确答案:ABC3.下列哪种说法是错误的()。A、除字典类型外,所有标准对象均可以用于布尔测试B、空字符串的布尔值是TrueC、空列表对象的布尔值是FalseD、值为0的任何数字对象的布尔值是False正确答案:AB4.Python中,以下选项中说法不正确的是()A、Python语言是脚本语言B、编译是将源代码逐条转换成目标代码同时逐条运行目标代码的过程C、解释是将源代码转换成目标代码的过程D、静态语言采用解释方式执行,脚本语言采用编译方式执行正确答案:BCD5.在Xpath中,元素节点可以有()个。A、0B、1C、多个D、以上都不对正确答案:ABC6.JSON模块中,能够将Python列表或字典转换为JSON字符串或JSON格式的文件的方法是A、dumpB、loadsC、dumpsD、load正确答案:AC7.Scrapy架构中,中间件包括()。A、DownloaderMiddlewaresB、SchedulerMiddlewaresC、SpiderMiddlewaresD、PipelineMiddlewares正确答案:AC8.下列属于Linux发行版操作系统的是()A、SolarisB、RedHatC、CentosD、Ubuntu正确答案:BCD9.Scrapy中,Linkextractor的常见属性包括()等。A、restrict_textB、denyC、allowD、restrict_xpaths正确答案:ABCD10.如何挖掘长尾关键词A、用户心理B、相关搜索C、通过网站统计D、分析竞争对手的网站正确答案:ABCD11.()是用来查询、添加、修改和删除数据库中数据的语句A、SELECTB、INSERTC、UPDATED、DELETE正确答案:ABCD12.关于Python组合数据类型,以下选项中描述错误的是()A、Python的str、tuple和list类型不都属于序列类型B、序列类型是二维元素向量,元素之间存在先后关系,通过序号访问C、组合数据类型可以分为3类:序列类型、集合类型和映射类型D、Python组合数据类型能够将多个同类型或不同类型的数据组织起来,通过单一的表示使数据操作更有序、更容易正确答案:AB13.以下属于HTTP请求消息头中的内容的是A、User-AgentB、RefererC、AcceptD、Accept-Encoding正确答案:ABCD14.下列哪些概念不是为了提高数据库的访问速度而存在()A、视图B、索引C、关系D、外键正确答案:ACD15.下列哪些是《电信和互联网用户个人信息保护规定》中规定的直接面向用户的服务性工作()A、电信业务经营者B、互联网信息服务提供者C、互联网信息服务提供者委托他人代理市场销售D、互联网信息服务提供者委托他人代理技术服务正确答案:ACD16.以下是正确使用requests库的方法的是A、requests.get('网址')B、requests.delete('网址')C、requests.post('网址'.data=data)D、requests.head('网址')正确答案:ABCD17.以下属于半结构化数据的是A、MySQL中的数据表B、日志文件C、XML文档D、JSON格式文档正确答案:BCD三、判断题(共27题,每题1分,共27分)1.Shell是一种命令解释程序A、正确B、错误正确答案:A2.Apache服务器默认侦听的端口号是80。A、正确B、错误正确答案:A3.匹配中国邮政编码的是:[1-9]d{5}(?!d)(中国邮政编码为6位数字)A、正确B、错误正确答案:A4.数据库操作中,创建表用createtable语句。A、正确B、错误正确答案:A5.硬链接不可以跨文件系统。它只能建立对文件的链接;源文件删除后,硬链接文件也可正常使用。A、正确B、错误正确答案:A6.网站地图就是一个页面,其上放置了到该网站尚所有页面的链接A、正确B、错误正确答案:A7.HBase的底层存储为HDFS。A、正确B、错误正确答案:A8.关系数据库中,实体之间的联系是通过表与表之间的公共元组实现的A、正确B、错误正确答案:B9.JavaScript语言不区分大小写。A、正确B、错误正确答案:B10.Linux中命令的选项和参数是必须设置的。A、正确B、错误正确答案:B11.Xpath通配符不可以用来选取未知的XML元素。A、正确B、错误正确答案:B12.国家支持网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作,提高网络运营者的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论