数据采集1+x初级试题库含参考答案_第1页
数据采集1+x初级试题库含参考答案_第2页
数据采集1+x初级试题库含参考答案_第3页
数据采集1+x初级试题库含参考答案_第4页
数据采集1+x初级试题库含参考答案_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级试题库含参考答案一、单选题(共41题,每题1分,共41分)1.修改数据库表结构用以下哪一项A、UPDATEB、CREATEC、UPDATEDD、ALTER正确答案:D2.TCP/IP协议将整个通信功能划分为四个层次,处于最底层的是()A、数据链路层B、网络接口层C、物理层D、网络层正确答案:B3.下面哪个不是Python合法的标识符()A、selfB、40XLC、__name__D、int32正确答案:B4.关于lambda函数,以下选项中描述错误的是()A、lambda不是Python的保留字B、定义了一种特殊的函数C、lambda函数将函数名作为函数结果返回D、lambda函数也称为匿名函数正确答案:A5.Scrapy中,用于运行项目中的爬虫的命令是()。A、runspiderB、genspiderC、crawlD、以上全是正确答案:C6.通过在路径表达式中使用()运算符,您可以选取若干个路径?A、空白B、/C、|D、.正确答案:B7.关于数据类型,说法不正确的是()A、结构化数据是指具有固定格式的数据B、非结构化数据的结构不规则或不完整,没有预定义的数据模型C、半结构化数据介于结构化数据和非结构化数据之间D、以上说法都不正确正确答案:D8.什么是正则表达式?A、用来匹配文本字符串(如特定字符、单词或字符模式)的一种工具B、任何在Python中可能的正确表达式C、从Python字典中快速获取数据的一种算法D、程序员经常使用的编程语言表达式的集合正确答案:A9.Python不支持的数据类型有()A、floatB、intC、charD、list正确答案:C10.这些软件对计算机系统的资源进行控制、管理,并为用户使用和其他程序的运行提供服务。以上描述符合()的定义?A、支撑软件B、应用软件C、操作系统D、系统软件正确答案:C11.()法律中说明“国家支持网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作,提高网络运营者的安全保障能力。”A、《电信和互联网用户个人信息保护规定》B、《民法总则》C、《中华人民共和国安全法》D、《中华人民共和国网络安全法》正确答案:D12.数据库结构的描述和定义是DBMS运行的基本依据,它们存储于()A、封锁表B、数据字典C、索引D、日志正确答案:B13.()又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据。A、深层页面爬虫B、聚焦网络爬虫C、通用网络爬虫D、增量式网络爬虫正确答案:C14.运行scrapy框架生成的spider程序,使用以下哪个命令A、crawlB、runC、runspiderD、startspider正确答案:A15.半结构数据,是介于结构化数据与非结构化之间的数据,下面不属于半结构化数据的是()A、XMLB、HTMLC、MPEG-1D、JSON正确答案:C16.属于应用层协议的是()A、IPB、UDPC、TCPD、FTP正确答案:D17.()的主要功能是对日志进行收集、过滤并将其存储,方便以后搜索,自带一个Web界面,可以搜索和展示所有日志。A、KibanaB、LogstashC、ElasticsearchD、IIS正确答案:B18.使用urllib库的方法获取到Response类型的对象后,想改变其编码格式时需要修改此对象的哪个属性()A、codingB、encodingC、utf-8D、text正确答案:B19.以下不属于日志数据采集步骤的是()A、清洗数据B、分析数据C、采集数据D、存储数据正确答案:B20.下列不是手机操作系统的是?()A、AndroidB、Window?MobileC、IOSD、WindowsVista正确答案:D21.检查网络联通性的命令是()A、telnetB、pingC、routeD、ipconfig正确答案:B22.以下xpath代码中,能够获取页面中title标签的内容的是()。A、//title/textB、//title/@textC、//title/@text()D、//title/text()正确答案:D23.哪个轴可以选取当前节点的所有属性?A、attributeB、descendantC、child正确答案:A24.网站SEO优化时,网站进行友情链接多少个为适中()。A、1~5个B、20~30个C、30~40个D、40个以上正确答案:B25.下列表达式的值为True的是()A、3>2>2B、"abc">"xyz"C、(3.2)<("a"."b")D、5+4j>2-3j正确答案:C26.HTML编写的网页,最基本的结构是()A、<html><head>...</head><frame>...</frame></html>B、<html><head>...</head><body>...</body></html>C、<html><title>...</title><body>...</body></html>D、<html><title>...</title><frame>...</frame></html>正确答案:B27.centos7中超级用户的命令提示符是()A、$B、#C、&D、%正确答案:B28.()用来建立数据库、建立表等,主要包括CREATEDATABASE、CREATETABLE等语句。A、DML(DataManipulationLanguage,数据操纵语言)B、DDL(DataDefinitionLanguage,数据定义语言)C、DQL(DataQueryLanguage,数据查询语言)D、DCL(DataControlLanguage,数据控制语言)正确答案:B29.“内容为一个URL,标识用户从该URL代表的页面出发访问当前请求的页面”以上描述所指的消息头是()。A、AcceptB、RefererC、User-AgentD、Connection正确答案:B30.在SQL语言中提交事务的操作是通过()语句实现的A、CREATEB、REVOKEC、COMMITD、ROLLBACK正确答案:C31.服务器端响应状态码中,表示“NOTFOUND未找到”的是A、302B、404C、304D、200正确答案:B32.CSS技术中盒子模型的()属性设置边框和内部元素之间的距离的属性。A、borderB、paddingC、backgroundD、margin正确答案:B33.下列哪个命令用来测试网络连通性()A、pingB、dosC、netstatD、Ipconfig正确答案:A34.Apache服务器是实现()网络协议的服务器。A、FTPB、DHCPC、HTTPDD、HTTP正确答案:D35.关于“user-agent”(用户代理)的描述错误的是A、代表用户发起HTTP请求的客户端程序B、所有发布Web请求的应用程序都是HTTPAgent代理C、Web浏览器也是一种HTTPAgent代理D、网络爬虫只是一段程序,并不是代理正确答案:D36.SQL语句中的条件用以下哪一项来表达()A、THENB、WHILEC、WHERED、IF正确答案:C37.以下选项中符合Python语言变量命名规则的是A、*iB、3_1C、AI!D、Templist正确答案:D38.使用scrapy框架编写爬虫,setting.py文件中有些配置项需要修改,比如ROBOTSTXT_OBEY的值一般情况下设置为A、TrueB、0C、FalseD、1正确答案:C39.re模块的常用方法中用于将输入的字符串整个扫描并返回第一个成功的匹配的是()。A、subB、compileC、searchD、split正确答案:C40.在OSI的七层参考模型中,工作在第二层上的网间连接设备是()A、交换机B、路由器C、集线器D、网关正确答案:A41.Hub是一种网络设备,它的中文名称叫A、调制解调器B、集线器C、网桥D、路由器正确答案:B二、多选题(共21题,每题1分,共21分)1.以下选项中,属于jQuery事件方法的是()A、click()B、find()C、mouseover()D、focus()正确答案:ACD2.XPath表达式可返回()?A、字符串B、逻辑值C、节点集D、数字正确答案:ABCD3.BeautifulSoup支持Python标准库中的HTML解析器以及一些第三方的解析器,常见的解析器有()。A、Python标准库B、lxmlHTML解析器C、lxmlXML解析器D、html5lib正确答案:ABCD4.下列属于Linux发行版操作系统的是()A、SolarisB、RedHatC、CentosD、Ubuntu正确答案:BCD5.正则表达式中常用于表示字符的元字符是A、"."B、""C、"s"D、"w"正确答案:AD6.以下属于jQuery选择器的是()A、.class选择器B、id选择器C、元素选择器D、过滤选择器正确答案:ABCD7.下列属于Linux操作系统特点的是()。A、源码公开B、与unix兼容C、便于定制和再开发D、性能高安全性强正确答案:ABCD8.Scrapy中,Linkextractor的常见属性包括()等。A、allowB、denyC、restrict_xpathsD、restrict_text正确答案:ABCD9.关于Python注释,以下选项中描述正确的是()A、注释可以辅助程序调试B、注释可用于标明作者和版权信息C、注释用于解释代码原理或者用途D、Python注释语句不被解释器过滤掉,也不被执行正确答案:ABC10.根据《中华人民共和国网络安全法》,下列说法不正确的是()A、网络产品、服务具有收集用户信息功能的,其提供者不需要向用户明示B、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度C、国家不允许网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作D、为了获得更多有利数据,可以侵入他人网络、干扰他人网络正常功能、窃取网络数据正确答案:ACD11.计算机网络的拓扑结构就是用网络的站点与连接线的几何关系来表示网络的结构,以下为拓扑结构类型的是()。A、网状型B、总线型C、树型D、星型E、环型正确答案:ABCDE12.爬虫的基本流程主要包括()。A、获取响应内容B、发起请求C、解析内容D、保存数据正确答案:ABCD13.对于日志类型的数据采集,常用的采集工具有A、beautifulSoupB、scrapyC、logstashD、filebeat正确答案:CD14.《民法总则》中规定自然人的个人信息受法律保护。任何组织和个人需要获取他人个人信息的,应当()A、可以任意公开他人信息B、不得非法买卖、提供或者公开他人个人信息C、依法取得并确保信息安全D、不得非法收集、使用、加工、传输他人个人信息正确答案:BCD15.在Xpath中,元素节点可以有()个。A、0B、1C、多个D、以上都不对正确答案:ABC16.关于Python异常,以下描述不正确是()A、程序运行中,抛出异常不一定终止程序B、程序运行时有异常抛出,程序立即终止C、缩进错误会导致程序运行中断D、拼写错误会导致程序运行中断正确答案:BCD17.以下属于常用爬虫框架的是()。A、Spring框架B、Scrapy框架C、Pyspider框架D、CoB框架正确答案:BCD18.现在将/目录下的www文件权限改为只有主用户有执行的权限,其他用户没有执行权限()A、chmodo-x.g-x.u-x/wwwB、chmod100/wwwC、chmodu+x.g-x.o-x/wwwD、chmod001/www正确答案:BC19.以下属于信道复用技术的是()A、频分复用技术B、码分复用技术C、时分复用技术D、波分复用技术正确答案:ABCD20.Scrapy架构中,中间件包括()A、DownloaderMiddlewaresB、SchedulerMiddlewaresC、SpiderMiddlewaresD、PipelineMiddlewares正确答案:AC21.ER模型中实体之间的关系有()A、1:nB、m:nC、1:m:nD、1:1正确答案:ABD三、判断题(共37题,每题1分,共37分)1.删除表用droptable关键字A、正确B、错误正确答案:A2.print()函数可同时输出一个或多个数据,在输出多个数据时,默认使用空格作为输出分隔符。A、正确B、错误正确答案:A3.Tomcat作为独立服务器,请求来自于web浏览器。A、正确B、错误正确答案:A4.Linux系统的任何用户都可以设置计算机的名称。A、正确B、错误正确答案:B5.连入Internet必须使用的网络协议时TCP/IPA、正确B、错误正确答案:A6.BeautifulSoup既可以抓取数据,又可以解析数据A、正确B、错误正确答案:B7.当我们通过浏览器访问本地计算机上的信息时,无论你是否需要,计算机都会把最近浏览过的网页信息保存到windowsTemporaryA、正确B、错误正确答案:A8.Robots协议全称是“网络爬虫排除标准”,网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。A、正确B、错误正确答案:A9.路由器的访问控制列表(ACL)可以监控交换的字节数。A、正确B、错误正确答案:B10.ELK主要用于收集集群日志,从而对日志进行进行有效的查询和检索。ELK由ElasticSearch、Logstash和Kiabana三个开源工具组成。A、正确B、错误正确答案:A11.数据采集以人工录入方式为主,避免使用自动化的手段。A、正确B、错误正确答案:B12.某些情况下,单向通信也能有反方向的交互A、正确B、错误正确答案:B13.Python安装扩展库常用的工具是install工具A、正确B、错误正确答案:B14.在数据库的概念设计中,最常用的数据模型是实体联系模型A、正确B、错误正确答案:A15.列表和元组类似,都是可变的A、正确B、错误正确答案:B16.Web中间件就是提供系统软件和应用软件之间连接的软件,以便于软件各部件之间的沟通A、正确B、错误正确答案:A17.type()函数是可以查看变量类型的Python内置函数A、正确B、错误正确答案:A18.tomcat不是web容器A、正确B、错误正确答案:B19.jQuery中,hide()可以隐藏元素,show()可以显示隐藏的元素A、正确B、错误正确答案:A20.创建表用createtable关键字A、正确B、错误正确答案:A21.request响应模块,用来处理客户端发送请求的服务器响应。A、正确B、错误正确答案:B22.python开发中,list(map(str,[1,2,3]))的执行结果为[1],[2],[3]A、正确B、错误正确答案:B23.在Tomc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论