数据采集1+x中级试题库(附答案)_第1页
数据采集1+x中级试题库(附答案)_第2页
数据采集1+x中级试题库(附答案)_第3页
数据采集1+x中级试题库(附答案)_第4页
数据采集1+x中级试题库(附答案)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x中级试题库(附答案)一、单选题(共63题,每题1分,共63分)1.下面哪种链接对网站在搜索引擎中排名起更加积极的影响?A、10个链接来自10个不同的网站B、10个交叉链接C、10个链接来自同一个服务器上的网站D、10个链接来自同一个网站正确答案:A2.针对域名,表示商业公司的一级域名是()A、netB、comC、eduD、org正确答案:B3.选择html页面上所有class属性为“cls”的div标签,Xpath代码为()。A、//div[@class='cls']B、/div[@class='cls']C、//div[@class=cls]D、//div[class='cls']正确答案:A4.vim编辑器中如何从输入模式切换到末行模式()A、先敲击Esc键退回到命令模式,然后敲击冒号(:)进入末行模式B、先敲击冒号(:)退回到命令模式,然后敲击Esc键进入末行模式C、直接敲击Esc键进入末行模式D、直接敲击冒号(:)进入末行模式正确答案:A5.下面哪类友情链接可以进行交换A、隐藏看不到的链接B、有跳转的链接C、带有nofollow的链接D、导出链接比较少的链接正确答案:D6.数字法表示的权限中数字5代表()A、写运行B、读写C、读写运行D、读运行正确答案:D7.HBase虚拟分布式模式须要()个节点?A、1B、2C、3D、最少3个正确答案:A8.Apache服务器运行后会生成两个日志文件,其中,()是记录Web服务器的所有访问活动的文件。A、error_log(错误日志)B、/usr/local/tomcat/logsC、access_log(访问日志)D、logs正确答案:C9.关于Python,算法是指()A、数学的计算公式B、解决问题的精确步骤C、程序设计语言的语句序列D、对问题的精确描述正确答案:B10.网页前端设计中,()语言作用是浏览器端组织和显示网页信息(文本、图片、视频等)。A、CSSB、JavaScriptC、HTMLD、JSP正确答案:C11.Apache服务器的主配置文件A、http.confB、httpd.confC、httpd.cfgD、config.cfg正确答案:B12.关于/etc/fstab文件下边哪个描述是正确的()A、保存硬件信息B、用于管理文件系统信息C、用于设置命名规则,是否使用可以用tab来命名一个文件D、系统启动后,由系统自动产生正确答案:B13.以下哪项指标对SEO更重要?A、网站总收录量和近日收录量B、PR值C、百度快照D、关键词出现次数正确答案:A14.scrapy框架的运行流程中,()组件是scrapy框架的核心组件A、DownLoaderB、ScrapyEngineC、SchedulerD、Spiders正确答案:B15.一个典型的NetStream系统不包含哪一部分()A、网络流数据输出器NDEB、网络流数据收集器NSCC、网络流数据分析器NDAD、网络流数据存储器NDS正确答案:D16.以下选项中,不是Python语言特点的是()A、变量声明:Python语言具有使用变量需要先定义后使用的特点B、面向对象:Python具有多态、运算符重载、继承和多重继承等面向对象编程的主要特征C、强制可读:Python语言通过强制缩进来体现语句间的逻辑关系D、平台无关:Python程序可以在任何安装了解释器的操作系统环境中执行正确答案:A17.下列哪个可以匹配身份证号(15位、18位数字)?A、^d{15}|d{18}B、^d{15}d{18}$C、^d{15}|d{18}$D、^d{15}|d{18}$正确答案:C18.centos7中超级用户的命令提示符是()A、%B、&C、#D、$正确答案:C19.关于Python语言的特点,以下选项描述正确的是A、Python语言是非跨平台语言B、Python语言是编译型语言C、Python语言是解释型语言D、Python语言不支持面向对象正确答案:C20.下列哪项功能可在交换网络中通过合并多个交换机端口来支持更高的吞吐量?A、网络直径B、链路聚合C、收敛D、冗余链路正确答案:B21.下面对HBase的描述哪些是错误的?()。A、不是开源的B、是面向列的C、是分布式的D、是一种NoSQL数据库正确答案:A22.匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线)?A、^[a-zA-Z][a-zA-Z0-9_]{4.15}B、[a-zA-Z][a-zA-Z0-9_]{4.15}$C、^[a-zA-Z][a-zA-Z0-9_]{4.15}$D、^[a-zA-Z][a-zA-Z0-9]{4.15}$正确答案:C23.关于Python的全局变量和局部变量,以下选项中描述错误的是A、局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用可以继续使用B、使用global保留字声明简单数据类型变量后,该变量作为全局变量使用C、简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放D、全局变量指在函数之外定义的变量,一般没有缩进,在程序执行全过程有效正确答案:A24.以下选项中,Python语言中代码注释使用的符号是A、//B、/……/C、!D、#正确答案:D25.HTTPS使用()协议对报文进行封装A、SSHB、SSLC、SHA-1D、SET正确答案:B26.正则表达式中,下列()表达式是求整数?A、^-?d+$B、^-?d+C、^-?d$D、^-d+$正确答案:A27.数据库操作中,deletefromemployee语句的作用是()A、删除当前数据库中整个employee表,包括表结构B、删除当前数据库中employee表内的所有行C、由于没有where子句,因此不删除任何数据D、删除当前数据库中employee表内的当前行正确答案:B28.某公司的网络管理员在一台Catalyst交换机上配置VLAN时发现,无法在该交换机上创建VLAN,在排除了软件自身的缺陷和命令语法错误的可能性后,最可能的原因是()。A、未配置中继(Think)B、未设置VTP密码C、该交换机处于VTP的客户机(Client)模式下D、该交换机处于VTP的服务器(Server)模式下正确答案:C29.客户端首次查询HBase数据库时,首先需要从哪个()表开始查找。A、META.B、–ROOT-C、用户表D、信息表正确答案:B30.NoSQL数据库的特点不包括()。A、分布式B、不基ACIDC、支持严格事务D、易拓展正确答案:C31.定义类如下classHello():def__init__()=namedefshowInfo(self)print()下面代码能正常执行的()A、h=Hello(‘admin’)1.showInfoB、h=Helloh.showInfo()C、h=Hello()h.showInfo(‘张三’)D、h=Hello(‘张三’)h.showInfo()正确答案:D32.以下不属于Windows工具命令的是()A、notepadB、chmodC、regeditD、write正确答案:B33.TCP/IP层的网络接口层对应OSI的A、物理层B、链路层C、网络层D、物理层和链路层正确答案:D34.以下()命令可正确显示shell环境变量PATH的值A、echoPATHB、echo$PATHC、catPATHD、cat$PATH正确答案:B35.关于关系型数据库,若要在基本表S中增加一列CN(课程名),可用()语句实现A、ADDTABLESALTER(CNCHAR(8))B、ALTERTABLESADD(CNCHAR(8))C、ADDTABLES(CNCHAR(8))D、ALTERTABLES(ADDCNCHAR(8))正确答案:B36.在Linux环境下的Tomcat容器数据的采集中,启动Tomcat容器的代码是()A、filebeatB、startup.shC、logstashD、httpd正确答案:B37.你给公司的新同事创建一个用户,起指定他的账号在30天过期,现在想更改过期时间,使用下边哪个命令更合适()A、usermod-xB、usermod-eC、usermod-dD、usermod-a正确答案:B38.以下哪个HTTP头的作用是将爬虫伪装成正常的浏览器的A、User-AgentB、RefererC、AcceptD、Accept-Encoding正确答案:A39.Windows事件日志的事件类型,不包括()A、失败审核事件B、调试事件C、警告事件D、信息事件正确答案:B40.Apache服务器是实现()网络协议的服务器。A、FTPB、DHCPC、HTTPDD、HTTP正确答案:D41.以下可用于日志数据采集的工具是()。A、filebeatB、WiresharkC、logstashD、八爪鱼采集器正确答案:A42.关于urlopen方法,描述错误的是A、可以向服务器发送参数数据B、可以发送HTTPhead消息C、默认发送GET请求D、可以使用Request对象作为参数正确答案:B43.百度进行大更新的时间最多的是A、每周三B、每周四C、每周二D、每周一正确答案:B44.选取当前节点的所有后代元素(子、孙等)以及当前节点本身需要哪个轴?A、descendant-or-selfB、childC、descendantD、parent正确答案:A45.网站进行友情链接多少个为适中A、1~5个B、20~30个C、30~40个D、40个以上正确答案:B46.启动Android系统的内置的Web浏览器,需要在Intent中指定的ACTION为()A、ACTION_PICKB、ACTION_SEARCHC、ACTION_WEBD、ACTION_VIEW正确答案:D47./etc/shadow文件中存放()A、文件系统信息B、用户口令的加密信息C、用户账号基本信息D、用户组信息正确答案:B48.表示商业公司的一级域名是A、comB、eduC、orgD、net正确答案:A49.以下哪种爬虫又称为主题网络爬虫,是指选择性的爬行那些与预先定义好的主题相关页面的网络爬虫A、增量式网络爬虫B、聚焦网络爬虫C、通用网络爬虫D、深层页面爬虫正确答案:B50.下列语句中查询姓李的学生的语句是()。A、select*from表名where姓名like‘李’B、select*from表名where姓名like‘%李%’C、select*from表名where姓名like‘李%’D、select*from表名where姓名=‘李’正确答案:C51.有关Python异常说法正确的是()A、程序中抛出异常终止程序B、程序中抛出异常不一定终止程序C、拼写错误会导致程序终止D、缩进错误会导致程序终止正确答案:B52.需求分析是作为一个网络设计时所必须的,它可以实现:()A、了解新技术B、建设有针对性的网络C、提高网络性能D、了解宏观政策正确答案:A53.在给定文件中查找与设定条件相符字符串的命令为()A、findB、gzipC、sortD、grep正确答案:D54.Tomcat容器运行的界面为()。A、aspB、phpC、cD、jsp正确答案:D55.关于HTTP的head消息“connection:keep-alive”,以下描述正确的是A、能够一直保持与服务器之间的连接B、只能在每个HTTP连接中进行一次请求和响应C、可以在每个HTTP连接中进行多次次请求和响应D、仅适用于HTTP/1.1正确答案:C56.以下选项中,正确地描述了浮点数0.0和整数0相同性的是()A、它们使用相同的硬件执行单元B、它们使用相同的计算机指令处理方法C、它们具有相同的数据类型D、它们具有相同的值正确答案:D57.某文件的权限为:drw-r--r--.用数值形式表示为A、622B、611C、422D、644正确答案:D58.Apache服务器运行后会生成的日志文件,在()目录中A、/etc/httpd/logs1/B、/etc/httpd/log/C、/etc/httpd/logs/D、httpd/logs/正确答案:C59.与Windows相比Linux在哪个方面相对应用较少?()A、桌面B、服务器C、集群D、嵌入式系统正确答案:A60.对于某个公司的业务系统,希望查看系统登录和操作情况,可通过()进行数据采集和分析A、设备数据采集B、业务日志采集C、数据库采集D、网页爬虫采集正确答案:B61.Requests默认情况下会自动处理所有重定向,使用响应对象的哪个方法来追踪重定向A、gobackB、previewC、historyD、local正确答案:C62.()法律中说明“国家支持网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作,提高网络运营者的安全保障能力。”A、《中华人民共和国网络安全法》B、《中华人民共和国安全法》C、《民法总则》D、《电信和互联网用户个人信息保护规定》正确答案:A63.httpd采用()模块化设计方法A、modulesB、core+modulesC、coreD、core+module正确答案:B二、多选题(共17题,每题1分,共17分)1.Windows事件日志中的事件类型主要有信息事件和()。A、失败审核事件B、警告事件C、成功审核事件D、错误事件正确答案:ABCD2.以下属于position常用属性的是()A、absoluteB、staticC、relativeD、fixed正确答案:ABCD3.XPath使用路径表达式来选取XML文档中的()?A、节点B、节点集C、文本D、属性正确答案:AB4.在查询语句中,必不可少的关键字是()A、selectB、whereC、fromD、join正确答案:AC5.数据采集,从网页或各业务系统中来抽取数据,并进行本地存储,其具体步骤包括()。A、清洗数据B、分析数据C、采集数据D、存储数据正确答案:ACD6.正则表达式的特点?A、灵活性B、功能性C、复杂性D、逻辑性正确答案:ABD7.在xpath中,节点是通过沿着()或者()来选取的。A、属性B、步C、谓语D、路径正确答案:BD8.vim文本编辑器有哪些模式()A、命令模式B、引用模式C、末行模式D、输入模式正确答案:ACD9.Xpath中的节点关系包括()A、同胞B、先辈和后辈C、父子D、属性正确答案:ABC10.Python中,关于文件的打开方式,以下选项中描述错误的是()。A、文件只能选择二进制打开B、所有文件都可能以二进制方式打开C、文本文件只能以文本方式打开D、所有文件都可能以文本方式打开正确答案:ACD11.下列属于Linux操作系统特点的是()。A、性能高安全性强B、便于定制和再开发C、与unix兼容D、源码公开正确答案:ABCD12.以下对于SQL比较运算符ANY和ALL的说法不正确的是()A、<ANY表示小于最小值B、>ANY表示大于最大值C、<ALL表示小于最大值D、>ALL表示大于最小值正确答案:ABCD13.数据采集的类型包括()A、结构化数据B、半结构化数据C、非结构化数据D、以上都不属于数据采集的类型正确答案:ABC14.下载的方式除了WEB外,还有以下几种方式()。A、文件传送(FTP)B、远程登陆(Telnet)C、专门用于下载的软件,如WINRAR等D、QQ下载正确答案:AB15.下面对count(),index().find()方法描述错误的是()A、count()方法用于统计字符串里某个字符出现的次数B、find()方法检测字符串中是否包含子字符串str如果包含子字符串返回开始的索引值,否则会报一个异常C、index()方法检测字符串中是否包含子字符串str,如果str不在返回-1D、以上都错误正确答案:BC16.Tomcat是一个开源的小型的轻量级应用服务,且具有()特点。A、支持负载平衡B、扩展性好C、邮件服务D、占用系统资源少正确答案:ABCD17.以下属于常用爬虫框架的是()。A、Spring框架B、Scrapy框架C、Pyspider框架D、CoB框架正确答案:BCD三、判断题(共27题,每题1分,共27分)1.window.onload是在页面所有元素都加载完后才能执行。A、正确B、错误正确答案:A2.拥有相同的父的节点称为同胞。A、正确B、错误正确答案:A3.python最具特色的就是使用缩进来表示代码块,不需要使用大括号{}。缩进的空格数是可变的,但是同一个代码块的语句不必包含相同的缩进空格数。A、正确B、错误正确答案:B4.微服务架构是围绕着微服务思想构建的一系列结果的简称,是一种在传统软件应用架构的基础上,按照功能拆分为更加细粒度的服务,拆分出的每个服务都是一个独立的应用。A、正确B、错误正确答案:A5.数据库操作中,创建表用createtable语句。A、正确B、错误正确答案:A6.操作系统中,设备控制器是计算机和中央处理器(CPU)之间的接口,它会接收CPU的指令,然后去实现对设备的控制A、正确B、错误正确答案:A7.硬链接不可以跨文件系统。它只能建立对文件的链接;源文件删除后,硬链接文件也可正常使用。A、正确B、错误正确答案:A8.w与[0-9a-zA-Z]是等效的A、正确B、错误正确答案:B9.python中,重写父类的方法,可在子类中定义一个这样的方法,即它与要重写的父类方法同名。A、正确B、错误正确答案:A10.数据采集的重点在于数据本身,而不在于如何能够真正地解决数据运营中的实际商业问题。A、正确B、错误正确答案:B11.display:none不显示对应的元素,在文档布局中不会为其分配空间A、正确B、错误正确答案:A12.查看数据表的结构信息,可以在指定的数据库中使用“describe表名;”语句,通常简写为“desc表名;”A、正确B、错误正确答案:A13.Windows操作系统在其运行的生命周期中会记录其大量的日志信息,这些日志信息包括:Wi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论