




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据采集1+x初级题库+参考答案一、单选题(共41题,每题1分,共41分)1.XPath是一门在()文档中查找信息的语言?A、HTMLB、JAVAC、ORACLED、XML正确答案:D2.以下xpath代码中,能够获取页面中title标签的内容的是()。A、//title/@text()B、//title/textC、//title/@textD、//title/text()正确答案:D3.Tomcat默认发布项目的位置为()A、appsB、webappsC、WEB-INFD、classes正确答案:B4.明知他人从事危害网络安全的活动的,不得为其提供广告推广、支付结算和()等帮助。A、拓展服务B、技术支持C、网络推广D、使用服务正确答案:B5.下列不属于操作系统类型的是()。A、分时系统B、批处理系统C、模拟系统D、实时系统正确答案:C6.使用httpd命令查看Apache软件的安装版本信息,命令为()A、httpd-vB、httpd-versionC、httpdD、http正确答案:A7."<inputid="jq1"type="text"/>以下哪种可以隐藏该属性()"A、$(#jq1).remove();B、$("jq1").hide();C、$("#jq1").hide();D、$("#jq1").remove();正确答案:C8.“内容为一个URL,标识用户从该URL代表的页面出发访问当前请求的页面”以上描述所指的消息头是()。A、AcceptB、RefererC、User-AgentD、Connection正确答案:B9.HTTPS协议的默认端口号是A、8080B、443C、88D、80正确答案:B10.删除数据表文件的命令是()A、DELETETABLEB、DROPTABLEC、DROPD、DELETE正确答案:B11.服务器端响应状态码中,表示“NOTMODIFIED文档未修改”的是A、302B、404C、304D、200正确答案:C12.以下选项中符合Python语言变量命名规则的是A、*iB、3_1C、AI!D、Templist正确答案:D13.在学生管理数据库中,查询所有姓“李”的学生信息,可使用()命令。A、select*fromstudentwherename='李_';B、select*fromstudentwherenamelike'李%';C、select*fromstudentwherenamelike'%李';D、select*fromstudentwherenamein'李%';正确答案:B14.按企业编号bno分组统计出“staff”表中各企业人数大于1的企业编号和企业人数的SQL命令()。A、SELECTbno.COUNT(sno)FROMstaffGROUPBYbnoWHERECOUNT(sno)>1;B、SELECTbno.COUNT(sno)FROMstaffGROUPBYbnoHAVINGSUM(sno)>1;C、SELECTbno.COUNT(sno)FROMstaffGROUPBYbnoHAVINGCOUNT(sno)>1;D、SELECTbno.COUNT(sno)FROMstaffORDERBYbnoHAVING正确答案:C15.关于数据采集的描述不正确的是()A、数据采集不在于掌握庞大的的数据信息,而在于对数据的智能处理,挖掘出有价值的信息B、数据采集来源广泛,类型也丰富多样,很看重数据处理的高效性和实时性C、数据采集,要注重数据质量和数据采集性能提升,为数据的准确分析打下基础D、以上描述都不正确正确答案:D16.CSS中通过哪个属性设定元素的背景颜色()。A、background-colorB、background-imageC、back-colorD、bg-color正确答案:A17.Scrapy中,用于自定义所有Scrapy组件的行为的是()。A、ItemB、piplineC、settingsD、Spider正确答案:C18.通过在路径表达式中使用()运算符,您可以选取若干个路径?A、空白B、.C、/D、|正确答案:C19.半结构数据,是介于结构化数据与非结构化之间的数据,下面不属于半结构化数据的是()A、JSONB、HTMLC、MPEG-1D、XML正确答案:C20.()是进行数据清洗的工具。A、logstashB、apacheC、tomcatD、filebeat正确答案:A21.数据库管理系统能实现建立数据库、建立表等操作的数据库语言称为(),其主要包括CREATEDATABASE、CREATETABLE等。A、DML(数据操纵语言)B、DDL(数据定义语言)C、DQL(数据查询语言)D、DCL(数据控制语言)正确答案:B22.Apache服务器是实现()网络协议的服务器。A、FTPB、DHCPC、HTTPDD、HTTP正确答案:D23.HTML中用于标记表单的是标签是()A、<tab>B、<table>C、<frame>D、<form>正确答案:D24.每一个表只能拥有一个()索引。A、主B、候选C、普通D、唯一正确答案:A25.CSS选择器中,()前面以“#”号来标志,根据元素ID来选择元素,具有唯一性。A、类选择器B、ID选择器C、后代选择器D、标签选择器正确答案:B26.以下关于对数据采集要求的描述,不正确的是A、高效性B、全面性C、多维性D、非及时性正确答案:D27.以下属于传输层协议的是()。A、FTPB、TCPC、HTTPD、IP正确答案:B28.Python文件的后缀名是()。A、doB、phpC、goD、py正确答案:D29.下列哪个命令用来测试网络连通性()A、IpconfigB、pingC、dosD、netstat正确答案:B30.Logstash的INPUT数据输入配置中用于开发人员进行测试的方式是哪一种A、filebeatB、kafkaC、fileD、stdin正确答案:D31.random库中,用于生成随机小数的函数是()A、random()B、randrange()C、getrandbits()D、randint()正确答案:A32.下列表达式的值为True的是()A、(3.2)<("a"."b")B、5+4j>2-3jC、"abc">"xyz"D、3>2>2正确答案:A33.re模块的常用方法中按照能够匹配的字符串作为分隔符,将字符串分割后返回一个列表的是()。A、compileB、searchC、matchD、split正确答案:D34.python编写爬虫过程中,需要将爬取的网页内容转换为哪种类型的对象才可以使用etree模块的xpath方法()A、DOMB、HTMLC、ElementD、Response正确答案:C35.进行数据采集的工具为()A、filebeatB、apacheC、javaD、tomcat正确答案:A36.以下哪种类型的网络容易遭受攻击()。A、宽带网络B、无线网络C、租用专线网络D、拨号网络正确答案:B37.Elasticsearch是一个构建在()之上分布式可扩展的实时搜索和分析引擎。A、ApacheLuceneB、HDFSC、HadoopD、Hbase正确答案:A38.Linux操作系统的创始人是()A、LunixB、LinusC、LinuxD、Lunis正确答案:B39.基本的Python内置函数eval(x)的作用是()A、将x转换成浮点数B、去掉字符串x最外侧引号,当作Python表达式评估返回其值C、计算字符串x作为Python语句的值D、将整数x转换为十六进制字符串正确答案:B40.()不是用来查询、添加、修改和删除数据库中数据的语句A、SELECTB、INSERTC、UPDATED、DROP正确答案:D41.下列哪些属于()规范数据信息收集的方式与要求A、自然人的个人信息受法律保护B、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使用用户个人信息C、发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营者予以更正D、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度正确答案:A二、多选题(共21题,每题1分,共21分)1.Xpath表达式的返回值可以返回什么类型?A、布尔类型B、数字C、字符串D、节点值正确答案:ABCD2.关于Python注释,以下选项中描述正确的是()A、注释可以辅助程序调试B、注释可用于标明作者和版权信息C、注释用于解释代码原理或者用途D、Python注释语句不被解释器过滤掉,也不被执行正确答案:ABC3.requests库发送请求的方法包括()等。A、GETB、POSTC、DELETED、PUT正确答案:ABCD4.以下属于常用的日志框架的是()。A、Log4jB、Slf4jC、LogbackD、VUE正确答案:ABC5.Xpath的内建函数可用于处理()A、日期B、比较C、数值D、字符串值正确答案:ABCD6.Scrapy架构中,中间件包括()。A、DownloaderMiddlewaresB、SchedulerMiddlewaresC、SpiderMiddlewaresD、PipelineMiddlewares正确答案:AC7.《中华人民共和国网络安全法》中规定()A、任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动B、可以提供危害网络安全活动的程序、工具C、明知他人从事危害网络安全的活动的,不得为其提供技术支持、广告推广、支付结算等帮助D、不得提供专门用于从事侵入网络、干扰网络正常功能及防护措施、窃取网络数据等危害网络安全活动的程序、工具正确答案:ACD8.以下属于CSS选择器的是()A、ID选择器B、标签选择器C、类选择器D、伪类选择器正确答案:ABCD9.以下属于jQuery特点的是()A、可以方便的为网站提供ajax交互B、是一个轻量级JavaScript库C、容易扩展,插件丰富D、兼容各种浏览器正确答案:ABCD10.以下对网站排名有较大影响的因素是()A、服务器稳定性B、网站内容C、Title标签D、Keywords标签正确答案:ABC11.网络爬虫按照系统结构和实现技术,可以有以下类型()。A、聚焦网络爬虫B、深层页面爬虫C、通用网络爬虫D、增量式网络爬虫正确答案:ABCD12.Scrapy架构中,中间件包括()A、DownloaderMiddlewaresB、SchedulerMiddlewaresC、SpiderMiddlewaresD、PipelineMiddlewares正确答案:AC13.以下属于常用爬虫框架的是()。A、Spring框架B、Scrapy框架C、Pyspider框架D、CoB框架正确答案:BCD14.以下属于表单<form>常用属性的是()A、nameB、actionC、sizeD、method正确答案:ABD15.以下CSS中,属于font属性的是()。A、font-sizeB、font-weightC、sizeD、font-style正确答案:ABD16.以下选项中,()是Python语言的特点。A、变量声明:Python语言具有使用变量需要先定义后使用的特点B、面向对象:Python具有多态、运算符重载、继承和多重继承等面向对象编程的主要特征C、平台无关:Python程序可以在任何安装了解释器的操作系统环境中执行D、强制可读:Python语言通过强制缩进来体现语句间的逻辑关系正确答案:BCD17.现在将/目录下的www文件权限改为只有主用户有执行的权限,其他用户没有执行权限()A、chmodu+x.g-x.o-x/wwwB、chmodo-x.g-x.u-x/wwwC、chmod001/wwwD、chmod100/www正确答案:AD18.sql语言分为以下()几类A、DCLB、DDLC、DMLD、DQL正确答案:ABCD19.以下关于索引的说法正确的是()。A、可以加快数据的检索速度B、唯一性索引可以保证数据记录的唯一性C、可以加快表与表之间的连接D、索引不需要花费代价占用存储空间就可以实现检索速度的提高正确答案:ABC20.数据采集,从网页或各业务系统中来抽取数据,并进行本地存储,其具体步骤包括()。A、存储数据B、分析数据C、清洗数据D、采集数据正确答案:ACD21.BeautifulSoup支持Python标准库中的HTML解析器以及一些第三方的解析器,常见的解析器有()。A、Python标准库B、lxmlHTML解析器C、lxmlXML解析器D、html5lib正确答案:ABCD三、判断题(共37题,每题1分,共37分)1.进程具备多种特性,如:动态性、顺序性、独立性和同步性A、正确B、错误正确答案:B2.vi命令模式中a是从光标所在位置后面开始新增内容。A、正确B、错误正确答案:A3.Robots协议全称是“网络爬虫排除标准”,网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。A、正确B、错误正确答案:A4.tomcat不是web容器A、正确B、错误正确答案:B5.域名是个逻辑概念,一般指向计算机所在的物理地点。A、正确B、错误正确答案:B6.不经用户同意,电信业务经营者、互联网信息服务提供者可以收集、使用用户个人信息A、正确B、错误正确答案:B7.Linux中终止进程的命令可以用kill。A、正确B、错误正确答案:A8.Python语言是脚本语言A、正确B、错误正确答案:A9.tomcat也叫servlet容器。A、正确B、错误正确答案:A10.文件共享是指系统允许多个用户或者进程去共享同一个文件,文件共享只限于系统内共享。A、正确B、错误正确答案:B11.GET是最常用的请求方式,数据安全性和保密性比较低;POST请求方式可以将传输的数据封装在报文的请求中,对传输大小存在限制。A、正确B、错误正确答案:B12.Python标准库中的re模块提供正则表达式的全部功能,可以直接引入。A、正确B、错误正确答案:A13.关系模型就是一张二维表,一个关系型数据库就是若干个二维表的集合。A、正确B、错误正确答案:A14.<head>和</head>分别表示文档的开始和结束,用于告知浏览器其自身是一个HTML文档。A、正确B、错误正确答案:B15.关键词需要考虑密度,不能堆积A、正确B、错误正确答案:A16.堆叠是用专用的端口把交换机连接起来,当作一个交换机使用。A、正确B、错误正确答案:A17.在TCP/IP协议中,TCP提供可靠的面向连接服务,UDP提供简单的无连接服务A、正确B、错误正确答案:A18.防火墙可以完全控制外部用户对Intranet的入侵与破坏A、正确B、错误正确答案:B19.JavaScript中标识符首字母不能为数字A、正确B、错误正确答案:A20.传输层是通过建立物理连接来进行数据传输的A、正确B、错误正确答案:B21.HTTP的head消息“referer”的作用是告知服务器是从哪个资源转到当前资源上来的。A、正确B、错误正确答案:A22.访问某个网站,可以直接通过域名或服务的URL进行访问A、正确B、错误正确答案:A23.在关系型数据库中,数据元素是最基本的数据单元,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 节能改造后期运维管理行业跨境出海战略研究报告
- 高压水雾足浴舒缓站行业深度调研及发展战略咨询报告
- 司法考试案例之个人之间委托炒股合同范本
- 课题开题报告:新高考思想政治试题特点与教学策略研究
- 课题开题报告:协同提质背景下县域学校课后服务课程体系建设研究
- 课题开题报告:校际合作交流组织、平台与制度建设研究
- 幼儿园活动设施自查报告范文
- 机电工程技术专业实习报告范文
- 2025年统计学专业期末考试题库:统计学术论文写作中的研究问题与论文主题确定试题
- 2025年征信考试题库(征信监管政策动态):征信业务监管政策与风险防控试题集
- 2024江苏盐城市交通投资建设控股集团有限公司招聘笔试参考题库附带答案详解
- 职务侵占罪预防
- 预防艾滋病母婴传播工作职责
- 人工智能辅助法律文书处理
- 4.2做自信的人(课件) 2024-2025学年统编版道德与法治七年级下册
- 南大版一年级心理健康第5课《校园“红绿灯”》课件
- 2024年财政部会计法律法规答题活动题目及答案一
- 《冠心病》课件(完整版)
- DZ/T 0462.3-2023 矿产资源“三率”指标要求 第3部分:铁、锰、铬、钒、钛(正式版)
- 2024年南京交通职业技术学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 汽车空调蒸发器的环保型耐蚀亲水处理工艺
评论
0/150
提交评论