数据采集1+x初级练习题(含参考答案)_第1页
数据采集1+x初级练习题(含参考答案)_第2页
数据采集1+x初级练习题(含参考答案)_第3页
数据采集1+x初级练习题(含参考答案)_第4页
数据采集1+x初级练习题(含参考答案)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级练习题(含参考答案)一、单选题(共41题,每题1分,共41分)1.在xpath中,哪个轴可以选取当前节点的所有属性?()A、attributeB、descendantC、attrD、child正确答案:A2.以下选项中,不是Python语言特点的是()A、强制可读:Python语言通过强制缩进来体现语句间的逻辑关系B、平台无关:Python程序可以在任何安装了解释器的操作系统环境中执行C、面向对象:Python具有多态、运算符重载、继承和多重继承等面向对象编程的主要特征D、变量声明:Python语言具有使用变量需要先定义后使用的特点正确答案:D3.取出html页面中body下的所有子标签A、//*B、/body*C、/body/*D、/body/@*正确答案:C4.以下CSS中,不属于font属性的是()A、font-sizeB、font-weightC、sizeD、font-style正确答案:C5.XPath于1999年11月16日成为()标准?A、W3CB、XMLC、ROMCATD、以上都不对正确答案:A6.以下哪种爬虫又称为主题网络爬虫,是指选择性的爬行那些与预先定义好的主题相关页面的网络爬虫A、通用网络爬虫B、聚焦网络爬虫C、深层页面爬虫D、增量式网络爬虫正确答案:B7.向数据表中插入一条记录用以下哪一项A、CREATEB、INSERTC、SAVED、UPDATE正确答案:B8.HTML中能够定义表单提交位置的属性是A、actionB、methodC、titleD、name正确答案:A9.已知代码:.a1{color:yellow;font-weight:bold;},其中利用了CSS中的哪种选择器A、ID选择器B、类选择器C、标签选择器D、组合选择器正确答案:B10.外链和反链的区别,说法正确的是()A、两者含义相同,只是不同名字而已B、外链是指外部的网站指向本网站,反链则是指向本页面的内部或外部链接C、外链是对于全站而言,反链只是指首页的链接D、外链对SEO有帮助,反链没有任何帮助正确答案:D11.如果要在python中只用正则表达式,则需要引入哪个模块A、xmlB、reC、etreeD、lxml正确答案:B12.以下哪种类型的网络容易遭受攻击()。A、租用专线网络B、无线网络C、宽带网络D、拨号网络正确答案:B13.半结构数据,是介于结构化数据与非结构化之间的数据,下面不属于半结构化数据的是()A、XMLB、JSONC、HTMLD、MPEG-1正确答案:D14.服务器端响应状态码中,表示“NOTFOUND未找到”的是A、302B、404C、304D、200正确答案:B15.()是通过爬虫程序监测某网站数据更新的情况,以便可以爬取到该网站更新的新数据,对于未发生内容变化的网页,则不会爬取。A、聚焦网络爬虫B、深层页面爬虫C、増量式网络爬虫D、通用网络爬虫正确答案:C16.Log4j定义的日志概念里不包含哪个()A、LoggerB、writerC、AppenderD、Level正确答案:B17.下列关键字可以用于创建新表的是()A、DELETETABLEB、CREATETABLEC、DROPTABLED、UPDATETABLE正确答案:B18.以下数据中,非结构化数据不包括()A、日志文件B、图像C、图片D、音频正确答案:A19.HTML中用于标记表格的标签是()A、<frame>B、<table>C、<form>D、<tab>正确答案:B20.()法律中说明“国家支持网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作,提高网络运营者的安全保障能力。”A、《中华人民共和国网络安全法》B、《中华人民共和国安全法》C、《电信和互联网用户个人信息保护规定》D、《民法总则》正确答案:A21.以下哪一项与网站优化关键词排名无关()A、网站空间稳定性B、网站程序复杂度C、网站域名D、网站开发语言正确答案:D22.()是进行数据清洗的工具。A、tomcatB、logstashC、apacheD、filebeat正确答案:B23.下面哪种方式是普通用户进入网站的方式A、收藏夹B、直接打网址C、百度首页D、导航类网站正确答案:D24.哪个表达式用来从根节点选取?A、..B、.C、/D、@正确答案:C25.Scrapy中,用于创建项目的命令是A、createprojectB、startprojectC、openprojectD、beginproject正确答案:B26.在SQL语言中提交事务的操作是通过()语句实现的A、CREATEB、REVOKEC、COMMITD、ROLLBACK正确答案:C27.当前INTERNET上应用最广泛的服务是A、WWWB、E-MailC、30~40个D、40个以上正确答案:A28.在Linux环境下的Apache容器数据的采集中,启动apache服务代码是()。A、httpdB、startup.batC、filebeatD、logstash正确答案:A29.修改数据库表结构用以下哪一项A、UPDATEB、CREATEC、UPDATEDD、ALTER正确答案:D30.能够实现数据链路层的互联设备有()A、网管B、网桥C、路由D、中继器正确答案:B31.哪个匹配空白行的正则表达式?A、sB、s*C、*D、以上都不对正确答案:B32.关于Python,算法是指()A、程序设计语言的语句序列B、对问题的精确描述C、解决问题的精确步骤D、数学的计算公式正确答案:C33.scrapy的哪个命令可以测试爬取网页的整个过程A、scrapyshellB、scrapyfetchC、scrapyviewD、scrapybench正确答案:D34.哪个表达式用来选取属性?A、@B、.C、/D、..正确答案:A35.哪个表达式用来选取当前节点?A、@B、/C、..D、.正确答案:D36.ATM的基本单位是信元,其长度为()A、5字节B、53字节C、48字节D、32字节正确答案:B37.数据定义语言的缩写词为()A、DDLB、DCLC、DMLD、DBL正确答案:A38.将网络认为局域网、城域网、广域网三种,是按照哪种方式进行分类的A、按地理范围分B、按传输技术分C、按拓扑结构分D、按使用范围分正确答案:A39.Tomcat的默认端口是()。A、80B、8080C、8089D、7070正确答案:B40.以下BeautifulSoup4的描述中,错误的是A、BeautifulSoup可以进行html文档的解析,但不能实现对网页的抓取B、默认使用的是标准库解析器C、使用lxmlHTML解析器对文档的纠错能力强,但解析速度较慢D、自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。正确答案:C41.用于将事务处理写到数据库的命令是()A、insertB、commitC、rollbackD、savepoint正确答案:B二、多选题(共21题,每题1分,共21分)1.关于socket编程,对于服务端编程的主要步骤包括()A、打开socketB、监听客户端连接C、绑定到一个地址和端口D、读写数据正确答案:ABCD2.requests模块向服务器发送请求的方法有()A、putB、deleteC、getD、post正确答案:ABCD3.以下哪几项是Android平台的特性()A、允许重用和替换组件的应用程序框架B、专门为移动设备优化的Dalvik虚拟机C、支持数据结构化存储的SQLiteD、支持摄像头、GPS、指南针和加速计等外围设备正确答案:ABCD4.基于监听接口的事件处理模型包含哪些步骤:()A、调用事件源的setXXXListener方法注册事件监听器B、获取普通界面组件C、实现事件监听类,该监听类是一个特殊的java类,必须实现一个XXXListener接口D、通过重写View中的回调方法来实现需要的响应事件正确答案:ABC5.以下属于CRM主要应用方面的是()。A、客户档案有序管理B、合同管理C、销售报表D、预测销售业绩正确答案:ABCD6.关于Python注释,以下选项中描述正确的是()A、注释可用于标明作者和版权信息B、注释用于解释代码原理或者用途C、注释可以辅助程序调试D、Python注释语句不被解释器过滤掉,也不被执行正确答案:ABC7.正则表达式中常用于表示字符的元字符是A、"."B、"s"C、""D、"w"正确答案:AD8.以下对INSERT语句,说法正确的是()。A、INSERT语句是数据操纵语言中的一条语句B、在使用INSERT语句执行数据插入时,表中的列顺序一定要与提供的值顺序相同C、在使用INSERT语句执行数据插入时,必须为表中所有列定义数据值D、在插入数据时,应当满足表中定义的检查约束正确答案:ABD9.TCP/IP在应用层的协议主要包括()A、ICMPB、FTPC、HTTPD、Telnet正确答案:ACD10.下列哪些是DML语句是()A、INSERTB、ALTERC、UPDATED、DELETE正确答案:ACD11.以下对网站排名有较大影响的因素是()A、Title标签B、Keywords标签C、网站内容D、服务器稳定性正确答案:ACD12.常见的URL分隔符包括()A、*(星)B、$(美元符号)C、_(下划线)D、/(反斜杠)正确答案:CD13.Python中,关于输出函数描述正确的是()A、print()函数的所有参数均可省略B、在输出多个数据时,默认使用空格作为输出分隔符C、可用file参数设置,将数据输出到文件D、print()函数默认以回车换行符号作为输出结尾符正确答案:ABCD14.正则表达式的特点?A、功能性B、灵活性C、逻辑性D、复杂性正确答案:ABC15.以下属于Python保留字的是()A、defB、yieldC、passD、finally正确答案:ABCD16.CRM主要应用于哪些方面()A、客户档案有序管理B、合同管理C、销售报表D、外勤签到E、预测销售业绩正确答案:ABCDE17.以下关于资源命名的规则正确的有:()A、在同一个资源类型的目录中不能存在文件名相同,扩展名不同的资源文件B、资源命名要符合Java变量命名规范C、资源文件名不可使用大写D、同类资源的文件名或变量名不能重复正确答案:ABCD18.以下选项中是操作系统的是()A、DOSB、Windows95C、MSWordD、Redhat正确答案:ABD19.对于日志类型的数据采集,常用的采集工具有A、filebeatB、scrapyC、logstashD、beautifulSoup正确答案:AC20.业务系统中产生的日志数据有哪些作用()A、优化系统性能B、为企业应用系统纠错C、安全管理D、跟踪系统的运行正确答案:ABCD21.关于Python的特点,包括()A、功能强大B、支持面向对象C、具有良好的跨平台特性D、是免费和开源的正确答案:ABCD三、判断题(共37题,每题1分,共37分)1.在网页数据采集过程中,一般需要经过采集、清洗两个步骤。A、正确B、错误正确答案:B2.关键词密度根本不用考虑,只要不堆积就行A、正确B、错误正确答案:B3.假设列表对象aList的值为[3,4,5,6,7,9,11,13,15,17],那么切片aList[3:7]得到的值是[6,7,9,11]A、正确B、错误正确答案:A4.管槽安装的基本要求包括走最短的路由。A、正确B、错误正确答案:B5.优先级是进程调度的重要依据,一旦确定不能改变。A、正确B、错误正确答案:B6.ARP协议可以通过IP地址获取对应主机的物理地址,是网络层协议。A、正确B、错误正确答案:A7.某些情况下,单向通信也能有反方向的交互A、正确B、错误正确答案:B8.在Tomcat中的应用程序一定是一个WAR(WebArchive)文件A、正确B、错误正确答案:B9.Tomcat是Apache软件基金会推出的一个收费的Servlet容器A、正确B、错误正确答案:B10.del命令只可以删除列表中的一个元素,不能删除整个列表。A、正确B、错误正确答案:B11.list(map(str,[1,2,3]))的执行结果为[1],[2],[3]A、正确B、错误正确答案:B12.Requests库请求方法使用时,有一些页面只能通过从另一个页面单击某个链接或者某个按钮以后跳过来,不能直接通过在浏览器输入网址访问,这种网页就要使用GET方式。A、正确B、错误正确答案:B13.网络备份和负载均衡在冗余设计的物理结构上完全一致,但是完成的功能完全不同。A、正确B、错误正确答案:A14.Tomcat作为独立服务器:请求来自于web浏览器A、正确B、错误正确答案:A15.tomcat也叫servlet容器。A、正确B、错误正确答案:A16.静态路由是手工添加,适用于小型网络,动态路由是自动生成路径,适用于大型网络。A、正确B、错误正确答案:A17.Python中,可以利用del命令删除元组中的部分元素。A、正确B、错误正确答案:B18.logstash工具是服务器A、正确B、错误正确答案:B19.在传输层有两个性质不同的协议:TCP和UDP。A、正确B、错误正确答案:A20.Linux系统中有一个文件的文件名为aaa.txt,那么这个文件的扩展名为txt。A、正确B、错误正确答案:B21.在Select语句中查询条件必须有。在Select语句中查询条件必须有A、正确B、错误正确答案:B22.在数据库的概念设计中,最常用的数据模型是实体联系模型A、正确B、错误正确答案:A23.python开发中,list(map(str,[1,2,3]))的执行结果为[1],[2],[3]A、正确B、错误正确答案:B24.x=[1,2,1,1]foriinx[:]:ifi==1:x.remove(i)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论