数据采集1+x初级模拟试题含参考答案_第1页
数据采集1+x初级模拟试题含参考答案_第2页
数据采集1+x初级模拟试题含参考答案_第3页
数据采集1+x初级模拟试题含参考答案_第4页
数据采集1+x初级模拟试题含参考答案_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级模拟试题含参考答案一、单选题(共40题,每题1分,共40分)1、属于应用层协议的是()A、FTPB、IPC、TCPD、UDP正确答案:A2、以下BeautifulSoup4的描述中,错误的是A、默认使用的是标准库解析器B、自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。C、使用lxmlHTML解析器对文档的纠错能力强,但解析速度较慢D、BeautifulSoup可以进行html文档的解析,但不能实现对网页的抓取正确答案:C3、Apache服务器运行后会生成两个日志文件,其中,()是记录Web服务器的所有访问活动的文件。A、error_log(错误日志)B、access_log(访问日志)C、/usr/local/tomcat/logsD、logs正确答案:B4、元字符()匹配字符串的结尾?A、\BB、$C、^D、\b正确答案:B5、关于Python的lambda函数,以下选项中描述错误的是()A、f=lambdax.y:x+y执行后,f的类型为数字类型B、可以使用lambda函数定义列表的排序原则C、lambda函数将函数名作为函数结果返回D、lambda用于定义简单的、能够在一行内表示的函数正确答案:A6、httpd采用()模块化设计方法A、core+modulesB、core+moduleC、coreD、modules正确答案:A7、数据定义语言的缩写词为()A、DBLB、DDLC、DCLD、DML正确答案:B8、哪个符号匹配0次或者1次?A、?B、+C、。D、*正确答案:A9、查找表结构用以下哪一项A、FINDB、ALTERC、SELETED、DESC正确答案:D10、执行后可以查看Python的版本的是()(A)A、importsystemprint(system.version)B、importsysprint(sys.Version)C、importsysprint(sys.version)D、importsystemprint(system.Version)正确答案:C11、取出html页面中body下的所有子标签A、/body/*B、/body*C、/body/@*D、//*正确答案:A12、HTML中用于标记表格的标签是()A、<frame>B、<form>C、<tab>D、<table>正确答案:D13、下面哪种方式是普通用户进入网站的方式A、直接打网址B、收藏夹C、百度首页D、导航类网站正确答案:D14、Python中,下列标识符中哪个是合法的?()A、_B、3QC、i'mD、for正确答案:A15、以下HTTP的head消息“content-type”的格式正确的是A、html/text;charset=utf-8B、text/html;charset=utf-8C、text/html;encoding="gbk"D、text/html.encoding=utf-8正确答案:B16、半结构数据,是介于结构化数据与非结构化之间的数据,下面不属于半结构化数据的是()A、XMLB、MPEG-1C、HTMLD、JSON正确答案:B17、如果需要在数据表中删除一个字段,其语法为()。A、deletefrom表名字段名;B、altertable表名drop字段名;C、deletefrom表名where条件;D、altertable表名modify字段名新数据类型;正确答案:B18、数据库结构的描述和定义是DBMS运行的基本依据,它们存储于()A、封锁表B、数据字典C、日志D、索引正确答案:B19、()是通过爬虫程序监测某网站数据更新的情况,以便可以爬取到该网站更新的新数据,对于未发生内容变化的网页,则不会爬取。A、通用网络爬虫B、聚焦网络爬虫C、増量式网络爬虫D、深层页面爬虫正确答案:C20、日志优先级别不包括()A、TRACEB、NORMALC、INFOD、DEBUG正确答案:B21、Java应用系统中常用的日志框架不包括()A、Log4jB、loguruC、Log4j2D、Logback正确答案:B22、jQuery中被誉为工厂函数的是()A、以上都不对B、ready()C、function()D、$()正确答案:D23、选择html页面上所有class属性为“cls”的div标签,Xpath代码为()。A、//div[class='cls']B、//div[@class='cls']C、/div[@class='cls']D、//div[@class=cls]正确答案:B24、/etc/shadow文件中存放()A、用户组信息B、用户账号基本信息C、文件系统信息D、用户口令的加密信息正确答案:D25、以下中间件,用于进行数据采集的工具为()A、javaB、filebeatC、apacheD、tomcat正确答案:B26、关于HTTP的head消息“connection:keep-alive”,以下描述正确的是A、能够一直保持与服务器之间的连接B、只能在每个HTTP连接中进行一次请求和响应C、仅适用于HTTP/1.1D、可以在每个HTTP连接中进行多次次请求和响应正确答案:D27、Scrapy中,用于运行项目中的爬虫的命令是()。A、crawlB、genspiderC、以上全是D、runspider正确答案:A28、以下哪种设备实现数据链路层的互联()A、中继器B、网管C、路由D、网桥正确答案:D29、关于“user-agent”(用户代理)的描述错误的是A、所有发布Web请求的应用程序都是HTTPAgent代理B、网络爬虫只是一段程序,并不是代理C、Web浏览器也是一种HTTPAgent代理D、代表用户发起HTTP请求的客户端程序正确答案:B30、用于将事务处理写到数据库的命令是()A、savepointB、commitC、rollbackD、insert正确答案:B31、关于Python的数字类型,以下选项中描述错误的是()A、浮点数也有十进制、二进制、八进制和十六进制等表示方式B、复数类型虚部为0时,表示为1+0jC、1.0是浮点数,不是整数D、整数类型的数值一定不会出现小数点正确答案:A32、哪个符号匹配一次或者多次前面的字符?A、.B、+C、?D、*正确答案:B33、使用scrapy的()命令可以创建一个scrapy项目A、startprojectB、generatescrapyC、runspiderD、genspider正确答案:A34、数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作的数据库语言称为()A、数据管理语言B、数据操纵语言(DML)C、数据控制语言D、数据定义语言(DDL)正确答案:B35、在OSI的七层参考模型中,工作在第二层上的网间连接设备是()A、网关B、集线器C、交换机D、路由器正确答案:C36、random库中,用于生成随机小数的函数是()A、random()B、randrange()C、getrandbits()D、randint()正确答案:A37、HTTP协议基于A、ARPB、TCPC、SNMPD、UDP正确答案:B38、在操作系统中,多个进程请求相同资源而引起的无休止的相互等待的过程叫做()A、阻塞B、中断C、死锁D、挂起正确答案:C39、CSS中通过哪个属性设定元素的背景颜色()。A、back-colorB、background-colorC、background-imageD、bg-color正确答案:B40、下列哪些属于()规范数据信息收集的方式与要求A、发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营者予以更正B、自然人的个人信息受法律保护C、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度D、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使用用户个人信息正确答案:B二、多选题(共20题,每题1分,共20分)1、元素节点可有()个子?A、都不对B、一个C、零个D、多个正确答案:BCD2、元素type属性取值可以为()A、passwordB、buttonC、imageD、radio正确答案:ABCD3、Python中,下面属于合法语句的包括()A、a+=bB、a.b=b.aC、a=(b=c+1)D、a=b=c=1正确答案:ABD4、根据《中华人民共和国网络安全法》,下列说法不正确的是()A、网络产品、服务具有收集用户信息功能的,其提供者不需要向用户明示B、为了获得更多有利数据,可以侵入他人网络、干扰他人网络正常功能、窃取网络数据C、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度D、国家不允许网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作正确答案:ABD5、正则表达式中的“?”表示的含义是A、匹配前面的子表达式零次或一次。B、匹配前面的子表达式一次或多次。C、当该字符紧跟在任何一个其他限制符(*.+.?.{n}.{n.}.{n.m})后面时,匹配模式是非贪婪的。D、当该字符紧跟在任何一个其他限制符(*.+.?.{n}.{n.}.{n.m})后面时,匹配模式是贪婪的。正确答案:AC6、下列哪些函数属于聚合函数()A、max()B、sum()C、count()D、str()正确答案:ABC7、以下选项中,()是Python语言的特点。A、变量声明:Python语言具有使用变量需要先定义后使用的特点B、平台无关:Python程序可以在任何安装了解释器的操作系统环境中执行C、强制可读:Python语言通过强制缩进来体现语句间的逻辑关系D、面向对象:Python具有多态、运算符重载、继承和多重继承等面向对象编程的主要特征正确答案:BCD8、关系型数据库中,查询语句中,必不可少的关键字是()A、selectB、whereC、fromD、join正确答案:AC9、常见的URL分隔符包括()A、*(星)B、/(反斜杠)C、_(下划线)D、$(美元符号)正确答案:BC10、Scrapy架构中,中间件包括()A、DownloaderMiddlewaresB、SpiderMiddlewaresC、PipelineMiddlewaresD、SchedulerMiddlewares正确答案:AB11、以下对INSERT语句,说法正确的是()。A、在使用INSERT语句执行数据插入时,表中的列顺序一定要与提供的值顺序相同B、在使用INSERT语句执行数据插入时,必须为表中所有列定义数据值C、在插入数据时,应当满足表中定义的检查约束D、INSERT语句是数据操纵语言中的一条语句正确答案:ACD12、正则表达式的特点?A、逻辑性B、功能性C、灵活性D、复杂性正确答案:ABC13、万维网的主要特点是()A、采用C/S模式B、使用HTML语言C、使用超文本技术D、不够方便灵活,功能强大正确答案:BC14、AndroidEmulator有如下限制A、不支持拨打或接听真实电话B、不支持USB连接C、不支持SD卡D、不支持蓝牙正确答案:ABD15、scrapy框架包含的几个关键python包有A、twistedB、w3libC、lxmlD、Parsel正确答案:ABCD16、以下关于索引的说法正确的是()。A、可以加快数据的检索速度B、索引不需要花费代价占用存储空间就可以实现检索速度的提高C、可以加快表与表之间的连接D、唯一性索引可以保证数据记录的唯一性正确答案:ACD17、ELK由_(1)_._(2)_._(3)_三个开源工具组成()。A、ElasticSearchB、LogstashC、KibanaD、Logflow正确答案:ABC18、以下属于数据采集范畴的是()。A、数据库数据B、容器日志数据C、互联网应用数据D、业务系统日志数据正确答案:ABCD19、python提供了哪些技术用于获取网页数据A、BeautifulSoup库B、Urllib模块C、lxml库D、Requests模块正确答案:AD20、计算机网络的拓扑结构就是用网络的站点与连接线的几何关系来表示网络的结构,以下为拓扑结构类型的是()。A、星型B、树型C、总线型D、网状型E、环型正确答案:ABCDE三、判断题(共30题,每题1分,共30分)1、系统处于不安全状态时一定发生了死锁。A、正确B、错误正确答案:B2、电信业务经营者、互联网信息服务提供者不得收集其提供服务所必需以外的用户个人信息或者将信息用于提供服务之外的目的,不得以欺骗、误导或者强迫等方式或者违反法律、行政法规以及双方的约定收集、使用信息A、正确B、错误正确答案:A3、允许空值的字段上可以定义主键约束A、正确B、错误正确答案:B4、在TCP/IP网络中,每一台主机必须有一个IP地址。A、正确B、错误正确答案:A5、在SELECT语句查询中,要去掉查询结果中的重复记录,可以使用DISTINCT关键字A、正确B、错误正确答案:A6、解决死锁的一种方法是先让它发生,然后再处理它。A、正确B、错误正确答案:A7、Python程序的运行方式有两种:交互式和文件式。文件式指Python解释器逐行接收Python代码并即时响应;交互式也称批量式,指先将Python代码保存,再启动Python解释器批量解释代码。A、正确B、错误正确答案:B8、IIS(asp容器)不是web容器A、正确B、错误正确答案:B9、一般认为,关键词密度在10%-20%左右为适宜,不要刻意追求关键字的堆积,否则触发关键字堆砌过滤器A、正确B、错误正确答案:B10、经常使用filebeat和logstash完成日志数据的采集A、正确B、错误正确答案:A11、在数据库的概念设计中,最常用的数据模型是实体联系模型A、正确B、错误正确答案:A12、python源程序执行的方式是直接执行A、正确B、错误正确答案:B13、连入Internet必须使用的网络协议时TCP/IPA、正确B、错误正确答案:A14、数据业务对时延抖动不敏感,如果路由器需要支持语音、视频等业务,这个指标才有测试的必要性。A、正确B、错误正确答案:B15、可以通过修改Apache的httpd.conf中的LogFormat修改Apache的日志格式A、正确B、错误正确答案:A16、request:响应模块,用来处理客户端发送请求的服务器响应。A、正确B、错误正确答案:B17、给出range(1,10,3)的值:[1,4,7]A、正确B、错误正确答案:A18、print()函数可同时输出一个或多个数据,在输出多个数据时,默

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论