数据采集1+x初级模拟习题(附答案)_第1页
数据采集1+x初级模拟习题(附答案)_第2页
数据采集1+x初级模拟习题(附答案)_第3页
数据采集1+x初级模拟习题(附答案)_第4页
数据采集1+x初级模拟习题(附答案)_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级模拟习题(附答案)一、单选题(共41题,每题1分,共41分)1.()又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据。A、通用网络爬虫B、增量式网络爬虫C、聚焦网络爬虫D、深层页面爬虫正确答案:A2.在MySQL中,创建完数据表之后,如果需要查看该表是否已经成功创建,可以在指定的数据库中使用()命令查看表。A、showtables;B、selecttable;C、showtable;D、updatetable;正确答案:A3.以下属于传输层协议的是()。A、FTPB、TCPC、HTTPD、IP正确答案:B4.运算符“|”表示什么?A、返回拥有俩元素的节点集B、取元素节点的交集C、返回所有拥有俩元素的节点集D、以上都不对正确答案:C5.XPath于1999年11月16日成为()标准?A、W3CB、XMLC、ROMCATD、以上都不对正确答案:A6.Apache的主配置文件路径为()A、httpd/conf/httpd.confB、/etc/httpd/conf/httpd.confC、conf/httpd.confD、conf正确答案:B7.数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作的数据库语言称为()A、数据定义语言(DDL)B、数据管理语言C、数据操纵语言(DML)D、数据控制语言正确答案:C8.Tomcat容器运行的界面为()。A、jspB、cC、aspD、php正确答案:A9.HTML中能够定义表单提交位置的属性是A、actionB、nameC、titleD、method正确答案:A10.以下选项中,不是Python语言特点的是()A、面向对象:Python具有多态、运算符重载、继承和多重继承等面向对象编程的主要特征B、变量声明:Python语言具有使用变量需要先定义后使用的特点C、强制可读:Python语言通过强制缩进来体现语句间的逻辑关系D、平台无关:Python程序可以在任何安装了解释器的操作系统环境中执行正确答案:B11.启动Apache服务命令为()。A、ServicehttpdstartB、ServicestartC、ServiceHttpstartD、Httpdstart正确答案:A12.ELK技术栈中,用于展示数据的技术是()A、ElasticsearchB、KibanaC、EchartD、Logstash正确答案:B13.关于Python语言的注释,以下选项中描述错误的是A、Python语言的多行注释以’’'(三个单引号)开头和结尾B、Python语言有两种注释方式:单行注释和多行注释C、Python语言的单行注释以#开头D、Python语言的单行注释以单引号’开头正确答案:D14.以下数据中,非结构化数据不包括()A、图像B、日志文件C、图片D、音频正确答案:B15.如果需要在数据表中删除一个字段,其语法为()。A、deletefrom表名字段名;B、deletefrom表名where条件;C、altertable表名drop字段名;D、altertable表名modify字段名新数据类型;正确答案:C16.创建链接文件的命令为A、linkfileB、hardlinkC、softlinkD、ln正确答案:D17.用以表示网页服务器超文本传输协议响应状态的3位数字代码,通常称之为HTTP状态码,其中表示请求成功的是()A、404B、500C、200D、201正确答案:C18.下列语句中查询姓李的学生的语句是()。A、select*from表名where姓名like‘李%’B、select*from表名where姓名like‘李’C、select*from表名where姓名=‘李’D、select*from表名where姓名like‘%李%’正确答案:A19.使用urllib库的方法获取到Response类型的对象后,想改变其编码格式时需要修改此对象的哪个属性()A、encodingB、utf-8C、codingD、text正确答案:A20.未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使用用户个人信息属于()方面的行为A、自然人的个人信息受法律保护B、明确数据信息收集的政府责任C、规范数据信息收集的方式与要求D、限定数据信息收集的对象与范围正确答案:D21.向数据表中插入一条记录用以下哪一项A、CREATEB、INSERTC、SAVED、UPDATE正确答案:B22.盒子模型具备的属性有几个()A、1B、3C、4D、2正确答案:C23.关于数据采集特点,描述正确的是()A、只采集基本数据B、采集的数据内容相对单一C、数据采集以自动化采集手段为主要方式D、主要进行抽样采集方式正确答案:C24.IPV6的地址长度为多少位()A、64B、32C、128D、48正确答案:C25.TCP/IP协议将整个通信功能划分为四个层次,处于最底层的是()A、数据链路层B、网络接口层C、物理层D、网络层正确答案:B26.如果要在python中只用正则表达式,则需要引入哪个模块A、xmlB、etreeC、lxmlD、re正确答案:D27.Scrapy中,用于对Item进行清理、验证,并定义其输出的是A、piplineB、ItemC、settingsD、Spider正确答案:A28.Apache服务器运行后会生成两个日志文件,访问日志是哪个文件()A、access_logsB、access_logC、error_logD、errors_log正确答案:B29.()不是用来查询、添加、修改和删除数据库中数据的语句A、SELECTB、INSERTC、UPDATED、DROP正确答案:D30.FTP的主要特点不包括()。A、只提供文件传送的一些基本的服务B、可减少或消除在不同操作系统下处理文件的不兼容性C、使用客户服务器方式,可同时为多个客户进程提供服务D、使用UDP的运输服务正确答案:D31.使用scrapy的命令创建的scrapy项目中,哪个程序是用于封装爬取数据的,类似于Java中的JavaBean对象A、middle.pyB、init.pyC、items.pyD、scrapy.cfg正确答案:C32.在所有正则表达式的元字符中,以下哪个元字符表示一位数字A、空白B、dC、.D、*正确答案:B33.关于Python的lambda函数,以下选项中描述错误的是()A、f=lambdax.y:x+y执行后,f的类型为数字类型B、lambda函数将函数名作为函数结果返回C、可以使用lambda函数定义列表的排序原则D、lambda用于定义简单的、能够在一行内表示的函数正确答案:A34.服务器端响应状态码中,表示“NOTFOUND未找到”的是A、302B、404C、304D、200正确答案:B35.Python源程序执行的方式()A、解析执行B、边编译边执行C、直接执行D、编译执行正确答案:A36.以下CSS中,不属于font属性的是()A、font-sizeB、font-weightC、sizeD、font-style正确答案:C37.以下不是修改表操作的是()A、altertableuserdropremark;B、altertableuseraddremarkvarchar(20);C、droptableuser;D、altertableusercharactersetutf8;正确答案:C38.创建数据库使用以下哪项()A、createmytestB、createdatabasemytestC、createtablemytestD、databasemytest正确答案:B39.重新启动Apache服务命令为()A、ServicehttpdrestartB、ServicerestartC、ServiceHttprestartD、Httpdrestart正确答案:A40.Python中,以下何者是不合法的布尔表达式?()A、3=aB、e>5and4==fC、xinrange(6)D、(x-6)>5正确答案:A41.元字符()匹配字符串的结尾?A、^B、\bC、\BD、$正确答案:D二、多选题(共21题,每题1分,共21分)1.计算机网络的拓扑结构就是用网络的站点与连接线的几何关系来表示网络的结构,以下为拓扑结构类型的是()。A、网状型B、总线型C、树型D、环型E、星型正确答案:ABCDE2.进程的基本状态有()。A、就绪态B、阻塞态C、运行态D、停止态正确答案:ABC3.scrapy框架包含的几个关键python包有A、ParselB、lxmlC、w3libD、twisted正确答案:ABCD4.下列哪些列类型是数值型的数据()A、DOUBLEB、INTC、SETD、FLOAT正确答案:ABD5.下列说法正确的是()A、自然人的个人信息受法律保护B、网络运营者未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外C、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使用用户个人信息D、国家网信部门应当统筹协调有关部门加强网络安全信息收集、分析和通报工作,按照规定统一发布网络安全监测预警信息正确答案:ABCD6.根据《中华人民共和国网络安全法》,下列说法不正确的是()A、网络产品、服务具有收集用户信息功能的,其提供者不需要向用户明示B、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度C、国家不允许网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作D、为了获得更多有利数据,可以侵入他人网络、干扰他人网络正常功能、窃取网络数据正确答案:ACD7.下列哪些可以匹配英文和汉字?A、^[A-Za-z0-9]+$B、[A-Za-z0-9]+$C、^[A-Za-z0-9]{4.40}$D、^[A-Za-z0-9]{4.40}正确答案:AC8.Python中,关于输出函数描述正确的是()A、print()函数的所有参数均可省略B、在输出多个数据时,默认使用空格作为输出分隔符C、可用file参数设置,将数据输出到文件D、print()函数默认以回车换行符号作为输出结尾符正确答案:ABCD9.根据数据所属主体不同,以下属于数据采集范畴的是()A、数据库采集B、系统日志采集C、感知设备数据采集D、网络数据采集正确答案:ABCD10.ER模型中实体之间的关系有()A、1:m:nB、1:1C、1:nD、m:n正确答案:BCD11.CRM主要应用于哪些方面()A、客户档案有序管理B、合同管理C、销售报表D、外勤签到E、预测销售业绩正确答案:ABCDE12.根据网页内容获取方式不同.可以将网页分为()。A、标记型网页B、静态页面C、专业型网页D、动态页面正确答案:BD13.linux中安装软件可使用命令()。A、setupB、rpmC、源代码安装D、yuminstall正确答案:BCD14.在Xpath中,元素节点可以有()个。A、0B、1C、多个D、以上都不对正确答案:ABC15.以下属于JavaScript核心对象的是()A、String对象B、Math对象C、Array对象D、Date对象正确答案:ABCD16.以下哪几项是Android平台的特性()A、允许重用和替换组件的应用程序框架B、专门为移动设备优化的Dalvik虚拟机C、支持数据结构化存储的SQLiteD、支持摄像头、GPS、指南针和加速计等外围设备正确答案:ABCD17.TCP/IP在应用层的协议主要包括()A、ICMPB、FTPC、HTTPD、Telnet正确答案:ACD18.Python中函数是对象,描述正确的是()A、函数可以赋值给一个变量B、函数可以作为元素添加到集合对象中C、函数可以作为参数值传递给其他函数D、函数可以当作函数的返回值正确答案:ABCD19.Python中,关于list和tuple描述正确的是()A、列表的数据项不需要具有相同的类型B、列表是可变的C、元组的元素不能修改D、元组的不可变指的是元组所指向的内存中的内容不可变正确答案:ABCD20.关系型数据库中,查询语句中,必不可少的关键字是()A、joinB、fromC、selectD、where正确答案:BC21.对于日志类型的数据采集,常用的采集工具有A、filebeatB、beautifulSoupC、logstashD、scrapy正确答案:AC三、判断题(共37题,每题1分,共37分)1.DESC命令可以列出表结构A、正确B、错误正确答案:A2.查看变量内存地址的Python内置函数是id()A、正确B、错误正确答案:A3.堆叠是用专用的端口把交换机连接起来,当作一个交换机使用。A、正确B、错误正确答案:A4.子类初始化时需要首先初始化父类的属性,初始化父类的语句是super().__init__()A、正确B、错误正确答案:A5.ERP是从BPP发展而来的新一代集成化管理信息系统。A、正确B、错误正确答案:B6.select语句的orderby参数用于指定查询结果集的排序方式,默认为降序。A、正确B、错误正确答案:B7.JavaScript语言不区分大小写,Name与name代表相同的标识符A、正确B、错误正确答案:B8.shell中case结构化语句必须以esac作为语句的结束。A、正确B、错误正确答案:A9.一级域名又称顶级域名,域名一般由域名关键词和域名类别两部分组成,中间用点分隔开。A、正确B、错误正确答案:A10.Scrapy框架的运行流程中,DownLoader组件一般情况下不起作用A、正确B、错误正确答案:B11.访问某个网站,可以直接通过域名或服务的URL进行访问A、正确B、错误正确答案:A12.数据采集,是利用一种装置或程序从系统外部采集数据并输入到系统内部的一个接口A、正确B、错误正确答案:A13.在Select语句中查询条件必须有。在Select语句中查询条件必须有A、正确B、错误正确答案:B14.Requests库请求方法使用时,有一些页面只能通过从另一个页面单击某个链接或者某个按钮以后跳过来,不能直接通过在浏览器输入网址访问,这种网页就要使用GET方式。A、正确B、错误正确答案:B15.Android系统除非不能保证前台进程或可视进程所必要的资源,否则不强行清除服务进程。A、正确B、错误正确答案:A16.ls-a可以起到查询当前目录并显示隐藏文件的作用。A、正确B、错误正确答案:A17.Linux操作系统中usermod命令为新增用户命令。A、正确B、错误正确答案:B18.Tomcat作为一个轻量级的Web服务器,能够发布web程序。A、正确B、错误正确答案:A19.在数据库中,允许空值的字段上定义主键约束。A、正确B、错误正确答案:B20.ARP协议可以通过IP地址获取对应主机的物理地址,是网络层协议。A、正确B、错误正确答案:A21.select语句的groupby参数用于指定将查询结果根据什么字段进行分组。A、正确B、错误正确答案:A22.DELETE语句用来删除表中的数据,一次只能删除一行。A、正确B、错误正确答案:B23.正则表达式的主要应用对象是文本,因此在所有文本编辑器都有应用。A、正确B、错误正确答案:B24.使用关键字with时,open()返回的文件对象只在with代码块内可用。如果要在with代码块外访问文件的内容,可在with代码块内将文件的各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论