版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据采集1+x初级练习题库(含参考答案)一、单选题(共41题,每题1分,共41分)1.哪个表达式用来选取当前节点?A、..B、.C、/D、@正确答案:B2.将一个使用GBK编码的字节序列解码为字符串格式,应使用的方法是A、encode("utf-8")B、decode("utf-8")C、encode("gbk")D、decode("gbk")正确答案:D3.基本的Python内置函数eval(x)的作用是()A、将x转换成浮点数B、去掉字符串x最外侧引号,当作Python表达式评估返回其值C、计算字符串x作为Python语句的值D、将整数x转换为十六进制字符串正确答案:B4.删除用户账号命令是()A、DROPUSERB、DROPTABLEUSERC、DELETEUSERD、DELETEFROMUSER正确答案:A5.jQuery中被誉为工厂函数的是()A、$()B、function()C、ready()D、以上都不对正确答案:A6.httpd的MPM特性中的三种工作方式为()A、preforks、worker、eventB、prefork、worker、eventC、preforks、worker、threadD、preforks、worker、正确答案:B7.CSS技术中盒子模型的()属性设置边框和内部元素之间的距离的属性。A、borderB、paddingC、backgroundD、margin正确答案:B8.哪个表达式用来从根节点选取?A、..B、.C、/D、@正确答案:C9.以下不属于数据采集工具的是()A、MySQLB、八爪鱼采集器C、FlumeD、Filebeat正确答案:A10.Scrapy中,用于封装数据的类是A、ItemB、SpiderC、settingsD、pipline正确答案:A11.关于UTF-8编码,以下描述错误的是A、可以用来表示Unicode标准中的任何字符B、用1个字节表示一个英文字符C、3个字节表示一个中文汉字D、是一种定长的字符编码正确答案:C12.Python源程序执行的方式()A、解析执行B、编译执行C、直接执行D、边编译边执行正确答案:A13.网络层以上的中继系统是()A、网桥B、转发器C、网关D、路由器正确答案:C14.使用xpath,选取属于body子节点下的最后一个div节点的表达式为()A、/html/body/div[last()]B、/html/body/div[first()]C、/html/body/div[positon()=first()]D、/html/body/div[positon()=last()]正确答案:A15.如果在一个关系中,存在某个属性(或属性组),虽然不是该关系的主键或只是主键的一部分,但却是另一个关系的主键时,称该属性(或属性组)为这个关系的A、外键B、主键C、连接键D、候选键正确答案:A16.Elasticsearch使用什么语言开发A、CB、.NetC、HTMLD、Java正确答案:D17.以下聚合函数求平均数的是()A、COUNTB、MAXC、AVGD、SUM正确答案:C18.TCP/IP协议将整个通信功能划分为四个层次,处于最底层的是()A、数据链路层B、网络接口层C、物理层D、网络层正确答案:B19.()不是用来查询、添加、修改和删除数据库中数据的语句A、SELECTB、INSERTC、UPDATED、DROP正确答案:D20.以下CSS中,不属于font属性的是()A、font-sizeB、font-weightC、sizeD、font-style正确答案:C21.Apache服务器是实现()网络协议的服务器。A、FTPB、DHCPC、HTTPDD、HTTP正确答案:D22.CSS中通过哪个属性设定元素的背景图像()A、imageB、background-imageC、background-positionD、background-attachment正确答案:B23.以下不是修改表操作的是()A、droptableuser;B、altertableuseraddremarkvarchar(20);C、altertableuserdropremark;D、altertableusercharactersetutf8;正确答案:A24.以下哪一项与网站优化关键词排名无关()A、网站开发语言B、网站程序复杂度C、网站域名D、网站空间稳定性正确答案:A25.关于数据采集特点,描述正确的是()A、只采集基本数据B、主要进行抽样采集方式C、采集的数据内容相对单一D、数据采集以自动化采集手段为主要方式正确答案:D26.如果需要在数据表中删除一个字段,其语法为()。A、deletefrom表名where条件;B、altertable表名drop字段名;C、altertable表名modify字段名新数据类型;D、deletefrom表名字段名;正确答案:B27.HTTP协议是A、网络层协议B、应用层协议C、会话层协议D、传输层协议正确答案:B28.以下BeautifulSoup4的描述中,错误的是A、BeautifulSoup可以进行html文档的解析,但不能实现对网页的抓取B、默认使用的是标准库解析器C、使用lxmlHTML解析器对文档的纠错能力强,但解析速度较慢D、自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。正确答案:C29.以下属于网页文本数据的是()A、HTMLB、PNGC、MPEG-1D、JPG正确答案:A30.Tomcat的默认端口是()。A、80B、8089C、8080D、7070正确答案:C31.网页前端设计中,()语言作用是浏览器端组织和显示网页信息(文本、图片、视频等)。A、CSSB、JavaScriptC、HTMLD、JSP正确答案:C32.()是通过爬虫程序监测某网站数据更新的情况,以便可以爬取到该网站更新的新数据,对于未发生内容变化的网页,则不会爬取。A、通用网络爬虫B、増量式网络爬虫C、深层页面爬虫D、聚焦网络爬虫正确答案:B33.Apache服务器运行后会生成两个日志文件,其中,()是记录Web服务器的所有访问活动的文件。A、error_log(错误日志)B、/usr/local/tomcat/logsC、access_log(访问日志)D、logs正确答案:C34.使用Xpath获取一篇HTML文档中所有超链接的href属性,Xpath代码为()。A、/a/@hrefB、//@hrefC、/a/hrefD、//a/@href正确答案:D35.关于数据采集的描述不正确的是()A、数据采集不在于掌握庞大的的数据信息,而在于对数据的智能处理,挖掘出有价值的信息B、数据采集来源广泛,类型也丰富多样,很看重数据处理的高效性和实时性C、数据采集,要注重数据质量和数据采集性能提升,为数据的准确分析打下基础D、以上描述都不正确正确答案:D36.向数据表中插入一条记录用以下哪一项A、CREATEB、INSERTC、SAVED、UPDATE正确答案:B37.自由软件的含义是()A、软件可以自由修改和发布B、软件发行商不能向用户收费C、用户不需要付费D、只有软件作者才能向用户收费正确答案:A38.层次型、网状型和关系型数据库划分原则是()A、联系的复杂程度B、记录长度C、文件的大小D、数据之间的联系正确答案:D39.Shell程序的注释符为()。A、@B、!C、%D、#正确答案:D40.OSI参考模型共划分为7层,从下到上依次为()。A、物理层、数据链路层、传输层、会话层、网络层、表示层和应用层B、物理层、网络层、传输层、会话层、数据链路层、表示层和应用层C、物理层、数据链路层、网络层、传输层、表示层、应用层和会话层D、物理层、数据链路层、网络层、传输层、会话层、表示层和应用层正确答案:D41.计算机网络的OSI参考模型共划分为7层,其中处于最底层或第一层的是A、会话层B、数据链路层C、传输层D、物理层正确答案:D二、多选题(共21题,每题1分,共21分)1.关于insert语句下列说法正确的有()A、insertinto表名(字段名1,字段名2)values(字段名1对应的值,字段名2对应值);B、insertinto表名values(字段名1对应的值,字段名2对应值);C、insertinto表名values(字段名1对应的值);D、insertinto表名(字段名1)value(字段名1对应的值);正确答案:AB2.关于socket编程,对于服务端编程的主要步骤包括()A、打开socketB、监听客户端连接C、绑定到一个地址和端口D、读写数据正确答案:ABCD3.以下对网站排名有较大影响的因素是()A、服务器稳定性B、Title标签C、Keywords标签D、网站内容正确答案:ABD4.计算机网络的拓扑结构就是用网络的站点与连接线的几何关系来表示网络的结构,以下为拓扑结构类型的是()。A、环型B、总线型C、星型D、树型E、网状型正确答案:ABCDE5.元素type属性取值可以为()A、buttonB、radioC、imageD、password正确答案:ABCD6.从采集数据的类型看,数据的类型是复杂多样的,包括以下哪些类型()。A、结构化B、全结构化C、半结构化D、非结构化正确答案:ACD7.以下,属于Python语言应用领域的包括()A、科学计算B、爬虫开发C、自动化运维D、Web开发正确答案:ABCD8.以下关于scrapy框架的描述,正确的有()A、Scrapy是一个开放源码的协作框架B、Scrapy是用纯Python编写的C、scrapy框架包含的python包中不包括lxmlD、scrapy框架是一种快速、简单、可扩展的方式从网站中提取所需要的数据正确答案:ABD9.关于Python类,说法正确的是()A、类的实例方法必须创建对象后才可以调用B、类的实例方法必须创建对象前才可以调用C、类的类方法可以用对象和类名来调用D、类的静态属性可以用类名和对象来调用正确答案:ACD10.对于日志类型的数据采集,常用的采集工具有A、beautifulSoupB、scrapyC、filebeatD、logstash正确答案:CD11.正则表达式可以用下列哪种方式匹配正整数?A、^[1-9]*[1-9][0-9]*$B、^[0-9]*[1-9][0-9]*$C、^[a-zA-Z]w{7.10}$D、都可以正确答案:AB12.下面哪个不是Python合法的标识符()A、3selfB、int32C、__name__D、40XL正确答案:AD13.以下属于Windows事件日志中的事件类型的是()A、错误事件B、失败审核事件C、警告事件D、信息事件E、成功审核事件正确答案:ABCDE14.进程的基本状态有()。A、就绪态B、运行态C、阻塞态D、停止态正确答案:ABC15.以下哪几项是设计手机用户界面时应注意的问题A、界面设计与程序逻辑的分离B、能够合理利用较小的屏幕显示空间,构造出符合人机交互规律的用户界面C、根据不同型号手机的屏幕解析度、尺寸和纵横比各不相同,自动调整界面上部分控件的位置和尺寸,避免因为屏幕信息的变化而出现显示错误D、设计风格保持一致正确答案:ABCD16.以下关于资源命名的规则正确的有:()A、同类资源的文件名或变量名不能重复B、资源命名要符合Java变量命名规范C、资源文件名不可使用大写D、在同一个资源类型的目录中不能存在文件名相同,扩展名不同的资源文件正确答案:ABCD17.以下CSS中,属于font属性的是()。A、font-sizeB、font-weightC、sizeD、font-style正确答案:ABD18.以下哪些是Python的保留字和关键字()。A、classB、importC、GlobalD、Def正确答案:AB19.常见的URL分隔符包括()A、$(美元符号)B、/(反斜杠)C、_(下划线)D、*(星)正确答案:BC20.在CSS3里可以使用以下()方法,将样式表的功能加到网页里。A、定义标记的style属性B、定义内部样式C、嵌入外部样式表D、链接外部样式表正确答案:ABCD21.ELK由_(1)_._(2)_._(3)_三个开源工具组成()。A、LogstashB、KibanaC、LogflowD、ElasticSearch正确答案:ABD三、判断题(共37题,每题1分,共37分)1.vi命令模式中a是从光标所在位置后面开始新增内容。A、正确B、错误正确答案:A2.单向通信,只能有一个方向的通信而没有反方向的交互A、正确B、错误正确答案:A3.type()函数是可以查看变量类型的Python内置函数A、正确B、错误正确答案:A4.若要撤销数据库中已经存在的表S,可用DROPTABLESA、正确B、错误正确答案:A5.SLF4J不是一个真正的日志实现,而是一个抽象层,它允许你在后台使用任意一个日志类库。A、正确B、错误正确答案:A6.网络传输介质只可以是有形的,不可以是无形的A、正确B、错误正确答案:B7.删除表用droptable关键字A、正确B、错误正确答案:A8.网页中一个id可以用很多次A、正确B、错误正确答案:B9.决定局域网特性的主要技术是传输介质、拓扑结构和介质访问控制方法,其中最重要的是传输介质A、正确B、错误正确答案:B10.Python语言语句块的标记分号A、正确B、错误正确答案:B11.删除表中数据使用delete关键字A、正确B、错误正确答案:A12.事务的结束并提交能使用rollback命令A、正确B、错误正确答案:B13.xpath中,使用@符号表示属性A、正确B、错误正确答案:A14.JavaScript中标识符首字母不能为数字A、正确B、错误正确答案:A15.堆叠是用专用的端口把交换机连接起来,当作一个交换机使用。A、正确B、错误正确答案:A16.列表和元组类似,都是可变的A、正确B、错误正确答案:B17.避免产生错误的方法就是在符号之前加上一个斜杠,构成转义字符。A、正确B、错误正确答案:B18.连接各建筑物之间的传输介质和各种支持设备(硬件)组成一个建筑群综合布线系统。A、正确B、错误正确答案:A19.ARP协议可以通过IP地址获取对应主机的物理地址,是网络层协议。A、正确B、错误正确答案:A20.Robots协议全称是“网络爬虫排除标准”,网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。A、正确B、错误正确答案:A21.企业业务系统是解决企业的外部问题,与解决企业内部问题的组织系统相辅相成。A、正确B、错误正确答案:A22.Linux中终止进程的命令可以用kill。A、正确B、错误正确答案:A23.存储设备通过通用网络连接到网络设备上.主要应用于中小型网络的存储技术是NAS。A、正确B、错误正确答案:A24.Linux操作系统的命令名必须是小写英文字母。A、正确B、错误正确答案:A25.公开钥用于解密,私钥用来加密。A
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度木材原材料供应与加工合作框架合同4篇
- 2025年度祠堂修缮与维护承包服务合同4篇
- 2025版打印机租赁及耗材供应合同范本3篇
- 2025年度二零二五年度存量房买卖居间合同绿色建筑认证服务2025版4篇
- 二零二五年度船舶货运合同船舶燃油供应合同范本4篇
- 二零二四年度展览展示设计与施工后期维护保养合同3篇
- 2025年度厂房租赁押金托管服务合同4篇
- 2025年度木材行业节能减排技术研发合同范本4篇
- 二零二五智能交通设施代理采购合同范本4篇
- 二零二五版特色主题酒店承包经营合同规范范本3篇
- 山东铁投集团招聘笔试冲刺题2025
- 真需求-打开商业世界的万能钥匙
- 2025年天津市政集团公司招聘笔试参考题库含答案解析
- GB/T 44953-2024雷电灾害调查技术规范
- 2024-2025学年度第一学期三年级语文寒假作业第三天
- 心律失常介入治疗
- 6S精益实战手册
- 展会场馆保洁管理服务方案
- 监理从业水平培训课件
- 广东省惠州市实验中学2025届物理高二第一学期期末综合测试试题含解析
- 搞笑朗诵我爱上班台词
评论
0/150
提交评论