《爬虫课程》练习题库01-选择题_第1页
《爬虫课程》练习题库01-选择题_第2页
《爬虫课程》练习题库01-选择题_第3页
《爬虫课程》练习题库01-选择题_第4页
《爬虫课程》练习题库01-选择题_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《爬虫课程》练习题库01-选择题基本信息:[矩阵文本题]*年级专业:________________________学号:________________________姓名:________________________1、下列不属于常见爬虫类型的是()。[单选题]*A、浅层网络爬虫(正确答案)B、聚焦网络爬虫C、增量式网络爬虫D、通用网络爬虫2、下列哪项不属于解析网页的库?()[单选题]*A、lxmlB、beautifulsoup4C、正则表达式D、requests(正确答案)3、通过设置HTTP请求的哪个参数可以实现伪装成浏览器访问网页?()[单选题]*A、paramsB、dataC、headers(正确答案)D、timeout4、下列哪个函数可以实现合并URL?()[单选题]*A、urlpase()B、urlencode()C、urljoin()(正确答案)D、quote()5、下列不属于Response对象属性的是()。[单选题]*A、contentB、txt(正确答案)C、textD、encoding6、下列不属于HTML标签的是()。[单选题]*A、href(正确答案)B、headC、aD、li7、lxml库中选取属性的语法是()。[单选题]*A、@(正确答案)B、.C、*D、//8、能够在字符串“aabaaabaaaab”中匹配“aab”,而不能匹配“aaab”和“aaaab”的正则表达式为()。[单选题]*A、a{1,3}bB、aa??b(正确答案)C、aaa??bD、a*?b9、beautifulsoup4库中遍历整个HTML文件,按照条件返回所有匹配的节点元素的方法是()[单选题]*A、find()B、select()C、find_all()(正确答案)D、search()10、下列关于XPath描述错误的是()。[单选题]*A、text()方法可提取节点的文本内容B、text()方法可用于选取包含指定文本内容的节点C、contains()方法可用于选取以特定值开头的节点(正确答案)D、and可用于选取同时包含两种指定值的节点11、下列关于beutiflsoup4中Tag对象描述错误的是().[单选题]*A、string属性可获取Tag对象中的文本字符串内容B、attrs属性可获取Tag对象的HTML属性,返回值为列表形式(正确答案)C、contents属性可获取Tag对象子标签的内容D、name属性可获取Tag对象的名称12、下列关于json库中dumps()方法描述错误的是()。[单选题]*A、设置indent参数为2时,输出时缩进2个字符B、如果需要输出中文字符,设置ensure_ascii参数为FalseC、dumps()方法可将JSON对象写入文件内(正确答案)D、dumps()方法可生成一个字符串13、逆向分析请求页面和取动态加载数据时选择Network面板的哪个选项查看JavaScript加载的文件?()[单选题]*A、CSSB、DocC、XHR(正确答案)D、Media14、Seleniumn中浏览器对象通过下列哪个属性或方法获取HTML源代码?()[单选题]*A、textB、currenturlC、tagnameD、page_source(正确答案)15、通过设置HTTP请求的哪个参数可以实现使用代理IP访问网页?()[单选题]*A、headersB、proxies(正确答案)C、paramsD、data16、下列Selenium库的方法中,不能通过节点属性进行多元素定位的是()。[单选题]*A、find_element_by_name()(正确答案)B、find_elements_by_class_name()C、find_elements_by_name()D、find_elements_by_id()17、HTTP响应状态码中表示访问成功的是()。[单选题]*A、200(正确答案)B、501C、503D、40418、以下选项中哪一个不是正则表达式的元字符().[单选题]*A、$B、@(正确答案)C、^D、*19、switch_to.frame()的作用是()[单选题]*A、切换到另一个浏览器B、切换到另一个框架(正确答案)C、切换到另一个标签页D、切换到windows系统桌面20、Selenium中提供了多种元素定位方法,但不包括以下选项中的()[单选题]*A、find_element_by_id()B、find_element_by_xpath()C、find_elementby_page()(正确答案)D、find_elementby_class_name()21、使用selenium模块打开谷歌浏览器,以下选项中正确的是()[单选题]*A、webdriver.GoogleB、webdriver.Google()C、webdriver.ChromeD、webdriver.Chrome()(正确答案)22、Requests模块中,headers参数的作用是()。[单选题]*A、输入网址B、模拟浏览器(正确答案)C、提供ip代理D、设置超时时间23、以下正则表达式中,属于非贪婪匹配,且允许出现0次的是()[单选题]*A、.B、.*C、.*?(正确答案)D、.+?24、正则表达式R[0-9]{3},能匹配出以下哪个字符串()[单选题]*A、R3B、R03C、R09D、R093(正确答案)25、下列哪项不属于爬取网页的库?()[单选题]*A、lxml(正确答案)B、requestsC、seleniumD、urllib26、下列不属于selenium库模拟浏览器操作的方法是()。[单选题]*A、forward()B、click()(正确答案)C、maximize_window()D、minimize_window()27、下列哪个函数可以实现判断网页是否可以爬取?()[单选题]*A、read()B、detect()C、set_url()D、can_fetch()(正确答案)28、MongoDB数据库默认端口号是()。[单选题]*A、27017(正确答案)B、1521C、8888D、330629、MySQL数据库默认端口号是()。[单选题]*A、8888B、27017C、3306(正确答案)D、637930、下列哪个函数可以实现不同模式图像之间的转换。()[单选题]*A、show()B、convert()(正确答案)C、open()D、save()31、,使用selenium中的方法定位该标签,以下选项中正确的是()。[单选题]*A、find_element_by_id("wrapper")(正确答案)B、find_element_by_id("wrapper_new")C、find_element_by_class("wrapper_new")D、以上都可以32、关于open函数的操作模式,以下选项中哪一种既可以读也可以写()。[单选题]*A、aB、wC、a+(正确答案)D、wb33、下列哪项表示禁止爬取ABC文件夹下的文件?()[单选题]*A、Disallow:/ABC/(正确答案)B、Disallow:/ABCC、Disallow:/*?ABC*D、Disallow:/ABC/*.htm34、下列哪个函数可以检测字符的编码类型?()[单选题]*A、decode()B、encode()C、detect()(正确答案)D、Request()35、下列Tag对象的哪个属性返回标签包含的属性?()[单选题]*A、nameB、contentsC、attrs(正确答案)D、string36、pymongo库中实现插入数据的方法是()。[单选题]*A、find_one()B、insert_one()(正确答案)C、sort()D、delete_one()37、HTTP状态码中表示访问成功的是()。[单选题]*A、200(正确答案)B、501C、503D、40438、以下选项中哪一个不是正则表达式的元字符()。[单选题]*A、$B、@(正确答案)C、^D、*39、下列关于urllib库的说法错误的是()。[单选题]*A、是一个Python的标准库B、由三个模块组成(正确答案)C、urllib.error模块是异常处理模块D、urllib.parse模块是用来解析URL的40、下列关于urlopen()函数的说法错误的是()[单选题]*A、data参数是可选的B、可以用于对目标URL的访问C、设置data参数时,以POST方式发送请求D、不设置data参数时,以POST方式发送请求(正确答案)41、下列关于Requests库的说法错误的是()[单选题]*A、是一个Python标准库(正确答案)B、能够发送HTTP请求C、能够抓取二进制数据D、能够发送HTTP请求头42、下列关于lxml库的说法正确的是()[单选题]*A、lxml是一个网络库B、lxml是一款高性能的HTML/XML解析库(正确答案)C、仅支持利用XPath来选取节点D、lxml是一个Python的标准库43、下列关于XPath的语法说法错误的是()[单选题]*A、‘/’选取当前节点的直接子节点B、‘@’选取属性C、‘..’选取父节点D、‘//’选取当前节点的子节点(正确答案)44、下列说法错误的是()[单选题]*A、‘//*’选取整个HTML所有的节点B、‘//li/a’选取<li>节点下的所有<a>节点C、XPath不能做多属性过滤(正确答案)D、XPath中的索引是从1开始的45、下列关于XPath中功能函数描述错误的是()[单选题]*A、contains()方法可用于选取以指定值开头的节点(正确答案)B、and()方法可用于选取同时包含两种指定值的节点C、text()函数可用于选取包含指定文本内容的节点D、text()函数可提取节点文本内容46、在MySQL数据库中,下列说法错误的是()[单选题]*A、使用showdatabase命令显示所有数据库(正确答案)B、使用update命名修改数据C、使用delete命名删除数据D、使用insertinto命名插入数据47、下列关于Chrome开发者工具描述错误的是()[单选题]*A、元素面板可查看元素在页面的对应位置B、源代码面板可查看HTML源码C、网络面板无法查看HTML源码(正确答案)D、网络面板可查看HTTP头部信息48、下列关于BeautifulSoup中对象类型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论