南开大学22年春学期《网络爬虫技术》在线作业_第1页
南开大学22年春学期《网络爬虫技术》在线作业_第2页
免费预览已结束,剩余11页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-本页为预览页PAGE13-本页为预览页-本页为预览页22春学期(高起本1709-1803、全层次1809-2103)网络爬虫技术在线作业-00001第1题. 在Scrapy的目录下,哪个文件负责定义需要爬取的数据?()选项A:spiders文件夹选项B:item.py选项C:pipeline.py选项D:settings.py参考答案:B第2题. Python中Object=obj_1:1,obj_2:2,则Objcet是()选项A:列表选项B:元组选项C:字典选项D:集合参考答案:C第3题. BS5的find()方法返回是一个()选项A:集合选项B:列表选项C:Tag选项D:元组参考答案:

2、C第4题. Python中正则表达式数量词表示匹配前一个字符1或无限次的是()选项A:*选项B:+选项C:?选项D:m参考答案:B第5题. 在电脑中,通过打开命令提示符,输入python,界面出现提示符()就表明进入了Python交互式环境选项A:选项B:选项C:选项D:参考答案:A第6题. Python中for循环表达式for item in iterable:do里item表示元素,iterable是()选项A:表达式选项B:结果选项C:循环选项D:集合参考答案:D第7题. Python中以下语句结果为()a = Ilovepythonprint(a0)选项A:I选项B:l选项C:n选项D

3、:Ilovepython参考答案:A第8题. 使用Xpath构造相同字符串开头的路径采用()方法选项A:starts-with选项B:starts选项C:begin选项D:begin-with参考答案:A第9题. 下面Python代码输出为():def default_para_trap(para=, value=0):para.append(value)return paraprint(第一步:.format(default_para_trap(value=100)print(第二步:.format(default_para_trap(value=50)选项A:第一步:100第二步:100,

4、50选项B:第一步:100第二步:50选项C:第一步:100第二步:选项D:第一步:100第二步:100参考答案:A第10题. BS6的find_all()方法返回是一个()选项A:集合选项B:列表选项C:Tag选项D:元组参考答案:A第11题. 用Xpathh获取第二个div标签应该是()选项A:dvi(1)选项B:div(2)选项C:div1选项D:div2参考答案:D第12题. Python中将字符串a,b相加的方法是()选项A:a.add(b)选项B:a.plus(b)选项C:a.append(b)选项D:a+b参考答案:D第13题. Python正则表达式模块的findall方法提取

5、内容包含多个,则返回结果的列表中会包含()选项A:列表选项B:元组选项C:字典选项D:集合参考答案:B第14题. Python中的()库用于发送网络请求选项A:web选项B:request选项C:requests选项D:javascript参考答案:C第15题. BeautifulSoup库使用唯一支持XML解析器的使用方法是()选项A:BeautifulSoup(markup,html.parser)选项B:BeautifulSoup(markup,lxml)选项C:BeautifulSoup(markup,xml)选项D:BeautifulSoup(markup,html5lib)参考答案

6、:C第16题. Pyhon中()方法可以将一个字符串分割为一个列表选项A:aplit选项B:replace选项C:strip选项D:format参考答案:A第17题. 浏览器用来记录用户状态信息的数据叫()选项A:session选项B:cookies选项C:moonpies选项D:selenium参考答案:B第18题. 以下哪个HTML标签表示定义 HTML 表格中的标准单元格()选项A:选项B:选项C:选项D:参考答案:D第19题. Python中正则表达式为字符集的是()选项A:.选项B:选项C:/选项D:.参考答案:D第20题. requests获取get或者post请求后需要通过()属

7、性获取文本内容选项A:content选项B:text选项C:string选项D:body参考答案:A第21题. BS4可以用来从()中提取数据选项A:HTML选项B:XML选项C:数据库选项D:JSON参考答案:A,B第22题. 使用Selenium获取单个元素的方法有()选项A:find_element_by_id选项B:find_element_by_name选项C:find_element_by_xpath选项D:find_elements_by_tag_name参考答案:A,B,C第23题. Selenium的Webdriver支持的浏览器有()选项A:phantomjs选项B:saf

8、ari选项C:chrome选项D:ie参考答案:A,B,C,D第24题. Scrapy爬虫框架依赖第三方库有()选项A:lxml选项B:BS4选项C:pywin32选项D:twisted参考答案:A,C,D第25题. 网络爬虫的用途有()选项A:收集数据选项B:尽职调查选项C:提高流量选项D:攻击服务器参考答案:A,B,C第26题. 最常见的HTTP请求类型有()选项A:GET选项B:POST选项C:SEND选项D:RECEIVE参考答案:A,B第27题. PyMongo删除操作有()选项A:delete选项B:delete_all选项C:delete_one选项D:delete_many参考

9、答案:C,D第28题. Selenium和PhantomJS的配合使用可以完全模拟用户在浏览器上的操作有()选项A:输入框内容填写选项B:单击选项C:截屏选项D:下滑参考答案:A,B,C,D第29题. Python中一个函数可以有()个return语句选项A:0选项B:1选项C:多个选项D:2参考答案:A,B,C,D第30题. Python中哪种容器生成后可以修改内容选项A:列表选项B:元组选项C:字典选项D:集合参考答案:A,C,D第31题. 同一时刻每个CPU只会执行一个进程,然后在不同进程间快速切换,选项A:对选项B:错参考答案:A第32题. Xpath中string(.)可以用于提取标

10、签嵌套标签的内容。选项A:对选项B:错参考答案:A第33题. Python中正则表达式边界匹配A表示仅匹配字符串开头选项A:对选项B:错参考答案:A第34题. Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。选项A:对选项B:错参考答案:A第35题. Python中条件语句在使用and连接的多个表达式中,只要有一个表达式不为真,那么后面的表达式就不会执行。选项A:对选项B:错参考答案:A第36题. PyMongoDB中排序方法sort第二个参数1表示降序选项A:对选项B:错参考答案:B第37题. Python中re模块的修饰符re.L表示多

11、行匹配,影响 和 $选项A:对选项B:错参考答案:B第38题. 如果需要安装某个特定版本的Python,可以在终端中输入:sudo install python3.5选项A:对选项B:错参考答案:B第39题. Python中写CSV文件的writerows方法参数为字典类型选项A:对选项B:错参考答案:B第40题. 键值数据库、关系数据库都属于NoSQL选项A:对选项B:错参考答案:B第41题. selenium使用driver.get()方法请求过后的网页源代码中有异步加载的信息选项A:对选项B:错参考答案:A第42题. cookies在http请求中是明文传输的。选项A:对选项B:错参考答案:A第43题. 已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行选项A:对选项B:错参考答案:B第44题. Python中re模块的修饰符re.S表示使匹配包括换行在内的所有字符选项A:对选项B:错参考答案:A第45题. 图形数据库,如Graph属于NoSQL选项A:对选项B:错参考答案:A第46题. 需要登录的网站一般通过GET请求就可以实现登录。选项A:对选项B:错参考答案:B第47题. Xpah中下面例子user元素是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论