奥鹏易百

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

帮助中心知识拓展客服QQ 515224986
查看: 800|回复: 0

南开20秋学期《网络爬虫与信息提取》在线作业(题目随机)(2)

[复制链接]

1万

主题

5

回帖

2万

积分

论坛元老

积分
28878
发表于 2020-11-6 09:35:14 | 显示全部楼层 |阅读模式
扫码加微信
[南开大学]20秋学期(1709、1803、1809、1903、1909、2003、2009)《网络爬虫与信息提取》在线作业
试卷总分100得分100
作业QQ 515224986
答案来源www.openhelp100.com
第1题当爬虫创建好了之后可以使用&quotscrapy()&quot命令运行爬虫。
A、startup
B、starwar
C、drawl
D、crawl
正确答案
第2题以下哪个命令是复制文件或者文件夹命令()
A、curl
B、tarzxvf
C、mkdir
D、cp
正确答案
第3题Python中哪种容器一旦生成就不能修改
A、列表
B、元组
C、字典
D、集合
正确答案    答案来源www.openhelp100.com
南开作业QQ 515224986
第4题在Scrapy的目录下哪个文件负责定义需要爬取的数据?()
A、spiders文件夹
B、item.py
C、pipeline.py
D、settings.py
正确答案
使用UIAutomatorr根据坐标来滑动桌面的操作是得到相应控件后使用命令()
A、swipe
B、move
C、scroll
D、fly
正确答案
第6题xpath中extract方法返回值类型是()
A、列表
B、元组
C、字典
D、集合
正确答案
第7题以下哪个命令是linux下解压缩命令()
A、curl
B、tarzxvf
C、mkdir
D、cp
正确答案
第8题Python中定义函数关键字为()
A、def
B、define
C、func
D、function
正确答案
第9题下列说法错误的是()
A、小程序的请求极其简单,基本上没有验证信息
B、用Python来请求小程序的后台接口从而获取数据,比请求异步加载网页的后台接口要复杂很多。
C、如果目标网站有微信小程序,那么一定要优先调查能否通过小程序的接口来抓取数据。
D、小程序的反爬虫能力比网页版的低很多。使用小程序的接口来爬数据,能极大提高爬虫的开发效率。
正确答案
当需要把Python里面的数据发送给网页时应先将其转换成()
A、Json字符串
B、GET
C、POST
D、Request
正确答案
第11题Redis中从集合中查看有多少个值用关键字()
A、scard
B、card
C、count
D、distinct
正确答案
Python中把集合转换为列表需要使用##函数
A、set
B、list
C、convert
D、change
正确答案
第13题lxml库中etree模块的()方法把Selector对象转换为bytes型的源代码数据
A、etree.tostring
B、etree.convertBytes
C、etree.toBytes
D、etree.convertstring
正确答案
第14题Python操作CSV文件可通过()容器的方式操作单元格
A、列表
B、元组
C、字典
D、集合
正确答案
Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题
A、s
B、c
C、d
D、r
正确答案
第16题如果使用Python的数据结构来做类比的话MongoDB中库相当于一个()
A、列表
B、元组
C、字典
D、集合
正确答案
第17题HTTP常用状态码表明服务器正忙的是()
A、500
B、503
C、403
D、404
正确答案
第18题使用xpath方法的返回类型是()
A、列表
B、元组
C、字典
D、集合
正确答案
第19题下面Python代码输出为()
defdefault_para_trap(para=[]value=0)para.append(value)returnparaprint(第一步{}.format(default_para_trap(value=100)))print(第二步{}.format(default_para_trap(value=50)))
A、第一步[100]
第二步[10050]
B、第一步[100]
第二步[50]
C、第一步[100]
第二步[]
D、第一步[100]
第二步[100]
正确答案
下面Python代码输出为()
defdefault_para_without_trap(para=[]value=0)ifnotparapara=[]para.append(value)returnpara
print(第一步{}.format(default_para_trap(value=100)))print(第二步{}.format(default_para_trap(value=50)))
A、第一步[100]
第二步[10050]
B、第一步[100]
第二步[50]
C、第一步[100]
第二步[]
D、第一步[100]
第二步[100]
正确答案
第21题使用Selennium获取网页中元素的方法有
A、find_element_by_name
B、find_element_by_id
C、find_elements_by_name
D、find_elements_by_id
正确答案BCD
第22题下列关于在IOS上配置charles的说法正确的是()
A、不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B、手机和电脑需要在同一个局域网下。
C、HTTP代理可以使用&quot自动&quot选项。
D、安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
正确答案D
第23题Python中有哪些实现多线程方法()
A、multiprocess.dummy
B、threading.Thread
C、process
D、PyMongoDB
正确答案B
第24题Redis中的值可以支持()
A、列表
B、哈希
C、集合
D、有序集合
正确答案BCD
cookies的缺点是
A、实现自动登录
B、跟踪用户状态
C、http中明文传输
D、增加http请求的流量
正确答案D
第26题Python中通过Key来从字典object中读取对应的Value的方法有()
A、object[key]
B、object.get(key)
C、object.pop(key)
D、object.pop()
正确答案B
第27题为了解决爬虫代码本身的错误引起的异常可以采用下列哪些方法
A、仔细检查代码
B、开发爬虫中间件
C、开发下载器中间件
D、等待
正确答案B
第28题Python中()与元组由类似的数据读取方式
A、字符串
B、列表
C、字典
D、集合
正确答案B
第29题HTTP常用状态码表明请求被正常处理的有()
A、200
B、301
C、302
D、204
正确答案D
PyMongo更新操作有()
A、update
B、update_all
C、update_one
D、update_many
正确答案D
第31题在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致因为这样才能隐藏好自己达到获取数据的目的
T、对
F、错
正确答案F
第32题如果目标网站本身就是提供公众查询服务的网站那么使用爬虫是合法合规的。
T、对
F、错
第33题Redis中使用lrange读取数据后数据也会删除
T、对
F、错
正确答案
第34题Redis插入数据都是插入到列表右侧因此读取数据也是从右侧读取
T、对
F、错
正确答案F
第35题如果通过爬虫抓取某公司网站的公开数据分析以后发现这个公司业绩非常好于是买入该公司股票并赚了一笔钱。这是合法的。
T、对
F、错
第36题HTTP状态码中303状态码明确表示客户端应当采用POST方法获取资源
T、对
F、错
正确答案F
第37题process_spider_output(responseresultoutput)是在下载器中间件处理完成后马上要进入某个回调函数parse_xxx()前调用
T、对
F、错
正确答案F
第38题通用搜索引擎的目标是尽可能大的网络覆盖率搜索引擎服务器资源与网络数据资源互相匹配
T、对
F、错
正确答案F
第39题在使用多线程处理问题时线程池设置越大越好
T、对
F、错
正确答案F
第40题需要登录的网站一般通过GET请求就可以实现登录。
T、对
F、错
正确答案F
第41题process_spider_input(responsespider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用
T、对
F、错
正确答案F
第42题Python中函数返回值的个数可以是多个
T、对
F、错
正确答案
第43题爬虫的源代码通过公开不会对被爬虫网站造成影响
T、对
F、错
正确答案F
第44题通用网络爬虫通常采用串行工作方式
T、对
F、错
正确答案F
第45题虽然MongoDB相比于MySQL来说速度快了很多但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
T、对
F、错
第46题爬虫中间件的激活需要另外写一个文件来进行
T、对
F、错
正确答案F
第47题在Linux的终端使用aptget命令安装一系列依赖库时其中如果存在有已经安装的库会覆盖掉之前的库重新安装
T、对
F、错
正确答案F
第48题Redis中查询列表长度命令llen中l代表left即从左侧开始数
T、对
F、错
正确答案
第49题Charles能截获HTTP和HTTPS的数据包如果网站使用websocket就可以截获。
T、对
F、错
正确答案F
mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本
T、对
F、错

答案来源www.openhelp100.com
QQ 515224986
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|www.openhelp100.com ( 冀ICP备19026749号-1 )

GMT+8, 2024-11-24 16:47

Powered by openhelp100 X3.5

Copyright © 2001-2024 5u.studio.

快速回复 返回顶部 返回列表