奥鹏作业答案 发表于 2022-1-26 13:18:24

南开21秋学期《网络爬虫与信息提取》在线作业(随机题目)

21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息提取》在线作业
试卷总分100得分100
南开大学2021年秋季学期在线作业
第1题Python中线程池map()方法第二个参数是()
A、列表
B、元组
C、字典
D、集合
正确答案
第2题通过()爬取伪装成异步加载的后端渲染数据
A、正则表达式
B、Json字符串
C、JavaScript
D、Get
正确答案
第3题下面Python代码输出为()
defdefault_para_without_trap(para=[]value=0)ifnotparapara=[]para.append(value)returnpara
print(第一步{}.format(default_para_trap(value=100)))print(第二步{}.format(default_para_trap(value=50)))
A、第一步
第二步
B、第一步
第二步
C、第一步
第二步[]
D、第一步
第二步
正确答案
第4题Python中若定义object=(12345)则print(object)输出()
A、12
B、123
C、23
D、234
正确答案
在Scrapy的目录下哪个文件负责数据抓取以后的处理工作?()
A、spiders文件夹
B、item.py
C、pipeline.py
D、settings.py
正确答案
第6题浏览器用来记录用户状态信息的数据叫
A、session
B、cookies
C、moonpies    奥鹏在线作业
D、selenium
正确答案
第7题PyMongo中查询所有age29的记录是()
A、collection.find({age{$gt29}})
B、collection.find({age29})
C、collection.find_all({age{$gt29}})
D、collection.find_all({age29})
正确答案
第8题Redis中往集合中添加数据使用关键字()
A、sadd
B、add
C、append
D、sappend
正确答案
第9题Redis中如果不删除列表中的数据又要把数据读出来就需要使用关键字()
A、range
B、lrange
C、srange
D、pop
正确答案
在Python中为了使用XPath需要安装一个第三方库()
A、lxml
B、xml
C、xpath
D、path
正确答案
第11题Python操作CSV文件可通过()容器的方式操作单元格
A、列表
B、元组
C、字典
D、集合
正确答案
某些网站在发起Ajax请求时会携带()字符串用于身份验证
A、Token
B、Cookie
C、ReqTime
D、sum
正确答案
第13题PyMongo中逻辑查询表示不等于的符号是()
A、$gt
B、$lt
C、$eq
D、$ne
正确答案
第14题下列说法错误的是()
A、Charles只能截获HTTP和HTTPS的数据包,如果网站使用的是websocket或者是flashsocket,那么Charles就无能为力。
B、有一些App会自带证书,使用其他证书都无法正常访问后台接口。在这种情况下,Charles自带的证书就不能正常使用,也就没有办法抓取这种App的数据
C、有一些App的数据经过加密,App接收到数据以后在其内部进行解密。Charles无法获取这种App的数据
D、对于上述情况,Charles能抓取到经过加密的数据。但是如果无法知道数据的具体加密方法,就没有办法解读Charles抓取到的数据。
正确答案
使用Xpath获取文本使用()
A、text
B、text()
C、content
D、content()
正确答案
第16题启动MongoDB使用命令mongod()usr/local/etc/mongod.conf
A、config
B、install
C、start
D、begin
正确答案
第17题Redis中查看一个列表长度使用关键字()
A、len
B、length
C、llen
D、count
正确答案
第18题Python中若定义object=12345则print(object)输出()
A、1
B、5
C、54321
D、程序报错
正确答案
第19题在Scrapy的目录下哪个文件负责存放爬虫的各种配置信息?()
A、spiders文件夹
B、item.py
C、pipeline.py
D、settings.py
正确答案
当爬虫运行到yieldscrapy.Request()或者yielditem的时候下列哪个爬虫中间件的方法被调用?
A、process_spider_output()
B、process_spider_exception()
C、process_spider_input()
D、process_start_requests()
正确答案
第21题在配置ios使用Charles的操作中正确的有()
A、对于苹果设备,首先要保证计算机和苹果设备联在同一个WiFi上。
B、选择HTTP代理下面的手动选项卡,在服务器处输入计算机的IP地址,在端口处输入8888
C、输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
D、安装完成证书以后,在设置中打开关于本机,找到最下面的证书信任设置,并在里面启动对Charles证书的完全信任
正确答案BCD
第22题下载器中间件的作用有哪些?
A、更换代理IP
B、更换Cookies
C、更换UserAgent
D、自动重试
正确答案BCD
第23题下列关于在IOS上配置charles的说法正确的是()
A、不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B、手机和电脑需要在同一个局域网下。
C、HTTP代理可以使用自动选项。
D、安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
正确答案D
第24题如果爬虫爬取的是商业网站并且目标网站使用了反爬虫机制那么强行突破反爬虫机制可能构成()
A、非法侵入计算机系统罪
B、非法获取计算机信息系统数据罪
C、非法获取计算机数据罪
D、非法获取系统罪
正确答案B
Python中一个函数没有返回值则可以写()
A、没有return
B、return
C、returnNone
D、returnNULL
正确答案BC
第26题使用BeautifulSoup对象后可以使用()来查找内容
A、find_all
B、find
C、search
D、search_all
正确答案B
第27题PyMongo删除操作有()
A、delete
B、delete_all
C、delete_one
D、delete_many
正确答案D
第28题以下哪些方法属于Python写CSV文件的方法()
A、writeheaders
B、writeheader
C、writerrows
D、writerow
正确答案CD
第29题MongoDB中获取名字为db的库的语句为()
A、client.db
B、client(db)
C、client
D、client{db}
正确答案C
Python中()容器有推导式
A、列表
B、元组
C、字典
D、集合
正确答案CD
第31题中间人攻击也是抓包的一种。
T、对
F、错
正确答案F
第32题在请求头中设置UserAgent即可正常请求网站
T、对
F、错
正确答案F
第33题UIAutomatorViewer与Pythonuiautomator可以同时使用
T、对
F、错
正确答案F
第34题device.sleep()方法是使用UIAutomatorr关闭屏幕的命令
T、对
F、错
第35题爬虫的源代码通过公开不会对被爬虫网站造成影响
T、对
F、错
正确答案F
第36题虽然MongoDB相比于MySQL来说速度快了很多但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
T、对
F、错
第37题打码平台都是靠机器使用OCR技术识别图片上的文字。
T、对
F、错
正确答案F
第38题Python中包含字典的列表页可以转换成JSON字符串
T、对
F、错
第39题需要实名认证的打码网站更加安全可靠。
T、对
F、错
正确答案F
第40题MongoDBURI的格式为
mongodb//服务器IP或域名端口@用户名密码
T、对
F、错
正确答案F
第41题MongoDB中ObjectId可以反向恢复为时间
T、对
F、错
第42题验证码必须通过手动填充识别。
T、对
F、错
正确答案F
第43题使用UIAutomatorr操作实体键的命令为device.press.实体按键名称()
T、对
F、错
第44题在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redisserver文件启动redis服务
src/redisserver
T、对
F、错
正确答案F
第45题开源库pytesseract的作用是将图像中文字转换为文本。
T、对
F、错
第46题Redis的集合与Python的集合一样没有顺序值不重复
T、对
F、错
第47题mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本
T、对
F、错
第48题process_spider_input(responsespider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用
T、对
F、错
正确答案F
第49题上课传纸条。A要把纸条传给B但是A与B距离太远于是让C来转交纸条。此时C先篡改纸条的内容再传给B这是一种类似抓包的方式。
T、对
F、错
正确答案F
在安装Scarpy的依赖库时由于VisualC++BuildTools的安装速度很慢为了节省时间可以和安装Twisted同时进行
T、对
F、错
正确答案F

本内容由易百教育整理发布
页: [1]
查看完整版本: 南开21秋学期《网络爬虫与信息提取》在线作业(随机题目)