奥鹏易百

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

帮助中心知识拓展客服QQ 515224986
查看: 379|回复: 0

南开大学20春学期《网络爬虫与信息提取》在线作业1(随机)

[复制链接]

1万

主题

5

回帖

2万

积分

论坛元老

积分
28878
发表于 2020-4-18 20:56:42 | 显示全部楼层 |阅读模式
扫码加微信
【奥鹏】[南开大学(本部)]20春学期(1709、1803、1809、1903、1909、2003)《网络爬虫与信息提取》在线作业
试卷总分100得分100

奥鹏在线作业
联系QQ 515224986
第1题Python正则表达式模块的findall方法提取内容包含多个则返回结果的列表中会包含()
A、列表
B、元组
C、字典
D、集合
正确答案
第2题以下表示请求正常处理的HTTP状态码为
A、200
B、301
C、404
D、500
正确答案
第3题Python中线程池map()方法第二个参数是()
A、列表
B、元组
C、字典
D、集合
正确答案
第4题()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。
A、meta
B、head
C、header
D、body    南开
奥鹏作业联系QQ 515224986
正确答案
第5题如果使用Python的数据结构来做类比的话MongoDB中集合相当于一个()
A、列表
B、元组
C、字典
D、集合
正确答案
第6题PyMongo中逻辑查询表示不等于的符号是()
A、$gt
B、$lt
C、$eq
D、$ne
正确答案
第7题PyMongo中逻辑查询表示大于等于的符号是()
A、$gt
B、$lt
C、$gte
D、$lte
正确答案
第8题以下哪个HTML标签表示定义文档的主体()
A、div
B、body
C、head
D、footer
正确答案
第9题某些网站在发起Ajax请求时会携带()字符串用于身份验证
A、Token
B、Cookie
C、ReqTime
D、sum
正确答案
第10题下面Python代码输出为()
defdefault_para_trap(para=[]value=0)para.append(value)returnparaprint(第一步{}.format(default_para_trap(value=100)))print(第二步{}.format(default_para_trap(value=50)))
A、第一步[100]
第二步[10050]
B、第一步[100]
第二步[50]
C、第一步[100]
第二步[]
D、第一步[100]
第二步[100]
正确答案
第11题用Xpathh获取第二个div标签应该是()
A、dvi(1)
B、div(2)
C、div[1]
D、div[2]
正确答案
第12题查看网站请求一般在Chrome开发者模式下的()选项卡中查看
A、Console
B、Sources
C、Network
D、Performance
正确答案
第13题Python中Object={obj_11obj_22}则Objcet.get(boj_13)是()
A、1
B、2
C、3
D、无输出
正确答案
第14题通常使用()工具来模拟浏览器进行爬虫请求
A、Selenium
B、Chrome
C、ChromeDriver
D、WebDriver
正确答案
第15题Python并导入uiautomator来操作设备的语句是fromuiautomatorimport()
A、Device
B、Devices
C、Jobs
D、Job
正确答案
第16题Python中把列表转换为集合需要使用##函数
A、set
B、list
C、convert
D、change
正确答案
第17题Python中若定义object=&quot12345&quot则print(object[1])输出()
A、1
B、5
C、54321
D、程序报错
正确答案
第18题Python正则表达式模块的findall方法如果没有匹配到结果则返回结果为()
A、空
B、空列表
C、空元组
D、不返回
正确答案
第19题以下哪个命令是利用URL语法在命令行下工作的文件传输工具()
A、curl
B、tarzxvf
C、mkdir
D、cp
正确答案
第20题使用UIAutomatorr输入文字的操作是得到相应控件后使用命令()
A、settext
B、set
C、set_text
D、text
正确答案
第21题HTTP常用状态码表明表明客户端是发生错误的原因所在的有()
A、403
B、404
C、500
D、503
正确答案
第22题Python中()容器有推导式
A、列表
B、元组
C、字典
D、集合
正确答案
第23题Python中通过Key来从字典object中读取对应的Value的方法有()
A、object[key]
B、object.get(key)
C、object.pop(key)
D、object.pop()
正确答案
第24题PyMongo更新操作有()
A、update
B、update_all
C、update_one
D、update_many
正确答案
第25题HTTP常用状态码表明表明服务器本身发生错误的有()
A、403
B、404
C、500
D、503
正确答案
第26题以下哪些可以独立成为Python编译器()
A、Pycharm
B、IDLE
C、Eclipse
D、VisualStudio2010
正确答案
第27题requests中post请求方法的第二个参数可以为()
A、字典
B、列表
C、json数据
D、字符串
正确答案
第28题MongoDB中获取名字为set1的集合的语句为()
A、database.set1
B、database(set1)
C、database[set1]
D、database{set1}
正确答案
第29题最常见的HTTP请求类型有()
A、GET
B、POST
C、SEND
D、RECEIVE
正确答案
第30题PyMongo删除操作有()
A、delete
B、delete_all
C、delete_one
D、delete_many
正确答案
第31题在请求头中设置UserAgent即可正常请求网站
T、对
F、错
正确答案
第32题一般来说在页面都通过GET将用户登录信息传递到服务器端。
T、对
F、错
正确答案
第33题Scrapy作为一个爬虫的框架它在单机环境下运行时就可以获得最大性能优势
T、对
F、错
正确答案
第34题当运行爬虫代码后出现&quotForbiddenbyrobots.txt&quot提示后说明当前时间段被爬取的网站无法访问。
T、对
F、错
正确答案
第35题使用UIAutomatorr操作实体键的命令为device.press.实体按键名称()
T、对
F、错
正确答案
第36题爬虫中间件的作用对象是请求request和返回response
T、对
F、错
正确答案
第37题Redis中列表读取数据命令lrange中l代表left即从左侧开始读取
T、对
F、错
正确答案
第38题运行MongoDB以后不会在终端打印任何Log
T、对
F、错
正确答案
第39题Selenium必须加载对应的webdriver才能模拟浏览器访问
T、对
F、错
正确答案
第40题Robo3T与RoboMongo是完全不一样的软件
T、对
F、错
正确答案
第41题在中间人攻击中攻击者可以拦截通信双方的通话并插入新的内容或者修改原有内容
T、对
F、错
正确答案
第42题使用Charles可以轻松截获手机App和微信小程序的数据包从而开发出直接抓取App后台和小程序后台的爬虫。
T、对
F、错
正确答案
第43题要实现Charles对Android抓包其过程比iOS稍微复杂一点。这是因为不同的Andorid设备安装证书的入口可能不一样
T、对
F、错
正确答案
第44题Python中包含字典的列表页可以转换成JSON字符串
T、对
F、错
正确答案
第45题MongoDBURI的格式为
mongodb//服务器IP或域名端口@用户名密码
T、对
F、错
正确答案
第46题Python中字符串切片以后的结果还是字符串
T、对
F、错
正确答案
第47题微信小程序的反爬虫能力要比网页的高很多。
T、对
F、错
正确答案
第48题cookies在http请求中是明文传输的。
T、对
F、错
正确答案
第49题默认情况下MongoDB可以通过外网访问
T、对
F、错
正确答案
第50题Python中列表生成以后还可以往里面继续添加数据也可以从里面删除数据
T、对
F、错
正确答案

南开大学
奥鹏作业联系QQ 515224986
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|www.openhelp100.com ( 冀ICP备19026749号-1 )

GMT+8, 2024-11-25 09:58

Powered by openhelp100 X3.5

Copyright © 2001-2024 5u.studio.

快速回复 返回顶部 返回列表