项目一测试
1.下列不属于常见爬虫类型的是( )。
A:增量式网络爬虫 B:通用网络爬虫 C:聚焦网络爬虫 D:浅层网络爬虫
答案:D
2.下列不属于聚焦网络爬虫的常用策略的是( )。
A:基于链接结构评价的爬取策略 B:基于语境图的爬取策略 C:基于深度优先的爬取策略 D:基于内容评价的爬取策略
答案:C
3.下列不属于常用反爬手段的是( )。
A:验证码校验 B:账号权限 C:人工筛选 D:反爬频度
答案:C
4.下列属于反爬虫目的的是( )。
A:变换网页结构 B:限制用户访问权限 C:防止网站信息被竞争对手随意获取 D:限制访问人数
答案:C
5.下列属关于Python爬虫库的功能描述不正确的是( )。
A:爬虫框架 Scrapy B:通用爬虫库urllib3 C:HTML/XML解析器pycurl` D:通用爬虫库 Requests
答案:C
6.搜索引擎使用了网络爬虫不停地从互联网抓取网站数据,并将网站镜像保存在本地。( )
A:错 B:对
答案:B
7.robots.txt文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着的是可以爬虫的网页。( )
A:对 B:错
答案:B
8.爬虫是手动请求万维网网站且提取网页数据的程序。( )
A:错 B:对
答案:A
9.每个网站都有robots.txt文件。( )
A:错 B:对
答案:A
10.爬虫爬取的是网站后台的数据。( )
A:错 B:对
答案:A

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(8) dxwkbang
返回
顶部