第二章测试
1.下列选项哪不是爬虫程序的常见类型( )。
A:聚焦网络爬虫 B:增量式网络爬虫 C:深层式网络爬虫 D:通用网络爬虫
答案:C
2.以下关于实现网络爬虫程序的描述中,错误的是( )。
A:通过Python编写网络爬虫程序,本质上是模拟人类浏览网页的行为 B:通过爬虫程序获取的数据文件均为HTML文件 C:网络爬虫是自动获取互联网上公开数据的程序 D:编写爬虫程序前,可以使用浏览器自带的开发者工具,对我们发出的请求和接受到的响应进行分析 3.通过浏览器访问网站服务器的过程,描述错误的是( )。
A:HTTP协议规范了请求与响应的过程 B:参与对象包:括浏览器、域名解析服务器、网站服务器 C:TCP协议规范了超文本标记语言的语法格式 D:互联网上公开数据的地址是由URL协议规范 4.下列不属于常用反爬虫手段的是( )。
A:限制访问频率 B:人工筛查 C:对请求头的检测 D:验证码校验 5.以下关于爬虫程序的描述中,正确的是( )。
A:通过爬虫程序获取的数据可在互联网上公开 B:爬虫程序可以爬取互联网上任意数据 C:通过爬虫程序获取的数据可用于商业用途 D:爬虫程序执行时应避免对服务器造成过载

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(36) dxwkbang
返回
顶部