第七章 数据收集-线上数据收集方式:上一章我们解决了线下数据搜集,本章将会介绍线上收集方法,即如何从网上收集数据。本章内容包括两部分:基于软件的八爪鱼数据爬取和基于编程的Python数据爬取。7.1八爪鱼网络爬虫方法:本节先全面介绍网络爬虫的概念,接着介绍八爪鱼软件的简单使用方法和复杂问题解决。
7.2python网络爬虫方法:本节介绍基于Python编程的网络爬虫,首先介绍Python软件、基本语法、爬虫的库,然后介绍了网络结构基础,最后通过两个案例介绍了Python的数据爬取。
[单选题]第一个发布的爬虫是?
HotCrawler
RBSE
Spinn3r
WebCrawler
答案:RBSE
[单选题]八爪鱼官网给出的数据采集系统能做的不包括(   )。
各大新闻门户网站实时监控,自动更新及上传最新发布的新闻;
金融数据,如季报,年报,财务报告,包括每日最新净值自动采集;
监控竞争对手最新信息,包括商品价格及库存;
银行交易流水数据。[多选题]常见的网络爬虫类型都有哪些?(   )
深层网络爬虫
通用网络爬虫
聚焦网络爬虫
增量式网络爬虫  [判断题]爬取用户姓名电话属于侵犯隐私。

[判断题]爬取商品价格、基本属性属于侵犯隐私。

[单选题]八爪鱼爬取多个页面所有相同元素的数据需要先设置? 
页面内循环
ajax设置
翻页循环
循环点击每个元素[多选题]八爪鱼抓取数据的流程包括(   )。
保存网址
创建任务
采集数据
设置采集流程 [判断题]八爪鱼爬取数据需要数据源的网址。

[判断题]八爪鱼爬取的数据只能保存成Excel。

[判断题]八爪鱼采集数据和网速无关。

温馨提示支付 ¥1.00 元后可查看付费内容,请先翻页预览!
点赞(0) dxwkbang
返回
顶部