分类导航

Python爬虫从入门到放弃（十八）之 Scrapy爬取所有知乎用户信息(上)

发布时间：2017年07月21日作者： IT网络文摘 (该文来自笔记，点击查看原文)

爬取的思路

首先我们应该找到一个账号，这个账号被关注的人和关注的人都相对比较多的，就是下图中金字塔顶端的人，然后通过爬取这个账号的信息后，再爬取他关注的人和被关注的人的账号信息，然后爬取被关注人的账号信息和被关注信息的关注列表，爬取这些用户的信息，通过这种递归的方式从而爬取整个知乎的所有的账户信息。整个过程通过下面两个图表示：

iOS培训,Swift培训,苹果开发培训,移动开发培训

爬虫分析过程

这里我们找的账号地址是：https://www.zhihu.com/people/excited-vczh/answers
我们抓取的大V账号的主要信息是：

iOS培训,Swift培训,苹果开发培训,移动开发培训

其次我们要获取这个账号的关注列表和被关注列表

分类导航

Python爬虫从入门到放弃（十八）之 Scrapy爬取所有知乎用户信息(上)

爬取的思路

爬虫分析过程

延伸阅读

我想了解如何学习