Python中如何使用知乎移动端APP的API爬取数据?
项目地址:gavin66/zhihu_crawler
目前项目已实现知乎的自动登录,并可爬取用户资料数据(还未有学历等详细资料,之后会添加),需要数据进行分析的或者感兴趣的可以给个 star⭐,谢谢。
使用方法
你必须安装有 mongoDB
安装依赖
pip install -r requirements.tx
爬取用户信息保存进 mongodb 中
python zhihu_crawler/spider/profile.py
配置
文件 config.py 进行项目运行配置
# mongodb 连接配置
MONGO_URI = 'mongodb://%s:%s@%s:%s/admin' % ('username', 'password', 'ip', 'port')
以下两个文件路径可随意换成你指定的
token 默认保存地址
TOKEN_PATH = os.environ[‘HOME’] + ‘/zhihu_crawler/zhihu.token’
日志文件
LOG_PATH = os.environ[‘HOME’] + ‘/zhihu_crawler/zhihu.log’
API 说明
from zhihu.client import Client
所有程序的入口
client = Client()
直接使用用户名和密码登录
client.login(username=’+8615555555555’, password=‘password’)
不使用参数,根据命令行输入
client.login()
自己 model
myself = client.myself()
自己的信息
他人 model
people = client.people()
某人关注列表
people.followees()
某人被关注列表
people.followers()
运行截图

爬取数据的格式

参考
- 登录部分的实现在本人博客有说明 - 爬取知乎数据 - 模拟登录
Python中如何使用知乎移动端APP的API爬取数据?
5 回复
扒接口算侵权么
我无法理解你的问题。
拔完还要亮出来
倒逼知乎成长
厉害了 apk 还能反编译了

