Python爬虫中今日头条的_signature参数JS逆向问题,求帮忙分析原因

最近在整理爬虫项目的时候发现

我按照源码穿进去的参数有时候能返回数据,有时候不能返回数据, execjs.compile(_js).call('TAC.sign', "6347006294" +''+ "0") 我这样穿的参数

返回的有时候是这样

{"message": "success", "has_more": false, "data": []},

有时候却能返回正确数据 这到底为啥呢?

我按照源码 js: 传的三个参数 window.TAC && (t = TAC.sign(userInfo.id + "" + d.params.max_behot_time))

d.params.max_behot_time = e.next && e.next.max_behot_time || 0))

这是源码的三个参数,但是 d.params.max_behot_time 这里有这个 next 不知道啥意思,求 解这 max_behot_time 传的是 0 吗?我感觉每次都变化吧????

网址:

https://www.toutiao.com/c/user/6347006294/#mid=6350075797


Python爬虫中今日头条的_signature参数JS逆向问题,求帮忙分析原因

11 回复

max_behot_time 是上一次请求返回的,翻页用。 刚刚试了下 10 次请求有一半是不返回正常数据 = =


这是为啥?

每次穿的 max_behot_time 到底是不是 0 ?

我在控制台返回的参数 是每次都可以请求到数据的,为啥这个不行

第一次传 0 默认刷新最新的页面,请求回来 max_behot_time 给第二次请求用就等于翻页了,你试试。返回空我也不知道为什么,是做了什么限制啥的

老哥匿名了吗, 上一个没 匿名爬头条的还没出来呢

匿名啥意思?

算法改了,这个应该是返回的是第 X 页,填个 10 以内的数字看一下

这个数字不是随便写吧

不行,换其他的,不反数据

看来这个头条破解是无解了啊

回到顶部