Python数据爬取与Ajax技术探讨

淘宝商品月销量是 Ajax 异步加载//看回复


Python数据爬取与Ajax技术探讨
19 回复


做了请求的限制、



请大牛们提供下思路。伪造请求 IP ?


我无法理解你的问题。

目测是做了请求源的限制、、、

貌似这个 API 需要店铺的 session ID 这类的 token 吧,具体需要阿里的文档,哪些 API 是需要 session ID 的

代理池搞起

#4 限制很严的

同学,你搞错 URL 了吧?
你第一张图里明明是 initItemDetail.htm 这个 URL, 而你第二张图请求另一个地址是啥意思?

你不是想获取 销量吗?

只需要 设定 Referer 就可以请求到数据 .

<br>$ curl -se "<a target="_blank" href="https://detail.tmall.com/item.htm" rel="nofollow noopener">https://detail.tmall.com/item.htm</a>" "<a target="_blank" href="https://mdskip.taobao.com/core/initItemDetail.htm?itemId=543399704177&amp;callback=setMdskip" rel="nofollow noopener">https://mdskip.taobao.com/core/initItemDetail.htm?itemId=543399704177&amp;callback=setMdskip</a>" | grep<br>-Po "\"sellCount\":\d+,"<br>"sellCount":8308,<br><br>

curl 执行之后后面的代码是
<br>| grep -Po "\"sellCount\":\d+,"<br>
用来匹配出来 销量, 上面帖代码的时候换行了, 最后 一行是 最终的输出结果.

#6 噢噢噢

#6 设定 Referer 也不行的吧

你用的工具有问题吧? 或者 你的 ip 已经 被封了?
我上面发的 curl 的命令,你没执行一下试试?
因 V2EX 上面帖图片不太方便, 我就不帖 curl 执行结果的截图了.

#10 呃呃。好像可以了。感谢

curl 的执行结果截图:

用 selenium

#13 可以了。通过其他方式去请求吧

#12 再次感谢

回到顶部