Python爬虫抓取淘宝商品信息需要大量淘宝账号吗?

账号会很容易被封吗?如果是的话从哪里购买大批小号?
Python爬虫抓取淘宝商品信息需要大量淘宝账号吗?

27 回复

哪有这么麻烦。淘宝开放平台申请 api 即可。


我无法理解你的问题。

这个 api 肯定是有限制的吧,现在难道都不需要抓取了?

好吧我看了一下收费不便宜啊~

技术圈很多人不知道的一个事实是,以中国现行的法律标准,几乎所有爬虫工程师全都违法…

我怎么认为所有的爬虫工程师都知道自己做的事不合法呢…

小区搭建一个无密码的高强度 wifi,然后嗅探 cookies,然后。。。

据说某大佬就是这种操作

浪费时间

感觉挺厉害,淘宝的 cookie 又多又杂。

如果不需要商品销量和库存的话还是挺简单,只有商品列表要登录,详情不需要登录,不过最近好像评论接口需要登录了。


请问是哪条法律?

非法入侵计算机信息系统罪。
这个口袋可以装很多。

HTTPS 嗅探不到吧

https 不是要在手机上装证书才行么?

这吹的就有点过了,除非是想搞某个人会安排这个罪名,按法律来的话正常的爬虫应该是合法的,毕竟网站都把数据放到公网上了,法律对公共场所隐私是缺乏保护的

https 嗅探。。自建 WiFi 自建 dns 服务器

但是只要网站有反爬技术,哪怕最简单最弱智的那种,你写个爬虫用技术手段绕过了,就是非法入侵计算机信息系统罪

自建啥也做不到,除非能侵入对方电脑装个证书

你别改 UA 啊

只要没遵守 Robots 协议就算

前公司广告平台做过淘宝商品详情的爬虫,需要商家自己填写淘宝的商品 ID,然后我们再特定的爬。没爬过商品列表,感觉这个业务不符合实际。



貌似中间使用一些灰产技术,没细研究

我们是根据关键词搜索

按照中国法律,中国就没啥不犯法的。。不开发票,就是偷税漏税,满大街等着抓

《刑法》第 285 条,非法获取计算机信息系统数据罪。 判例参考今日头条诉上海晟品

就是这点恐怖,什么都能套非法获取计算机信息,但又不知道明细法规。
百度什么都抓,屁事没有。但百度被爬虫抓,一告一个准。


好吧 我承认你们是对的

回到顶部