Python爬虫抓取淘宝商品信息需要大量淘宝账号吗?
账号会很容易被封吗?如果是的话从哪里购买大批小号?
Python爬虫抓取淘宝商品信息需要大量淘宝账号吗?
哪有这么麻烦。淘宝开放平台申请 api 即可。
我无法理解你的问题。
这个 api 肯定是有限制的吧,现在难道都不需要抓取了?
好吧我看了一下收费不便宜啊~
技术圈很多人不知道的一个事实是,以中国现行的法律标准,几乎所有爬虫工程师全都违法…
我怎么认为所有的爬虫工程师都知道自己做的事不合法呢…
小区搭建一个无密码的高强度 wifi,然后嗅探 cookies,然后。。。
据说某大佬就是这种操作
浪费时间
感觉挺厉害,淘宝的 cookie 又多又杂。
如果不需要商品销量和库存的话还是挺简单,只有商品列表要登录,详情不需要登录,不过最近好像评论接口需要登录了。
非法入侵计算机信息系统罪。
这个口袋可以装很多。
HTTPS 嗅探不到吧
https 不是要在手机上装证书才行么?
这吹的就有点过了,除非是想搞某个人会安排这个罪名,按法律来的话正常的爬虫应该是合法的,毕竟网站都把数据放到公网上了,法律对公共场所隐私是缺乏保护的
但是只要网站有反爬技术,哪怕最简单最弱智的那种,你写个爬虫用技术手段绕过了,就是非法入侵计算机信息系统罪
自建啥也做不到,除非能侵入对方电脑装个证书
你别改 UA 啊
只要没遵守 Robots 协议就算
前公司广告平台做过淘宝商品详情的爬虫,需要商家自己填写淘宝的商品 ID,然后我们再特定的爬。没爬过商品列表,感觉这个业务不符合实际。
貌似中间使用一些灰产技术,没细研究
我们是根据关键词搜索
按照中国法律,中国就没啥不犯法的。。不开发票,就是偷税漏税,满大街等着抓
就是这点恐怖,什么都能套非法获取计算机信息,但又不知道明细法规。
百度什么都抓,屁事没有。但百度被爬虫抓,一告一个准。
好吧 我承认你们是对的


