Python中使用了代理IP为什么依然被封?
目前在抓一个站,抓多会被封 ip,然后我用了代理 ip 去抓,每次请求都换一个 ip。但是依然被封了!报 429 这个错误,不知道原因是啥?
Python中使用了代理IP为什么依然被封?
代理 IP 确定是有效的么?
我无法理解你的问题。
Cookie ?
确定有效哦,都是过滤好了的。
cookie,还有代理是高匿的吗?
好像不是高匿的,cookie 要怎么处理?
现在黑名单规则通常用 IP+MAC 两管齐下
那这个有什么办法处理吗?!
USB 网卡+代理 IP
对方服务器只能看到它网关的 MAC 地址
你用的代理是什么类型的?是高匿名的吗?如果不是高匿的,对方是可以获取到你的本机 IP 的
为啥总有人连基本原理都不懂就理直气壮的啊
Cookie 当然是每换一次 IP 清理一下咯。
高匿代理附上:
https://proxy.coderbusy.com/zh-cn/classical/anonymous-type/highanonymous.aspx?from=v2ex
随机高匿+随机 UA
另外检查好 Request 是否正确,可能会有别的防爬处理
3q,下午把抓代理代码的重写了一下,加入了高匿和透明的分类,明天再试试看。
这个站就是会限制访问次数,我换了高匿的 ip 还是被发现了原始 ip…
我去,屌爆,怎么来的?
刚需啊,thx
百度搜 掘金网 就是 高匿的
你确定 ip 有效吗?你访问 http://ip.chinaz.com/ 看下放回的 ip 地址是代理的地址还是你服务器的地址
是这样吗,怪不得我用高匿爬豆瓣会被封,一直想不通
给的链接后面加 ?from=v2ex 是为了做啥?
为了统计 站长肯定会好奇能带来多少访问量
我擦,冰爷。。。
这是哪位大神?为啥真的惊讶 (⊙o⊙)
嗯,有部分代理不支持 POST 的。
扫描、爬取 ext。。
我用的高匿代理,然后清了 cookie,这个站还是 429 挡我,并且把我原始的 ip 返回给我了…
有个软件专门干这个的,15 一个月,我搞批量注册用了好久了。非 vpn。ss。。
主要是两点:
1. 使用代理是高匿名的吗?这个可以通过 httpbin 查询到。
2. 对手网站是如何标识用户的? cookie ? token ?
#28 我用的高匿代理,然后清了 cookie,这个站还是 429 挡我,并且把我原始的 ip 返回给我了…
既然能知道你的原始 ip,那您使用的应该就不是高匿名代理。另外,也可能对方在其他处记录了您的原始 IP。
最后,我们提供代理 IP 服务,可以了解下。
/t/424630


