为什么Python爬虫使用4G或家庭宽带IP作为代理最适宜?

我们知道 IPV4 数量有限,因此全球各个国家对于手机或家庭宽带一般都是使用的 NAT 技术进行网络通信, 简而言之就是一个公网 IP 后边会对应很多个网络设备。

因此越是大的网站越不会轻易的 blog 一个 4g 或 IP 地址, 因为这将直接造成大量的用户无法访问它。

有的朋友可能在想怎样检测 IP 地址是家庭宽带或 4G 地址呢? 实际上这并不难, 提供 ip 地址查询服务的公司很多, 有些免费的网站甚至都可以做到,这其中就我使用经验而言 ipip.net 精度已经是极高了。

因此在我们的爬虫系统中应尽量采用 4g 或家庭宽带 IP 作为代理地址, 以提高程序的稳定性。
为什么Python爬虫使用4G或家庭宽带IP作为代理最适宜?


1 回复

可以用 IP2Location. 如果是 MOB,那么就是 4G.

回到顶部