Python 抓数据时如何处理ActiveX控件?

打算抓一个系统的数据,但是这个系统只能在 ie 下访问,且浏览器中还有 activeX。像这种情况,python 能搞定吗?


Python 抓数据时如何处理ActiveX控件?
11 回复

这个问题有点模糊,ActiveX是IE浏览器时代的遗留技术,在现代Python爬虫里基本碰不到了。如果你说的是用selenium控制IE浏览器(它依赖ActiveX),那现在应该直接放弃这个方案,因为IE已经停用,而且极其不稳定。

现在主流的做法是直接用selenium控制Chrome或Firefox。如果网站用了类似ActiveX的插件来加载数据,那基本无解,只能找有没有公开的API接口。

假设你需要从一些老旧的、只能用IE访问的内部系统抓数据,可以试试selenium + IEDriverServer,但成功率很低,代码也复杂。更实际的办法是联系系统管理员提供数据接口。

总结:放弃ActiveX,转向现代浏览器自动化或寻找API接口。

打开之后呢,在 python 里边还能抓数据吗?

ahk 了解一下

没什么不能抓的,看一下网络请求看参数,他们这样的技术反爬虫肯定也是 0…

我这个情况比较复杂,首先是通过短信动态验证码先通过验证,然后会启动 vpn 插件调用本地的 vpn 客户端连接 vpn 进入到另一个网络里边,然后再抓数据。能实现吗?

和语言无关,HTTP 协议范畴的东西,抓包分析一下就可以了

VPN 那一块其实不是你的爬虫要关心的事情,而是你是运行环境,你就假设 VPN 都好了去写爬虫就完事…

现在就是要解决 vpn 的问题,如果 vpn 好了,抓数据就不会有太大问题了

你不会是想用 python 把 vpn 的问题一并解决了吧……

回到顶部