继续付费找爬虫牛人 - Golang Go语言
继续付费找爬虫牛人 - Golang Go语言
把需求里 最核心的两个技术性的难点问题再说明一下
对性能(实时性)有非常高的要求, 抓取到的新闻 最多 1s 内的延迟
再就是部分抓取网站有 websocket 的接口推送新闻的,这个需要搞定
能够解决上面两个问题的联系我,最好是有实际相关项目经验的
开发费用 1w,维护费用 5k/年,服务器硬件还有代理部分预算支出在 2w/年 ,
爬取网站 10 个左右,爬取时间一天 6 小时
联系方式 球球:196063
更多关于继续付费找爬虫牛人 - Golang Go语言的实战教程也可以访问 https://www.itying.com/category-94-b0.html
1s 延迟,先说能不能达到这个延迟,你考虑过人家网站的感受么。
更多关于继续付费找爬虫牛人 - Golang Go语言的实战系列教程也可以访问 https://www.itying.com/category-94-b0.html
这种实时性要求高的爬虫需要对网页进行秒级监控,这个有些难度,可以用 polling 来搞。websocket 爬虫我认识一个大牛,可以 wx 我 tikazyq1
顺便打个广告,Crawlab 是一个专注于爬虫的集成了爬虫管理、任务调度、任务监控、数据分析等模块的分布式爬虫管理平台,非常适合对爬虫管理、爬虫工程化有要求的开发者及企业
// github.com /tikazyq/crawlab
都是比较大型的网站 1s 访问个 2 到 3 次就打挂了 ?
应该是金融类的产品吧,响应可以在这范围内,稳定性不一定能达到
什么类型的网站?
1 天 6 小时
估计是爬 gov 网站 基于舆情作交易吗
2w/a 买代理都不够的吧
不会挂不意味着这样频率的请求是合理的,大部分在爬的人估计都是这么想的。你考虑的是反正人家不会挂,而站方必须增加更多额外人力资源成本来应对爬虫。
多谢提醒 嗯
我觉得这个的主要难点在于 1s 之内响应,对应的就是反爬策略的更新和代理的稳定性,我觉得 2w 付代理确实有难度
自己做新闻源?
爬取时间一天 6 小时 ,如何做到实时?只有 6 个小时实时。
这部分 可以 再增加支出
对,我觉得代理这部分可以看着来,一般的网站即使把 ip 封了也不会一直封禁,有一个静默期,用代理池一直更新就好了,主要是测试到准确的静默期边界存在困难
不会被计算机犯罪么~
这个确实很危险,算计算机犯罪了,赚白菜的钱,操白粉的心。
监狱里面找 /狗头 /
1s 延迟你要把别人网站爬炸
洗洗睡吧
白菜价
话说,多加几台机器,轮流跑 可以么 比如 5 台 5s 一次 每台之间间隔 1s 加钱可达?
这需求没法做的,“最多 1s 内的延迟”这一点,技术层面都不一定所有网站可行,道德层面问题就更大了。。
1s 内的延迟意味着你需要至少 0.5 秒刷新一次,对于一些比较菜的网站来说就是 DDOS 了,虽然可能不会当场爆炸但也会压力山大;如果人家挂了付费 CDN 的话即使全部打在缓存上、对服务器本身没有压力,也还是会有流量费的问题。
这个需求很简单,怎么实现我不管 ,dog
你可以跟这些网站合作拿信息,不过费用就不只两万了。
我以前写过一个 proxy,可以把这个软件接受的所有信息转发,延迟在 0.1s 以内。
频繁刷新不可取,websocksets 还可以
可以做啊,预算加个 0
1s 延迟,这个需求估计是拍脑袋拍出来的
费用感人。。
多谢你的建议, 有一些细节我想请教一下,是否方便发我你的联系方式? 我现在考虑把重要的按你说的 proxy 的方式来做, 有 websocket 替代的尽量用这个。其他不重要的 刷取间隔时间调长一些
既然是找别人做,就不要想着投机套方案,之前 V 站也有这种人,最后在这里不敢发言了。
😄,ip 代理费
首先不说开发费用,5k/年的维护费用平均 400/月?
这个价格 招实习生 差不多
1s 延迟,单页面日最少请求=3600*24=86400,平均一个代理请求 1000 次,得至少 86 个代理轮换
有没有想过。一年维护费才 5000。
网站改一下策略。又要改代码。一个月才 400。那个大牛这么便宜?
您好!
看到您正在寻找Golang(Go语言)方面的爬虫专家,我非常感兴趣。作为IT领域中对Go语言有深入研究和实践经验的开发者,我在爬虫技术的开发和应用上有着丰富的经验。
在Go语言环境中,爬虫开发具有高效、并发处理能力强等优势。利用Go语言的goroutine和channel等特性,可以实现高并发、低延迟的爬虫系统,有效提升数据抓取效率。同时,Go语言内置的net/http包和第三方库如colly、goquery等,也为开发功能强大的爬虫提供了极大的便利。
我擅长设计并实现高效的爬虫架构,包括分布式爬虫系统、动态网页抓取、反爬虫机制规避等方面。在开发过程中,我注重代码的整洁和可维护性,确保爬虫系统的稳定性和可扩展性。
如果您需要定制化的爬虫开发服务,或者对现有爬虫系统进行优化和升级,我都能够提供专业的解决方案。同时,我也愿意根据您的具体需求,提供详细的报价和开发计划。
期待与您进一步沟通,共同探讨Go语言爬虫开发的相关事宜。如有需要,请随时联系我。
祝好!
[您的名字] [联系方式]
以上回复简洁明了地介绍了自己在Go语言爬虫开发方面的经验和能力,并表达了愿意提供服务的意愿。希望能够帮助到您!