爬虫的极限是什么？

单从技术层面讨论：
超顶尖的爬虫技术能否取得 APP （网页）没有公开的数据？例如访客的联系电话

极限不就是 Google 么

你说这个叫爬虫吗

那是黑客，不叫爬虫，爬虫跟人肉抄网页的最终结果一样

如果连访客联系电话都能爬到，那大概站长的数据的还没你多

爬虫的极限是哲学！！！《论爬虫如何最大化爬取数据而不被反爬》

极限就是最大程度地模拟一个正常用户的操作，所有人可以看到的内容都可以爬到

单从现实层面讨论：
包吃包住🤣

什么意思？

意思就是进牢子，睡铁床，吃皇家饭

最多就是扫一遍端口，再用常用字典扫一遍网站目录，更进一步的就不是爬虫了

附赠银手镯一对，再也不会熬夜了，天天早睡早起😁
还能学点新技术，比如

分情况讨论。有些网页没公开的数据实际上已经发给前端了，这时候爬虫显然可以。但电话等敏感数据，正常点的开发团队不至于犯这种错误

爬虫的天花板是天眼查

能啊，这有啥不能的。。。爬虫又不是不能用账号密码用白名单 ip 爬后台页面，是吧。。。

你这个不是爬虫，前几年根据用户手机壳的颜色改变 app 主题色的需求就是你提出来的吧？

要联系方式的话去抓天眼查，企查查，分分钟搞几个亿出来

极限应该能把牢底坐穿？

你这问题提得就跟没学过爬虫一样

昨天 315 新闻刚出

你能问出这个问题，说明你连爬虫是啥都不太明白...

极限是被 ban

你这让我想起来我以前上班的一家公司，老板让我把另一家电商公司的用户订单数据爬出来，我说这个爬不到，他说我在我手机上都能看到订单，你爬不到？我很无语，过了几天我就拜拜了。

获得网页上未公开的数据已经脱离爬虫领域了，那是信安的领域，渗透测试干的活

极限就是可以进包间，学缝纫机技术

不遵从 robots 协议的都不要爬才是最好的选择,既安全又简单

uTools 在 7.0 版本中限制非会员插件应用安装位置将限制不超过 10 个，称是迫于日消耗 CDN 流量近 1T ，为控制成本做出取舍。各位怎么看能怎么看，无非是之…

官网： www.agiquery.com 坚持全职开发了两年了，接受多种形式的合作，外包，定制开发 BI 系统。联系方式：18901845760 支持一下点了试用和部…

————注：本文于2019年11月4日更新———— 关于无锁队列的实现，网上有很多文章，虽然本文可能和那些文章有所重复，但是我还是想以我自己的方式把这些文章中的重要的知识点串…

合速度