如何知道某网站运行在GAE上
GAE就是Google Application Engine,通过Alexa的网站排名系统,我们可以知道Top 10的使用GAE的网站,他们是:(截止至今天)
- www.robtex.com (Alexa rank: 1691)
- www.twibes.com (Alexa rank: 13143)
- www.acid-play.com (Alexa rank: 25884)
- www.jaiku.com (Alexa rank: 29061)
- www.wordle.net (Alexa rank: 34022)
- www.twazzup.com (Alexa rank: 40910)
- www.twollo.com (Alexa rank: 41414)
- www.downforeveryoneorjustme.com (Alexa rank: 41718)
- www.chromeexperiments.com (Alexa rank: 49899)
www.desktop-reporting.com (Alexa rank: 51447)
那么,我们如何才能知道一个网站是运行在GAE上的呢?
如果一个网站运行在GAE上,那么其会有如下三个事情会为真:
网站的 别名记录(CNAME)会 指向ghs.google.com, ghs.l.google.com 或者appspot.l.google.com 。
访问网站的/form 路径会返回Google风格的404 错误页。
网站的”Server”标题会是 “Google Frontend”
测试这三个条件并不难,在Linux下,我们可以用这样的命令行检查:
有google.com字样的CNAME
dig www.example.com cname | egrep -i 'cname.*google.com'
Google 404 错误for /form:
curl -s -D - http://www.example.com/form | egrep 'G.*o.*o.*g.*l.*e'
"Google Frontend" 字符串
curl -s -D - http://www.example.com/ | egrep '^Server:'
请注意,头两个条件在一些时候对于运行在Blogspot 的主机也是成立的,估计Blogspot就是运行在GAE上的一个站点。但第三个条件就不一样了。GAE上的是”Google Frontend”,而 Blogspot上的则是 “GFE/2.0″。
转载于酷壳CoolShell 无删改 仅以此纪念陈皓(左耳朵耗子)
使用PHP的cURL库可以简单和有效地去抓网页。你只需要运行一个脚本,然后分析一下你所抓取的网页,然后就可以以程序的方式得到你想要的数据了。无论是你想从从一个链接上取部分数据,…
各位老铁,家里的网件 6400 跑了五年要不行了,想近期升级一下 家里有一台 GEN10 esxi 打底的 NAS ,所以跑着软路由。但是想要一个硬路由专心做拨号上网的工作。科…
现在有什么火绒替代品,不用强迫用户升级的 鉴于该软件开始走上 360 的道路,准备替换一下 一直都在说避免使用国产软件,不是开玩笑的,卡巴欢迎你 卡巴之前用过,太狠了,…