如何知道某网站运行在GAE上
GAE就是Google Application Engine,通过Alexa的网站排名系统,我们可以知道Top 10的使用GAE的网站,他们是:(截止至今天)
- www.robtex.com (Alexa rank: 1691)
- www.twibes.com (Alexa rank: 13143)
- www.acid-play.com (Alexa rank: 25884)
- www.jaiku.com (Alexa rank: 29061)
- www.wordle.net (Alexa rank: 34022)
- www.twazzup.com (Alexa rank: 40910)
- www.twollo.com (Alexa rank: 41414)
- www.downforeveryoneorjustme.com (Alexa rank: 41718)
- www.chromeexperiments.com (Alexa rank: 49899)
www.desktop-reporting.com (Alexa rank: 51447)
那么,我们如何才能知道一个网站是运行在GAE上的呢?
如果一个网站运行在GAE上,那么其会有如下三个事情会为真:
网站的 别名记录(CNAME)会 指向ghs.google.com, ghs.l.google.com 或者appspot.l.google.com 。
访问网站的/form 路径会返回Google风格的404 错误页。
网站的”Server”标题会是 “Google Frontend”
测试这三个条件并不难,在Linux下,我们可以用这样的命令行检查:
有google.com字样的CNAME
dig www.example.com cname | egrep -i 'cname.*google.com'
Google 404 错误for /form:
curl -s -D - http://www.example.com/form | egrep 'G.*o.*o.*g.*l.*e'
"Google Frontend" 字符串
curl -s -D - http://www.example.com/ | egrep '^Server:'
请注意,头两个条件在一些时候对于运行在Blogspot 的主机也是成立的,估计Blogspot就是运行在GAE上的一个站点。但第三个条件就不一样了。GAE上的是”Google Frontend”,而 Blogspot上的则是 “GFE/2.0″。
转载于酷壳CoolShell 无删改 仅以此纪念陈皓(左耳朵耗子)
问题 有部署开源的导航网站吗? 部署的哪个?有 GitHub 地址吗? 随便弄一个自己喜欢的,我用的是: github.com/mereithhh/van-nav 其他…
使用PHP的cURL库可以简单和有效地去抓网页。你只需要运行一个脚本,然后分析一下你所抓取的网页,然后就可以以程序的方式得到你想要的数据了。无论是你想从从一个链接上取部分数据,…
好多年前还看《程序员》杂志,后面好像停刊了,技术博客们好像也慢慢的消失了,都慢慢转向知识付费和 APP 化了。不知道现在还有没有好的技术向杂志推荐? 蹲一个 以前好像微软有…
合速度