252010
 

07/27Update:26日晚上新的域名再次挂掉。终于找到了原因,因为新域名正在备*案,被那个叫做未*备*案域*名*过*滤*系*统给拦截掉了。好吧,老老实实备案去。

这件血案真的是不堪回首,整整花了我们5天时间,导致了项目严重延期。

7月16日。晚上发现服务器上有个网站经常性出现了打不开的情况,查看了cacti,服务器的负载和网络都非常正常,调高了php的timeout,以为没多少问题了。事实是自己刷新也没问题了。

7月17日,问题大爆发了,服务器上另外一个网站也大规模出现了此问题,但非常奇怪的是,还有两个网站是没问题的。从此拉开了纠结的5天难熬的时间的序幕。服务器后端是使用apache的,然后采用nginx做反向代理。调高了nginx的缓存和timeout,都基本无效。但是非常奇怪的是,使用相同配置的另外两个网站是一点问题都没,啥都正常。

查看了日志,nginx中大量出现499错误。google了一下,是“client has closed connection”的nginx自定义错误。但很奇怪的是,使用apache的端口去访问却是一切正常,因此,初步判定是nginx的问题,好吧,既然是nginx问题,那就研究这玩意儿,调配置、换Development版本的nginx都无效,陷入无头绪状态。有点怀疑是域名问题了,此时用hosts绑定了一个域名上去,刷刷是正常的。

7月18日,绝对废掉nginx,直接用apache上,刚开始好好的,后来发现又不行了。日志中status 是200 ,但返回的是0字节。这个就纠结了。根据这个可能有人会问了,是不是因为我代码的问题,其实我判断不是。因为使用如下代码都经常性地刷不出来

<?php
 echo "hi";
 sleep(3);
 echo "dada";
 ?>

非常纠结。

7月19日,此时有点怀疑是PHP的问题,但排查了之后发现不是。换上nginx+fastcgi同样的问题。还好,公司里还有一台服务器。装上了Ubuntu以及其他必须的软件,在局域网内怎么刷都没有问题。

7月20日,把公司里的服务器上架到机房,发现老域名刚开始好好的,但一下子又老问题重现了,整套环境都换了,因此肯定不是我们的问题了。域名是godaddy上注册了,dns转换是用dnspod的。很有可能是DNSPOD问题,也很有可能是域名被XXX盯上了(事实证明不是,因为被盯上的话是被重置)。

7月21日,换了新域名后,一切正常的。到今天为止,一切正常。

其实到今天还是不思其解。。。

莫非真的是域名问题,还是DNSPOD引起的???

话说nginx+fastcgi真是好用,性能杠杠的!