menu Thinking Null
全力攻关一昼夜,确保运行一整年--博客搬新家
2021-02-06   typecho维护   1 条评论   2757 次阅读

2021-02-05 星期四 13:29

博主收到邮件,Azure订阅额度到期,导致虚拟机解除分配,awsl.blog域名不能正常访问,相关服务也停止运行。

经登录Azure控制台查看以及在网络上检索信息后,确认此次故障来源与美国Microsoft公司全面禁止到期学生订阅中虚拟机的运行有关。

Azure邮件

14时41分

博主立即针对此现象做出应急措施。

第一,马上访问相关网站,检测信息故障严重程度。

第二,立即指定临时替代性产品,通过HTTP 302重定向到https://awsl.lovestoblog.com/ ,初步解决打不开页面问题。

第三,在软件方面,进行突破性测试运行,尝试重启到期的虚拟机。

第四,在硬件方面,进行虚拟机选购,备用虚拟机更新测试。

15时01分

远程连接VM,进行临时性服务商更换,确保网页运行。

16时30分

用户再次反馈,页面小故障依旧不断:bug频发、到中国大陆延迟剧增。

再与 @GCNWM 共同研究方案以后,再次远程解决突发问题。

18时10分

在 @GCNWM 与博主的共同努力下,暂时稳定住网站失联的局面。

19时00分

与 @GCNWM 召开第二次解决方案研讨,确定接下来的应对方案:

第一,必须根治问题,不能长时间使用临时性替代品。

第二,托管服务提供商,必须全部更新出来,随时准备出场替换。

第三,软件方面要进一步取得突破,找到问题,消灭问题。

19时11分

用户反馈,网站首页加载不正常、CDN无法回源、访问速度慢、无法确定连接是否安全等问题再次浮现。

Azure邮件

图为临时备用网站

问题再次来临,经搜索有关网站得知,Azure学生订阅相关用户也在研究此次故障现象,沟通得知,这次故障是全局性的爆发,目前没有更好的方案。

20时17分

博主将备用虚拟主机全部购买完毕,马上奔赴 @GCNWM 家中进行现场测试。

20时31分

软件方面测试取得了突破,随后马上联系相关人员,针对新购虚拟机系统进行调试。最终成功SSH连接虚拟机,这一故障的排除,引发了现场的欢呼,也给众人打了一剂强心剂。

22时20分

第三次故障现在再次来临,现场用了Cloudflare ® Always Online™的网页全部装载失效,直连网站目前良好运行。

召开第三次攻关会议。只明确一点,必须在今晚拿下博客在Cloudflare ® CDN 后正常运行。

2月6日 星期五 03时33分

“DNS解析完成”:随着dig命令输出正确的IP地址,CDN后的博客网站恢复运行了,大家马上围观过去,确实好用了,欢呼声、掌声在一瞬间爆发开来。

在短暂的欢呼过后,微机室人员准备分析出故障原因,马上召开第四次整改会议:交流解决方案,全部远程解决。

06时34分

本博客全部分站,除剪贴板,图床服务外,全部解决宕机问题。

针对剪贴板,图床服务的特殊问题,博主决定,再次ssh到服务器,进行软件更换,彻底根治问题。

清晨,又一行命令输入终端,准备重新配置相关服务。

08时42分

剪贴板,图床网站,现场测试,调试完毕。

现在 awsl.blog 相关网站加载问题,最后一岗点解决。

09时30分

经过压力测试,博客网站系统稳定运行,故障解除。

奋战20余个小时,没人抱怨、更没人放弃,即使希望渺茫,有希望就有前进的动力。博主和 @GCNWM 在解决网站故障的攻关项目上,真正做到了敢于攻关、敢于创新、敢于领先。

改编自全力攻关一昼夜,确保运输三十站

本篇文章采用 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 许可协议进行许可。

转载或引用本文时请遵守许可协议,注明出处。

发表评论
已有 1 条评论
textsms
account_circle
email
link
    Kw==
    Kw==
    April 5th, 2021 at 12:09 am

    越看越感到熟悉,看到结尾我直接哈哈哈哈