近日,亞馬遜 AWS(亞馬遜網(wǎng)絡(luò)服務(wù))在美國東部 us-east-1區(qū)域遭遇嚴(yán)重故障,導(dǎo)致全球范圍內(nèi)的數(shù)百個(gè)互聯(lián)網(wǎng)服務(wù)陷入癱瘓,甚至連知名的 ChatGPT 也未能幸免。這次宕機(jī)事件宛如 “地震”,使得許多日常使用的應(yīng)用和網(wǎng)站無法訪問。
根據(jù)故障追蹤平臺(tái) Downdetector 的數(shù)據(jù),當(dāng)天的故障報(bào)告數(shù)量超過了650萬份,顯示出事件的嚴(yán)重性。受影響的服務(wù)不僅包括開發(fā)者常用的 Docker 和 npm,還涉及到視頻會(huì)議工具 Zoom 和 Slack、社交媒體 Reddit、流媒體平臺(tái) Netflix 和 Disney + 等。更令人無奈的是,用戶在家中點(diǎn)餐、打車,甚至搭乘航班時(shí)也都遭遇了麻煩。
這次故障的主要原因是 AWS 的 DNS(域名系統(tǒng))解析問題,以及一個(gè)監(jiān)控子系統(tǒng)出現(xiàn)異常,導(dǎo)致網(wǎng)絡(luò)連接不穩(wěn)定。這一故障發(fā)生在 AWS 最早設(shè)立的 us-east-1區(qū)域,該區(qū)域不僅承載著大量企業(yè)的核心服務(wù),還負(fù)責(zé)許多全球控制面服務(wù)。由于其重要性,us-east-1的宕機(jī)對(duì)其他區(qū)域的服務(wù)造成了連鎖反應(yīng)。
用戶們?cè)谏缃幻襟w上紛紛吐槽,一些網(wǎng)友用幽默的方式調(diào)侃馬斯克的社交平臺(tái) X 未受影響,成為討論的 “避風(fēng)港”。然而,對(duì)于那些依賴于 AWS 的服務(wù)用戶來說,這次宕機(jī)事件無疑是一場(chǎng)災(zāi)難。不僅工作無法進(jìn)行,生活中的基本服務(wù)也遭到了波及。
此事件再一次揭示了互聯(lián)網(wǎng)基礎(chǔ)設(shè)施的脆弱性。雖然大型云服務(wù)平臺(tái)提升了網(wǎng)絡(luò)的穩(wěn)定性和安全性,但集中化的服務(wù)架構(gòu)使得小故障也可能導(dǎo)致嚴(yán)重后果。專家建議,開發(fā)者應(yīng)考慮采用多區(qū)域部署的方式,以減少因單點(diǎn)故障帶來的影響。
雖然這次故障令人沮喪,但也給我們敲響了警鐘:在享受互聯(lián)網(wǎng)便利的同時(shí),我們也必須思考如何提高系統(tǒng)的彈性,以應(yīng)對(duì)不可預(yù)見的風(fēng)險(xiǎn)。





京公網(wǎng)安備 11011402013531號(hào)