美東時(shí)間周二早間,互聯(lián)網(wǎng)基礎(chǔ)設(shè)施服務(wù)商Cloudflare表示,其全球網(wǎng)絡(luò)正在遭遇異常,導(dǎo)致包括社交媒體平臺(tái)X在內(nèi)的大量網(wǎng)站出現(xiàn)“internal server error”等訪(fǎng)問(wèn)故障,用戶(hù)無(wú)法訪(fǎng)問(wèn)許多網(wǎng)站和服務(wù),包括零售、電商、社交媒體、金融服務(wù)以及交通相關(guān)平臺(tái)。該公司隨后聲稱(chēng),在耗時(shí)不到四小時(shí)后已修復(fù)問(wèn)題。

宕機(jī)期間,X的部分功能中斷,多家網(wǎng)站也陷入訪(fǎng)問(wèn)受阻。根據(jù)故障跟蹤平臺(tái)Downdetector的數(shù)據(jù),除X之外,也有大量站點(diǎn)受到影響,相關(guān)報(bào)告數(shù)量持續(xù)攀升。用戶(hù)在訪(fǎng)問(wèn)X、ChatGPT、DoorDash、IKEA,以及紐約市大都會(huì)運(yùn)輸署(MTA)等網(wǎng)站時(shí),都看到與Cloudflare相關(guān)的錯(cuò)誤信息。


隨后,Cloudflare的一位女發(fā)言人表示,在美東時(shí)間早上6點(diǎn)20分左右,他們的某項(xiàng)服務(wù)出現(xiàn)了異常的流量激增,導(dǎo)致經(jīng)過(guò)公司網(wǎng)絡(luò)的流量出現(xiàn)錯(cuò)誤。
Cloudflare另一位發(fā)言人Jackie Dutton在公告中說(shuō),這個(gè)問(wèn)題是由一個(gè)用于管理威脅流量、自動(dòng)生成的配置文件引起的,修復(fù)耗時(shí)不到四小時(shí)。公司表示已經(jīng)部署了核心修復(fù)措施,但謹(jǐn)慎指出系統(tǒng)“仍需時(shí)間完全穩(wěn)定”。
Dutton表示:
“這個(gè)文件的條目數(shù)量超過(guò)了預(yù)期大小,觸發(fā)了負(fù)責(zé)處理Cloudflare部分服務(wù)流量的軟件系統(tǒng)崩潰。”
聲明稱(chēng),沒(méi)有證據(jù)顯示此次事件與網(wǎng)絡(luò)攻擊或惡意活動(dòng)有關(guān)。
故障的影響范圍極為廣泛。Downdetector在平臺(tái)上表示,在Cloudflare宕機(jī)期間,“各類(lèi)受影響服務(wù)的報(bào)告累計(jì)超過(guò)210萬(wàn)條”,顯示此次事件已成為近年來(lái)較為嚴(yán)重的一次基礎(chǔ)設(shè)施級(jí)別中斷。

事故發(fā)生后,Cloudflare的股價(jià)周二開(kāi)盤(pán)一度暴跌7%,隨后跌幅收窄。

數(shù)字資產(chǎn)行業(yè)也出現(xiàn)反應(yīng)。幣安聯(lián)合創(chuàng)始人、前CEO趙長(zhǎng)鵬在X上發(fā)文稱(chēng):“區(qū)塊鏈依然正常運(yùn)行(Blockchain kept working)”,暗示去中心化系統(tǒng)未受此次事件影響。
到美東時(shí)間12:15,Cloudflare表示系統(tǒng)正在逐步恢復(fù),但全球部分區(qū)域仍可能出現(xiàn)訪(fǎng)問(wèn)錯(cuò)誤、性能下降或登錄問(wèn)題。公司將在狀態(tài)頁(yè)面持續(xù)更新修復(fù)進(jìn)度。

對(duì)少數(shù)公司過(guò)于依賴(lài)
近年來(lái),多次因?yàn)閿?shù)字基礎(chǔ)設(shè)施供應(yīng)商出現(xiàn)問(wèn)題,導(dǎo)致全球互聯(lián)網(wǎng)使用陷入癱瘓。亞馬遜云服務(wù)(AWS)、CrowdStrike Holdings Inc.和微軟公司先后出現(xiàn)過(guò)類(lèi)似事故,也突顯全球互聯(lián)網(wǎng)在很大程度上依賴(lài)于少數(shù)公司提供服務(wù)。
Cloudflare和AWS的服務(wù)對(duì)普通用戶(hù)來(lái)說(shuō)幾乎是“隱形”的,但它們的工具支撐著消費(fèi)者每天使用的大量網(wǎng)站和服務(wù)。
上個(gè)月AWS的宕機(jī)讓互聯(lián)網(wǎng)部分區(qū)域陷入癱瘓,導(dǎo)致數(shù)百萬(wàn)用戶(hù)的網(wǎng)站和應(yīng)用無(wú)法使用,零售銷(xiāo)售受阻,社交媒體和金融服務(wù)中斷,很多企業(yè)也受到影響。去年,網(wǎng)絡(luò)安全公司CrowdStrike所使用的一項(xiàng)工具中的漏洞更是讓全球的電腦系統(tǒng)大面積崩潰,引發(fā)數(shù)千次航班延誤和取消,也讓政府機(jī)構(gòu)和大型企業(yè)的運(yùn)營(yíng)陷入混亂。
加州網(wǎng)絡(luò)安全公司Check Point Software的專(zhuān)家Graeme Stewart表示,這類(lèi)事故凸顯了互聯(lián)網(wǎng)對(duì)少數(shù)幾家基礎(chǔ)設(shè)施提供商的過(guò)度依賴(lài)。
他說(shuō):
“很多機(jī)構(gòu)依然讓所有關(guān)鍵服務(wù)都依賴(lài)同一條路徑,而且沒(méi)有真正有效的備份。一旦這條路徑出問(wèn)題,就沒(méi)有任何后備方案。這就是我們一直看到的問(wèn)題。”
薩里大學(xué)(University of Surrey)網(wǎng)絡(luò)安全教授Alan Woodward表示,周二的故障再次說(shuō)明互聯(lián)網(wǎng)高度依賴(lài)“少數(shù)玩家”。他把Cloudflare形容為“你從未聽(tīng)說(shuō)過(guò)的最大公司”。
“人們別無(wú)選擇,只能依賴(lài)這些少數(shù)大公司。”
首席技術(shù)官道歉
Cloudflare首席技術(shù)官Dane Knecht為這次事故道歉。他在X上寫(xiě)道:
“當(dāng)Cloudflare網(wǎng)絡(luò)出現(xiàn)問(wèn)題,影響到依賴(lài)我們的海量流量時(shí),我們辜負(fù)了客戶(hù),也辜負(fù)了整個(gè)互聯(lián)網(wǎng)。這個(gè)問(wèn)題本身、造成的影響、以及解決所花的時(shí)間,都是不可接受的。我們已經(jīng)開(kāi)始著手確保類(lèi)似情況不會(huì)再次發(fā)生,但我知道今天確實(shí)給大家?guī)?lái)了麻煩。客戶(hù)對(duì)我們的信任最為重要,我們會(huì)盡一切努力贏回這份信任。”
Cloudflare在過(guò)去幾年曾多次經(jīng)歷類(lèi)似宕機(jī)。
2019年7月,Cloudflare軟件中的一個(gè)漏洞導(dǎo)致網(wǎng)絡(luò)部分模塊過(guò)度占用計(jì)算資源,使全球數(shù)千家依賴(lài)Cloudflare的網(wǎng)站(包括Discord、Shopify、SoundCloud以及Coinbase)離線(xiàn)長(zhǎng)達(dá)30分鐘。2022年6月,Cloudflare發(fā)生故障,影響其19個(gè)數(shù)據(jù)中心的流量,導(dǎo)致多個(gè)主要網(wǎng)站和服務(wù)癱瘓,持續(xù)約一個(gè)半小時(shí)。
Cloudflare的軟件被全球數(shù)十萬(wàn)家公司使用,作為企業(yè)網(wǎng)站與終端用戶(hù)之間的緩沖層,用于保護(hù)網(wǎng)站免受流量攻擊或流量突發(fā)導(dǎo)致的宕機(jī)。
去年,網(wǎng)絡(luò)安全公司CrowdStrike發(fā)布的錯(cuò)誤軟件更新導(dǎo)致運(yùn)行微軟Windows系統(tǒng)的數(shù)百萬(wàn)臺(tái)設(shè)備崩潰,給航空、銀行、醫(yī)療等眾多行業(yè)造成大范圍混亂。
CrowdStrike的這次宕機(jī)源于其產(chǎn)品中一個(gè)在客戶(hù)電腦最底層運(yùn)行的錯(cuò)誤。而Cloudflare的作用是保護(hù)互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,如網(wǎng)站和平臺(tái),因此當(dāng)Cloudflare宕機(jī)時(shí),許多熱門(mén)網(wǎng)站會(huì)直接無(wú)法訪(fǎng)問(wèn)或出現(xiàn)異常。Cloudflare主要負(fù)責(zé)“讓網(wǎng)站始終在線(xiàn)且速度夠快”,而CrowdStrike專(zhuān)注于保護(hù)電腦和服務(wù)器免受攻擊。





京公網(wǎng)安備 11011402013531號(hào)