CrowdStrike歸咎測試軟件缺陷導致全球850萬臺Windows計算機崩潰

來源:環球網

【環球網科技綜合報道】7月25日,據外媒報道,在近期的一次重大技術失誤中,CrowdStrike將其導致全球範圍內850萬臺Windows計算機崩潰的錯誤更新歸咎於測試軟件的缺陷。據CrowdStrike在事後回顧(PIR)中所述,此次問題的根源在於內容驗證器的錯誤,使得包含有問題的數據的更新仍然通過了驗證流程。

資料圖

這次大規模藍屏死機(BSOD)中斷對全球多家公司造成了嚴重影響,包括航空公司、廣播公司以及倫敦證券交易所等。該問題迫使Windows機器陷入啓動循環,需要技術人員本地訪問才能恢復,而Apple和Linux機器則未受影響。許多公司,如達美航空,至今仍在努力恢復中。

CrowdStrike推出的Falcon Sensor工具旨在防止DDoS和其他類型的攻擊。該工具包含在內核級別運行的內容,並使用“模板類型”來定義威脅防禦策略。然而,在2024年7月19日發佈的兩個新模板實例中,一個僅40KB大小的實例儘管數據存在問題,卻仍然通過了驗證。當傳感器接收到該模板實例並將其加載到內容解釋器中時,導致了越界內存讀取並觸發了異常,進而引發了Windows操作系統的崩潰。

爲了防止類似事件再次發生,CrowdStrike承諾將採取多項措施,包括對快速響應內容進行更徹底的測試,增加驗證檢查並增強錯誤處理。此外,該公司還計劃採用快速響應內容的交錯部署策略,以避免全球中斷重演,併爲客戶提供對此類內容交付的更大控制權以及更新的發佈說明。

然而,一些分析師和工程師對CrowdStrike的應對措施提出了質疑。工程師Florian Roth在社交媒體上發帖稱,CrowdStrike應該從一開始就意識到這些更新可能會被驅動程序解讀並導致問題,因此他們應該更早地實施快速響應內容的交錯部署策略。