ClickCease Linux 6.1 説明用戶識別有故障的 CPU - TuxCare

加入我們的熱門時事通訊

加入 4,500+ Linux 和開源專業人士!

每月2次。沒有垃圾郵件。

Linux 6.1 説明用戶識別有故障的CPU

奧班拉·奧佩耶米

實施期間: 2022年9月 4 日 - TuxCare專家團隊

Linux Kernel 6.1是Linux作業系統的最新更新之一,為使用者提供了新的日誌記錄系統,使他們能夠識別伺服器中出現故障的CPU及其相關內核。

日誌記錄系統會檢測在給定時間哪個內核、CPU 和插槽出現故障。但是,記錄器遠非完美,因為內核有可能被重新調度到另一個 CPU 或 CPU 內核,儘管它仍然可以幫助識別有故障的 CPU 或內核。

“這並不完美,因為任務可能會在故障發生和消息列印之間重新安排在另一個CPU上,但在實踐中,這足以説明人們識別幾個壞的CPU內核,”Rik van Riel解釋說。

通常,CPU錯誤具有「奇怪的特定」能力,其中某些程式或代碼片段只會使內核崩潰。

“在足夠大的計算機機群中,通常有一些壞的CPU。這些通常可以通過看到一些通常運行的內核代碼來識別,這些代碼在其他任何地方運行良好,在一個特定的壞系統上的同一個CPU內核上不斷崩潰。然而,多年來變壞的CPU中的故障模式通常是奇怪的,唯一看到的不良行為可能是bash,Python或各種系統守護程式中的段錯誤,這些程式在其他任何地方都運行良好,“Riel說。

日誌記錄系統將有助於檢測潛在的故障處理器,並將在今年晚些時候從Linux 6.1開始使用。它還將補充新的英特爾現場掃描、MCE、EDAC 報告等。

這篇文章的來源包括 Tech Radar上的一篇文章。

希望在不重新啟動內核、系統停機或計劃維護窗口的情況下自動修補漏洞?

瞭解TuxCare的即時修補

成為TuxCare客座作家

開始使用

郵件

加入

4,500

Linux和開源
專業人士!

訂閱
我們的時事通訊