本發(fā)明提供一種處理用戶空間文件系統(tǒng)故障的方法、系統(tǒng)、設備和存儲介質,方法包括:動態(tài)獲取集群中所有計算節(jié)點的列表,并根據(jù)列表向所有計算節(jié)點分發(fā)守護程序;通過守護程序檢測計算節(jié)點的管理進程狀況是否正常,響應于計算節(jié)點的管理進程狀況正常,通過守護程序檢測計算節(jié)點的用戶空間文件系統(tǒng)掛載點是否失效;響應于計算節(jié)點的用戶空間文件系統(tǒng)掛載點正常,通過守護程序檢測能否通過用戶空間文件系統(tǒng)掛載點訪問分布式文件系統(tǒng)文件;以及響應于不能通過用戶空間文件系統(tǒng)掛載點訪問分布式文件系統(tǒng)文件,取消用戶空間文件系統(tǒng)掛載點并重新掛載。本發(fā)明能夠極大的提升Hadoop集群運維效率,減少計算資源浪費,提升用戶對Hadoop集群的滿意度。
聲明:
“處理用戶空間文件系統(tǒng)故障的方法和裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)