本發(fā)明公開一種基于故障數(shù)據(jù)建模的HPC可靠性評估方法,包括以下步驟:對目標(biāo)系統(tǒng)的所有故障單元,進行故障數(shù)據(jù)采集;基于故障嚴重等級,對采集到的故障數(shù)據(jù)進行故障分類,將故障數(shù)據(jù)分為嚴重故障數(shù)據(jù)與非嚴重故障數(shù)據(jù);篩除與失效無關(guān)的非嚴重故障數(shù)據(jù);選定時間區(qū)間,將該時間區(qū)間內(nèi)的所有嚴重故障數(shù)據(jù)作為采樣樣本,采用最大似然估計法,計算weibull分布參數(shù),獲得該時間區(qū)間內(nèi)的目標(biāo)系統(tǒng)的失效時間分布模型;計算時間區(qū)間上的目標(biāo)系統(tǒng)的MTTF,即weibull分布的特征值;根據(jù)不同時間區(qū)間的目標(biāo)系統(tǒng)的MTTF變化,評估目標(biāo)系統(tǒng)的可靠性變化特征。本發(fā)明能夠真實反映系統(tǒng)運行中的可靠性指標(biāo),可以在線分析出系統(tǒng)在不同時間段的可靠性水平,指導(dǎo)系統(tǒng)容錯和日常運維。
聲明:
“基于故障數(shù)據(jù)建模的HPC可靠性評估方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)