成果介紹
本發(fā)明設(shè)計一種基于多維高斯分布貝葉斯分類的癌癥復(fù)發(fā)預(yù)測系統(tǒng)。該系統(tǒng)利用預(yù)處理模塊、訓(xùn)練模塊和貝葉斯分類器實現(xiàn)癌癥復(fù)發(fā)的預(yù)測。預(yù)處理模塊對訓(xùn)練集進行數(shù)據(jù)清洗并生成類向量數(shù)據(jù)集;訓(xùn)練模塊首先計算兩個類屬性先驗概率,然后利用pearson相關(guān)系數(shù)將數(shù)據(jù)屬性分成與類屬性關(guān)聯(lián)度緊密的類數(shù)據(jù)屬性集合和與類屬性關(guān)聯(lián)度稀疏的兩類數(shù)據(jù)屬性集合,兩類數(shù)據(jù)屬性集合分別利用多維高斯分布和一維高斯分布來計算相應(yīng)的概率;貝葉斯分類器將兩者概率及類別的先驗概率聯(lián)合共同作為數(shù)據(jù)屬于每個類的概率,并據(jù)此判別癌癥的分類測試結(jié)果。本發(fā)明提高了癌癥是否復(fù)發(fā)的預(yù)測準確率。