摘 要: 在復雜的決策環境中,集值信息是不可避免的。在此情況下,專家往往也能給出滿意的決策。從集值信息系統中提取有用的規則,用于增強智能系統的知識庫,具有實際意義。粗集是處理不確定信息的有效方法,但它通常適用于完全決策表。本文對粗集理論在集值信息下進行了初步的拓展,為從集值決策表中挖掘知識提供一定的理論基礎。
關鍵詞: 粗集;集值信息;規則
0 引言
集值信息系統是不完備的信息系統,傳統的關系數據庫不支持含集值的元組,但在現實中,集值信息系統又是不可避免的,此時,有些信息往往難以得到。
傳統的粗集的研究對象是完全信息系統,它能夠有效地利用約簡算法分析決策表,提取決策表中屬性之間存在的潛在模式。許多學者對空值型的信息系統進行了深入的研究[1-3],得到了一些很好的知識獲取方法,但關于集值信息下的粗集的研究卻很少。本文研究集值信息下粗集的有關性質及知識獲取。
1 集值信息下的粗集
定義1稱(U,A,F)為集值信息系統[4]。若U={x1,x2,…,xn}為對象集,A={a1,a2,…,am}為屬性集,F={ft,|t≤m}為信息函數集。其中:
ft:U→P(Vt)(t≤m)
Vt為屬性at的值域,P(Vt)表示Vt的非空子集全體。
若A=C∪D,C為條件屬性集,D為決策屬性集(其值域不含集值),則稱(U,C∪D,F)為集值決策表。
2 集值信息下近似算子的性質
性質1 設(U,A,F)為集值信息系統,B,C?哿A,X?哿U,則有:
參考文獻[1]討論了完備信息系統下的近似算子的遞推公式,對于集值信息下的近似算子,仍有下列遞推公式,它們可用于概念的遞增獲取。
性質2 設(U,A,F)為集值信息系統,。若
,則
例1 表1給出了一個協調的集值決策表(U,C∪D,F)
其中U={x1,x2,x3},C={a,b},D=18tlmv8w0abg,Va={1,2,3,4},Vb={1,2},Vd={1,2}
取X={x1,x3},用上述性質2和性質3分析表1,則有:
3 集值信息下的知識獲取
定義4 對于集值決策表(U,C∪D,F),t1,t2∈U。若t1∈SB(t2),且C(t1)=C(t2)(即t1與t2的條件屬性相同),如果d(t1)=d(t2),則稱(U,C∪D,F)是相容的,否則不相容。
定義5 x∈U,BC,若SB(x)
di,則稱規則x→di是確定的,否則稱規則x→di是不確定的,其中di∈U/18tlmv8w0abg。
定義6 規則x→di的置信度定義為B(di)=|SB(x)∩di|/|SB(x)|。
當B(di)=1時,規則x→di是確定的;
當B(di)<1時,規則x→di是不確定的。
例2 對于表1給出的集值決策表,下列規則是確定的:
{1,2}→di,{3,4}→d=2,{2}→d=1。
下列規則是不確定的:
{1}→d=1,{1}→d=2。
4 結論
在復雜的決策環境中,集值信息是不可避免的。在此情況下,從集值信息系統中提取有用的規則,用于增強智能系統的知識庫,具有實際意義。粗集是處理不確定信息的有效方法,但它通常適用于完全決策表。本文對粗集理論在集值信息下進行了初步的拓展,為從集值決策表中挖掘知識提供一定的理論基礎。
參考文獻
[1] 張文修,梁怡,吳志偉.信息系統與知識發現[M].北京:科學出版社,2003.
[2] 趙衛東,曹文彬,戴偉輝.不完全信息下的粗集拓展[J].系統工程學報,2002,17(6):45-48.
[3] 李仁璞,王正歐.規則不確定性的幾種度量及其相互關系[J].系統工程理論與實踐,2004,24(1):68-72.
[4] 張文修,吳志偉.粗糙集理論與方法[M].北京:科學出版社,2001.