吳學輝
?。ㄟ\城學院 計算機科學與技術系,山西 運城 044000)
摘要: 針對煤礦瓦斯災害,提出了將粗糙集理論應用于煤礦瓦斯預警。首先用粗糙集理論對樣本數據進行屬性約簡,找出影響和控制瓦斯的關鍵屬性,然后對生成的決策規則進行約簡,最后建立煤礦瓦斯預警模型。通過實際應用證實了該模型是有效的。
關鍵詞:粗糙集;屬性約簡;決策規則
中圖分類號:TP182文獻標識碼:ADOI: 10.19358/j.issn.1674-7720.2017.06.026
引用格式:吳學輝. 粗糙集理論在煤礦瓦斯預警中的應用研究[J].微型機與應用,2017,36(6):86-88.
0引言
煤礦瓦斯又稱煤層瓦斯,是煤礦生產中的有害因素,它不僅污染空氣,而且當空氣中的瓦斯含量為5%~16%時,遇火即會引起爆炸,造成事故。雖然決策樹、神經網絡、灰色預測技術等用于煤礦瓦斯預警中取得了比較好的效果,但是仍然有許多需要改進和完善的地方。
粗糙集理論是由波蘭教授PAWLAK Z提出的一種數據挖掘新方法[12]。它是一種處理不確定、不完全、不一致信息的有效工具,其核心思想是利用已有的知識庫近似刻畫不確定或不精確的知識,因此將粗糙集理論引入煤礦瓦斯預警,可以發現隱藏的事故發生機制和誘因,導出分類規則,為煤礦安全生產提供預警。
1粗糙集相關理論
本文研究中所涉及的粗糙集相關理論如下:
定義1一個信息系統S可表示為:S=<U,R,V,f>。其中:U為對象的集合;R=C∪D,C為條件屬性集合,D為決策屬性集合;V=∪Vr,Vr表示屬性r∈R的值域;f:U×R→V是一個信息函數。
定義2(上近似、下近似)令XU,則RX稱為X關于R的上近似,表示為:
RX=∪{[x]R∈U/R|[x]R∩X≠}
RX稱為X關于R的下近似,表示為:
RX=∪{[x]R∈U/R|[x]RX}
定義3(邊界、正域、負域)定義集合X相對于R的邊界域為BNG(X)=RX-RX;集合X相對于R的正域POSR(X)= RX;集合X相對于R的負域BNG(X)=U-RX。
定義4(屬性核)當R是獨立的,且PR,則P也是獨立的。當Q獨立,且IND(P)=IND(Q),QP為P的簡化,雖然P可以有多種簡化。P中所有不可省略關系的集合稱為P的核,記為COREQ(P)。其中COREQ(P)=∩REDQ(P),P的所有Q約簡關系簇為REDQ(P)。
定義5(關系獨立、關系依賴)設S=<U,R,V,F>其中P、R為屬性,P∈R,IND(R)=IND(R-{P}},則稱P在R中是可缺的,否則稱P在R中就是不可缺的,如果R中的每個知識都是不可缺的,則稱R是獨立的,否則就是依賴的。
2粗糙集預測模型的構建
利用粗糙集理論進行數據推理,首先把相關數據整理為信息表的格式,建立相應的特征數據庫。知識庫中有條件屬性和決策屬性,然后對條件屬性進行約簡得到最簡規則,最后對決策規則再進行約簡,得到預測模型[3]。
2.1屬性約簡
屬性約簡是利用約簡算法從條件屬性中找出對決策屬性影響最大的屬性[4]。約簡算法主要有盲目法和啟發式約簡算法。由于前者采用窮盡搜索策略,所需要的時間和空間代價較高,實際約簡主要采用后者。啟發式約簡算法中最經典的是基于Skowron差別矩陣屬性約簡算法,算法描述如下[56]:
輸入:決策表;
輸出:條件屬性C相對于決策屬性D的一個約簡B
?。?)求出差別矩陣Mm×n;
(2)求決策表的相對核CORED(C);令B= CORED(C);
?。?)對于任意Cij,i,j=1,2,…,n,如果Cij∩B≠,則Cij=;
?。?)對于任意Cij,i,j=1,2,…,n,如果Cij=,則轉至步驟(6),否則轉至步驟(5);
?。?)統計差別矩陣中每個屬性出現的次數,然后選出出現次數最多的元素am,令B=B∪{ am},轉到步驟(3);
(6)輸出B。
2.2決策規則約簡
屬性約簡是數據約簡的一部分,經過屬性約簡的數據依然存在數據冗余[78]。決策規則約簡就是利用決策邏輯對決策規則的不必要條件進行約簡,從而進一步簡化決策規則[9]。
決策規則約簡思想簡述為:對于每一條決策規則,去掉該規則中的任意條件屬性,如果決策表保持一致,則該屬性可以去掉,否則予以保留,最終決策表中的每一行對應一條決策規則[10]。
2.3預測模型結構圖
綜上所述,抽取關鍵步驟,最終建立的煤礦瓦斯預警模型如圖1所示。
3實驗結果與分析
應用地點選定為山西同煤集團下屬的潘家窯煤礦,瓦斯監測數據全部來自于該煤礦日常監測數據。
3.1信息表的形成
傳感器監測的指標共有16項,包括掘進工作面瓦斯濃度、煤層溫度、煤層含水量、煤層瓦斯壓力、開采速度、煤層透氣性系數、煤層破碎性綜合特征系數、層間滑動綜合系數、煤層及煤厚變化綜合特征系數等。為了提高預測的準確率,把記錄中的數據過少的記錄合并到相關的狀態特征向量中,在這些狀態特征中,取出8個特征狀態作為條件屬性,分別為Con1、Con2、Con3、Con4、Con5、Con6、Con7、Con8,對其采用平均離散化方法劃分為低、中、高檔,分別用數值1、2、3表示。決策屬性用D來表示,屬性取值為1、2、3、4分別表示為不突出、突出威脅、一般突出、嚴重突出。
3.2屬性約簡
實驗采用啟發式Skowron差別矩陣屬性約簡算法,約簡后的決策表如表1所示。
從約簡結果可以看出,屬性2、3、5、7是核屬性,對決策屬性是必要的。其中:K破碎(屬性2)為煤體破碎性綜合特征系數;K層滑(屬性3)為層間滑動綜合系數;K煤厚(屬性5)為煤厚及煤厚變化綜合特征系數;λ(屬性7)為煤的透氣性系數。
3.3規則約簡
對表1采用基于二進制可辨矩陣的決策規則約簡,得到最終的決策規則集如表2所示。對表2的決策規則集解釋如下:(1)如果煤體破碎性綜合特征系數為中,層間滑動綜合系數為低,煤的透氣性系數為高,則煤礦瓦斯預警結果為不突出。(2)如果煤體破碎性綜合特征系數為低,層間滑動綜合系數為高,煤的透氣性系數為低,則煤礦瓦斯預警結果為一般突出。(3)如果煤體破碎性綜合特征系數為低,層間滑動綜合系數為低,煤的透氣性系數為低,則煤礦瓦斯預警結果為嚴重突出。(4)如果煤體破碎性綜合特征系數為高,層間滑動綜合系數為中,煤的透氣性系數為中,則煤礦瓦斯預警結果為不突出。(5)如果煤體破碎性綜合特征系數為中,層間滑動綜合系數為低,煤的透氣性系數為低,則煤礦瓦斯預警結果為嚴重突出。
4結論
本文研究了將粗糙集應用于煤礦瓦斯預警,并建立相應的預測模型。首先利用粗糙集對決策表中的條件屬性進行約簡,然后對約簡后的決策表進行規則約簡,提取規則,最終建立瓦斯瓦斯預測模型,并將其應用于煤礦瓦斯預警,取得了很好的效果。
參考文獻
?。?] QUINLAN J R.Induction of decision trees[J].Machine Learning,1986(1):81-106.
[2] ZIARKO W. Variable precision rough set model[J].Journal of Computer and System Sciences,1993,46(1):39-59.
[3] 余承依,李進金.基于依賴空間的變精度粗糙集屬性約簡[J].模式識別與人工智能,2014,12(8):1216.
?。?] 徐菲菲,畢忠勤,雷景生.基于聯合屬性重要度的決策風險最小化屬性約簡[J].計算機機科學,2016,43(6A):40-43.
?。?] 李建林,姚一豫,聶明,邊長生.基于粗糙集理論的高校教師教學質量評價系統研究[J].計算機應用與軟件,2014,45(3):45-47.
[6] 趙潔,梁俊杰,董振寧,等.位運算和核屬性快速識別下的粗糙集屬性約簡算法研究[J].小型微型計算機系統,2015,11(2):155-156.
?。?] 陸悠.一種面向增刪操作的粗糙集屬性約簡更新算法[J] 南京師大學報(自然科學版),2015,32(8):23-25.
[8] 張濤濤,薛曄.基于粗糙集屬性約簡方法的煤礦瓦斯爆炸災害風險指標體系[J].煤礦安全,2014,45(1):80-86.
?。?] 吳尚智.粗糙集和信息熵的屬性約簡算法及其應用[J].計算機工程,2011,37(7):56-61.
?。?0] 翟俊海,王熙照,張滄生.基于粗糙集技術的決策樹歸納[J].計算機工程與應用,2009,45(11):45-47.