粗糙集理論是一種研究不精確,不確定性知識的數學工具。
粗糙集理論的知識表達方式一般采用信息表或稱為信息系統的形式,它可以表現為四元有序組K=(U,A,V,P)。其中U為對象的全體,即論域;A是屬性全體;V是屬性的值域;P為一個信息函數,反映了對象x在K中的完全信息。
粗糙集的思想為:
一種類別對應一個概念(類別可以用集合表示,概念可以用規則描述),知識由概念組成;如果某個知識含有不精確概念,則該知識不精確。粗糙集對不精確概念的描述方法是通過下近似和上近似概念來描述。
上近似包含了所有使用知識R可確切分類到X的元素。
下近似包含了所有那些可能屬於X的元素的最小集合。
粗糙集可以解決的問題可以如下一些:
- 1,不確定或者不精確知識的表達
- 2,經驗學習並從經驗中獲取知識
- 3,不一致信息的分析
- 4,根據不完整得到,不確定的知識進行推理
- 5,在保留信息的前提下進行數據化簡
- 6,識別並評估數據之間依賴關系
①算法思想:
粗糙集(RS)理論是一種刻畫不完整性和不確定性的數學工具,能有效地分析和處理不精確、不一致和不完整等各種不完備信息,並從中發現隱含的知識,揭示潛在的規律。
①優點
- (1) 它能處理各種數據,包括不完整(incomplete) 的數據以及擁有眾多變量的數據;
- (2) 它能處理數據的不精確性和模棱兩可(ambiguity),包括確定性和非確定性的情況;
- (3) 它能求得知識的最小表達(reduct) 和知識的各種不同顆粒(granularity) 層次;
- (4) 它能從數據中揭示出概念簡單,易於操作的模式(pattern) ;
- (5) 它能產生精確而又易於檢查和證實的規則,特別適於智能控制中規則的自動生成.
基本概念
知識
“知識”這個概念在不同的范疇內有多種不同的含義。在
粗糙集理論中,“知識”被認為是一種分類能力。人們的行為是基於分辨現實的或抽象的對象的能力,如在遠古時代,人們為了生存必須能分辨出什么可以食用,什么不可以食用;醫生給病人診斷,必須辨別出患者得的是哪一種病。這些根據事物的特征差別將其分門別類的能力均可以看作是某種“知識”。
不可分辨關系
分類過程中,相差不大的個體被歸於同一類,它們的關系就是不可分辨關系(indiscernibility relation). 假定只用兩種黑白顏色把空間中的物體分割兩類,{黑色物體},{白色物體},那么同為黑色的兩個物體就是不可分辨的,因為描述它們特征屬性的信息相同,都是黑色.
如果再引入方,圓的屬性,又可以將物體進一步分割為四類: {黑色方物體},{黑色圓物體},{白色方物體},{白色圓物體}. 這時,如果兩個同為黑色方物體,則它們還是不可分辨的. 不可分辨關系是一種等效關系(equivalence relationship),兩個白色圓物體間的不可分辨關系可以理解為它們在白,圓兩種屬性下存在等效關系.
基本集
基本集(elementary set) 定義為由論域中相互間不可分辨的對象組成的集合,是組成
論域知識的顆粒. 不可分辨關系這一概念在
粗糙集理論中十分重要,它深刻地揭示出知識的顆粒狀結構,是定義其它概念的基礎. 知識可認為是一族 等效關系,它將論域分割成一系列的等效類。
集合
⑴ 對象a 肯定屬於集合X ;
⑵ 對象a 肯定不屬於集X ;
⑶ 對象a 可能屬於也可能不屬於集合X 。
集合的划分密切依賴於我們所掌握的關於
論域的知識,是相對的而不是絕對的.給定一個有限的非空集合U 稱為論域,I 為U 中的一族等效關系,即關於U 的知識,則二元對 K = (U,I) 稱為一個近似空間(approximation space). 設x 為U 中的一個對象,X為U 的一個子集,I (x) 表示所有與x 不可分辨的對象所組成的集合,換句話說,是由x 決定的等效類,即I (x) 中的每個對象都與x 有相同的特征屬性(attribute)。
參考鏈接:
http://blog.csdn.net/chl033/article/details/3240500
http://blog.sina.com.cn/s/blog_65aba7b70100h5s0.html