【機器學習】粗糙集(Rough Set Approach)


粗糙集理論是一種研究不精確,不確定性知識的數學工具。

粗糙集理論的知識表達方式一般采用信息表或稱為信息系統的形式,它可以表現為四元有序組K=(U,A,V,P)。其中U為對象的全體,即論域;A是屬性全體;V是屬性的值域;P為一個信息函數,反映了對象x在K中的完全信息。

粗糙集的思想為:

  一種類別對應一個概念(類別可以用集合表示,概念可以用規則描述),知識由概念組成;如果某個知識含有不精確概念,則該知識不精確。粗糙集對不精確概念的描述方法是通過下近似和上近似概念來描述。

  上近似包含了所有使用知識R可確切分類到X的元素。
  下近似包含了所有那些可能屬於X的元素的最小集合。

粗糙集可以解決的問題可以如下一些:

  • 1,不確定或者不精確知識的表達
  • 2,經驗學習並從經驗中獲取知識
  • 3,不一致信息的分析
  • 4,根據不完整得到,不確定的知識進行推理
  • 5,在保留信息的前提下進行數據化簡
  • 6,識別並評估數據之間依賴關系

算法思想:

   粗糙集(RS)理論是一種刻畫不完整性和不確定性的數學工具,能有效地分析和處理不精確、不一致和不完整等各種不完備信息,並從中發現隱含的知識,揭示潛在的規律。

優點

  • (1) 它能處理各種數據,包括不完整(incomplete) 的數據以及擁有眾多變量的數據;
  • (2) 它能處理數據的不精確性和模棱兩可(ambiguity),包括確定性和非確定性的情況;
  • (3) 它能求得知識的最小表達(reduct) 和知識的各種不同顆粒(granularity) 層次;
  • (4) 它能從數據中揭示出概念簡單,易於操作的模式(pattern) ;
  • (5) 它能產生精確而又易於檢查和證實的規則,特別適於智能控制中規則的自動生成.

基本概念

知識

  “知識”這個概念在不同的范疇內有多種不同的含義。在 粗糙集理論中,“知識”被認為是一種分類能力。人們的行為是基於分辨現實的或抽象的對象的能力,如在遠古時代,人們為了生存必須能分辨出什么可以食用,什么不可以食用;醫生給病人診斷,必須辨別出患者得的是哪一種病。這些根據事物的特征差別將其分門別類的能力均可以看作是某種“知識”。 

不可分辨關系

  分類過程中,相差不大的個體被歸於同一類,它們的關系就是不可分辨關系(indiscernibility relation). 假定只用兩種黑白顏色把空間中的物體分割兩類,{黑色物體},{白色物體},那么同為黑色的兩個物體就是不可分辨的,因為描述它們特征屬性的信息相同,都是黑色.
  如果再引入方,圓的屬性,又可以將物體進一步分割為四類: {黑色方物體},{黑色圓物體},{白色方物體},{白色圓物體}. 這時,如果兩個同為黑色方物體,則它們還是不可分辨的. 不可分辨關系是一種等效關系(equivalence relationship),兩個白色圓物體間的不可分辨關系可以理解為它們在白,圓兩種屬性下存在等效關系.

基本集

  基本集(elementary set) 定義為由論域中相互間不可分辨的對象組成的集合,是組成 論域知識的顆粒. 不可分辨關系這一概念在 粗糙集理論中十分重要,它深刻地揭示出知識的顆粒狀結構,是定義其它概念的基礎. 知識可認為是一族 等效關系,它將論域分割成一系列的等效類。

集合

   粗糙集理論延拓了經典的 集合論,把用於分類的知識嵌入集合內,作為集合組成的一部分. 一個對象a 是否屬於集合X 需根據現有的知識來判斷,可分為三種情況:
⑴ 對象a 肯定屬於集合X ;
⑵ 對象a 肯定不屬於集X ;
⑶ 對象a 可能屬於也可能不屬於集合X 。
  集合的划分密切依賴於我們所掌握的關於 論域的知識,是相對的而不是絕對的.給定一個有限的非空集合U 稱為論域,I 為U 中的一族等效關系,即關於U 的知識,則二元對 K = (U,I) 稱為一個近似空間(approximation space). 設x 為U 中的一個對象,X為U 的一個子集,I (x) 表示所有與x 不可分辨的對象所組成的集合,換句話說,是由x 決定的等效類,即I (x) 中的每個對象都與x 有相同的特征屬性(attribute)。

參考鏈接:

http://blog.csdn.net/chl033/article/details/3240500
http://blog.sina.com.cn/s/blog_65aba7b70100h5s0.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM