【機器學習】粗糙集（Rough Set Approach）

本文轉載自查看原文 2017-06-13 10:02 4914 機器學習

粗糙集理論是一種研究不精確，不確定性知識的數學工具。

粗糙集理論的知識表達方式一般采用信息表或稱為信息系統的形式，它可以表現為四元有序組K=（U，A，V，P）。其中U為對象的全體，即論域；A是屬性全體；V是屬性的值域；P為一個信息函數，反映了對象x在K中的完全信息。

粗糙集的思想為：

　　一種類別對應一個概念（類別可以用集合表示，概念可以用規則描述），知識由概念組成；如果某個知識含有不精確概念，則該知識不精確。粗糙集對不精確概念的描述方法是通過下近似和上近似概念來描述。

　　上近似包含了所有使用知識R可確切分類到X的元素。
　　下近似包含了所有那些可能屬於X的元素的最小集合。

粗糙集可以解決的問題可以如下一些：

1，不確定或者不精確知識的表達
2，經驗學習並從經驗中獲取知識
3，不一致信息的分析
4，根據不完整得到，不確定的知識進行推理
5，在保留信息的前提下進行數據化簡
6，識別並評估數據之間依賴關系

①算法思想：

　　粗糙集(RS)理論是一種刻畫不完整性和不確定性的數學工具,能有效地分析和處理不精確、不一致和不完整等各種不完備信息,並從中發現隱含的知識,揭示潛在的規律。

①優點

(1) 它能處理各種數據，包括不完整（incomplete) 的數據以及擁有眾多變量的數據；
(2) 它能處理數據的不精確性和模棱兩可（ambiguity），包括確定性和非確定性的情況；
(3) 它能求得知識的最小表達（reduct) 和知識的各種不同顆粒（granularity) 層次；
(4) 它能從數據中揭示出概念簡單，易於操作的模式（pattern) ;
(5) 它能產生精確而又易於檢查和證實的規則，特別適於智能控制中規則的自動生成.

基本概念

知識

　　“知識”這個概念在不同的范疇內有多種不同的含義。在粗糙集理論中，“知識”被認為是一種分類能力。人們的行為是基於分辨現實的或抽象的對象的能力，如在遠古時代，人們為了生存必須能分辨出什么可以食用，什么不可以食用；醫生給病人診斷，必須辨別出患者得的是哪一種病。這些根據事物的特征差別將其分門別類的能力均可以看作是某種“知識”。

不可分辨關系

　　分類過程中，相差不大的個體被歸於同一類，它們的關系就是不可分辨關系（indiscernibility relation). 假定只用兩種黑白顏色把空間中的物體分割兩類，{黑色物體},{白色物體},那么同為黑色的兩個物體就是不可分辨的，因為描述它們特征屬性的信息相同，都是黑色.

　　如果再引入方，圓的屬性，又可以將物體進一步分割為四類： {黑色方物體},{黑色圓物體},{白色方物體},{白色圓物體}. 這時，如果兩個同為黑色方物體，則它們還是不可分辨的. 不可分辨關系是一種等效關系（equivalence relationship），兩個白色圓物體間的不可分辨關系可以理解為它們在白，圓兩種屬性下存在等效關系.

基本集

　　基本集（elementary set) 定義為由論域中相互間不可分辨的對象組成的集合，是組成論域知識的顆粒. 不可分辨關系這一概念在粗糙集理論中十分重要，它深刻地揭示出知識的顆粒狀結構，是定義其它概念的基礎. 知識可認為是一族等效關系，它將論域分割成一系列的等效類。

集合

　　粗糙集理論延拓了經典的集合論，把用於分類的知識嵌入集合內，作為集合組成的一部分. 一個對象a 是否屬於集合X 需根據現有的知識來判斷，可分為三種情況：

⑴ 對象a 肯定屬於集合X ;

⑵ 對象a 肯定不屬於集X ;

⑶ 對象a 可能屬於也可能不屬於集合X 。

　　集合的划分密切依賴於我們所掌握的關於論域的知識，是相對的而不是絕對的.給定一個有限的非空集合U 稱為論域，I 為U 中的一族等效關系，即關於U 的知識，則二元對 K = (U,I) 稱為一個近似空間（approximation space). 設x 為U 中的一個對象，X為U 的一個子集，I (x) 表示所有與x 不可分辨的對象所組成的集合，換句話說，是由x 決定的等效類，即I (x) 中的每個對象都與x 有相同的特征屬性（attribute)。

`參考鏈接：`

http://blog.csdn.net/chl033/article/details/3240500
http://blog.sina.com.cn/s/blog_65aba7b70100h5s0.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【機器學習】粗糙集屬性約簡—Attribute Reduction 粗糙集理論粗糙集基本概念在進行機器學習建模時，為什么需要驗證集(validation set)？【機器學習】Iris Data Set（鳶尾屬植物數據集）機器學習中的訓練集、驗證集、測試集機器學習之訓練集_驗證集_測試集機器學習中的訓練集、驗證集和測試集機器學習數據集大全 MNIST機器學習數據集