weka--數據離散化


NAME
weka.filters.unsupervised.attribute.Discretize

SYNOPSIS
An instance filter that discretizes a range of numeric attributes in the dataset into nominal attributes. Discretization is by simple binning. Skips the class attribute if set.

OPTIONS
spreadAttributeWeight -- When generating binary attributes, spread weight of old attribute across new attributes. Do not give each new attribute the old weight.

makeBinary -- Make resulting attributes binary.

debug -- If set to true, filter may output additional info to the console.

bins -- Number of bins.

doNotCheckCapabilities -- If set, the filter's capabilities are not checked before it is built. (Use with caution to reduce runtime.)

findNumBins -- Optimize number of equal-width bins using leave-one-out. Doesn't work for equal-frequency binning

attributeIndices -- Specify range of attributes to act on. This is a comma separated list of attribute indices, with "first" and "last" valid values. Specify an inclusive range with "-". E.g: "first-3,5,6-10,last".

desiredWeightOfInstancesPerInterval -- Sets the desired weight of instances per interval for equal-frequency binning.

useBinNumbers -- Use bin numbers (eg BXofY) rather than ranges for for discretized attributes

useEqualFrequency -- If set to true, equal-frequency binning will be used instead of equal-width binning.

binRangePrecision -- The number of decimal places for cut points to use when generating bin labels

invertSelection -- Set attribute selection mode. If false, only selected (numeric) attributes in the range will be discretized; if true, only non-selected attributes will be discretized.

ignoreClass -- The class index will be unset temporarily before the filter is applied.

名字
weka.filters.unsupervised.attribute.Discretize
提要
一個實例過濾器,它將數據集中的一系列數字屬性轉換為名義屬性。離散化通過簡單的結合進行。如果設置,跳過分類屬性。
選項
擴展屬性——當生成二進制屬性時,將舊屬性的權重傳遞到新屬性中。不要給每一個新的屬性一個舊的重量。
makeBinary——生成屬性二進制。
調試——如果設置為真,過濾器可以輸出附加信息到控制台。
段——段的數量。
donotcheck功能——如果設置,過濾器的功能在構建之前不會被檢查。(小心使用,以減少運行時。)
findNumBins——使用leave-one-out優化等寬容器的數量。不適用於等頻賓寧。
屬性索引——指定要執行的屬性的范圍。這是一個逗號分隔的屬性索引列表,帶有“first”和“last”有效值。指定包含“-”的范圍。E。旅客:“前3、5、6 - 10,去年”。
desiredWeightOfInstancesPerInterval——在每個間隔中為等頻率綁定設置所需的實例權重。
useBinNumbers——使用bin編號(如BXofY),而不是用於離散屬性的范圍。
等頻離散化——如果設置為真,則將使用等頻binning而不是等寬binning。
binRangePrecision——在生成bin標簽時用於切割點的小數位數。
反向選擇——設置屬性選擇模式。如果是false,則在范圍內僅選擇(數值)屬性將被離散;如果是真,則只有非選擇的屬性將被離散化。
ignoreClass——在應用篩選器之前,類索引將被暫時取消。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM