機器學習：保序回歸(IsotonicRegression)：一種可以使資源利用率最大化的算法

本文轉載自查看原文 2017-06-15 08:41 2372 機器學習/ Python

1.數學定義

保序回歸是回歸算法的一種,基本思想是：給定一個有限的實數集合,訓練一個模型來最小化下列方程：

並且滿足下列約束條件：

2.算法過程說明

從該序列的首元素往后觀察，一旦出現亂序現象停止該輪觀察，從該亂序元素開始逐個吸收元素組成一個序列，直到該序列所有元素的平均值小於或等於下一個待吸收的元素。

舉例：

原始序列：<9, 10, 14>

結果序列：<9, 10, 14>

分析：從9往后觀察，到最后的元素14都未發現亂序情況，不用處理。

原始序列：<9, 14, 10>

結果序列：<9, 12, 12>

分析：從9往后觀察，觀察到14時發生亂序（14>10），停止該輪觀察轉入吸收元素處理，吸收元素10后子序列為<14, 10>，取該序列所有元素的平均值得12，故用序列<12, 12>替代<14, 10>。吸收10后已經到了最后的元素，處理操作完成。

原始序列：<14, 9, 10, 15>

結果序列：<11, 11, 11, 15>

分析：從14往后觀察，觀察到9時發生亂序（14>9），停止該輪觀察轉入吸收元素處理，吸收元素9后子序列為<14,9>。求該序列所有元素的平均值得12.5，由於12.5大於下個待吸收的元素10，所以再吸收10，得序列<14, 9, 10>。求該序列所有元素的平均值得11，由於11小於下個待吸收的元素15，所以停止吸收操作，用序列<11, 11, 11>替代<14, 9, 10>。

3.舉例說明下面實驗的原理

以某種葯物的使用量為例子：

假設葯物使用量為數組X=0,1,2,3,4….99，病人對葯物的反應量為Y=y₁,y₂,y₃…..y₉₉，而由於個體的原因，Y不是一個單調函數(即：存在波動)，如果我們按照葯物反應排序，對應的X就會成為亂序，失去了研究的意義。而我們的研究的目的是為了觀察隨着葯物使用量的遞增，病人的平均反應狀況。在這種情況下，使用保序回歸，即不改變X的排列順序，又求的Y的平均值狀況。如下圖所示：

從圖中可以看出，最長的綠線x的取值約是30到60，在這個區間內，Y的平均值一樣，那么從經濟及病人抗葯性等因素考慮，使用葯量為30個單位是最理想的。

當前IT行業虛擬化比較流行，使用這種方式，找到合適的判斷參數，就可以使用此算法使資源得到最大程度的合理利用。

4.實驗代碼

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.collections import LineCollection
from sklearn.isotonic import IsotonicRegression
from sklearn.utils import check_random_state

n = 100
##產生一個0-99的列表
x = np.arange(n)
##實例化一個np.random.RandomState的實例，作用是每次取的隨機值相同
rs = check_random_state(0)
##randint(-50, 50)：產生-50到50之間的整數
##np.log  求以e為低的對數
y = rs.randint(-50, 50, size=(n,)) + 50. * np.log(1 + np.arange(n))

##設置保序回歸函數
ir = IsotonicRegression()
##訓練數據
y_ = ir.fit_transform(x, y)

##繪圖
segments = [[[i, y[i]], [i, y_[i]]] for i in range(n)]
##plt.gca().add_collection(lc),這兩步就是畫點與平均直線的連線
lc = LineCollection(segments)

fig = plt.figure()
plt.plot(x, y, 'r.', markersize=12)
plt.plot(x, y_, 'g.-', markersize=12)
plt.gca().add_collection(lc)
plt.legend(('Data', 'Isotonic Fit'), loc='lower right')
plt.title('Isotonic regression')
plt.show()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [機器學習]SVM---硬間隔最大化數學原理 14-influence 圖機器學習之網絡的影響力最大化保序回歸算法步驟機器學習——線性回歸算法 Spark機器學習(2)：邏輯回歸算法機器學習與回歸類算法 Spark機器學習(1)：線性回歸算法機器學習算法 --- 線性回歸最大似然估計與期望最大化（EM）算法 python機器學習（六）回歸算法-邏輯回歸