原文:Spark2 生存分析Survival regression

在spark.ml中,實現了加速失效時間 AFT 模型,這是一個用於檢查數據的參數生存回歸模型。 它描述了生存時間對數的模型,因此它通常被稱為生存分析的對數線性模型。 不同於為相同目的設計的比例風險模型,AFT模型更容易並行化,因為每個實例獨立地貢獻於目標函數。 當在具有常量非零列的數據集上匹配AFTSurvivalRegressionModel而沒有截距時,Spark MLlib為常量非零列輸 ...

2016-12-09 17:13 0 2123 推薦指數:

查看詳情

生存分析(survival analysis)

一、生存分析(survival analysis)的定義  生存分析:對一個或多個非負隨機變量進行統計推斷,研究生存現象和響應時間數據及其統計規律的一門學科。   生存分析:既考慮結果又考慮生存時間的一種統計方法,並可充分利用截尾數據所提供的不完全信息,對生存時間的分布特征進行描述,對影響生存 ...

Tue Dec 06 17:48:00 CST 2016 0 50004
Spark2 Linear Regression線性回歸

  回歸正則化方法(Lasso,Ridge和ElasticNet)在高維和數據集變量之間多重共線性情況下運行良好。 數學上,ElasticNet被定義為L1和L2正則化項的凸組合: 通過 ...

Fri Nov 04 05:23:00 CST 2016 0 6299
survival analysis 生存分析與R 語言示例 入門篇

原創博客,未經允許,不得轉載。 生存分析survival analysis,顧名思義是用來研究個體的存活概率與時間的關系。例如研究病人感染了病毒后,多長時間會死亡;工作的機器多長時間會發生崩潰等。 這里“個體的存活”可以推廣抽象成某些關注的事件。 所以SA就成了研究某一事件與它的發生時間 ...

Thu Mar 17 06:17:00 CST 2016 0 34242
生存分析(Kaplan-Meier,Cox Regression

一、背景   在某些場景下我們要判斷一個事件能存活多久,這時候我們就需要使用生存分析相關的方法。例如,一些實驗中小白鼠在某個時間段的生存概率;或者在日常的打車場景中,一個乘客呼叫了訂單,這個訂單在等待時間段中的存活概率。 二、風險函數、生存函數與刪失數據   假設一個乘客發了一個打車 ...

Mon Sep 21 23:18:00 CST 2020 0 1296
生存模型(Survival Model)介紹

https://www.cnblogs.com/BinbinChen/p/3416972.html 生存分析,維基上的解釋是: 生存分析(Survival analysis)是指根據試驗或調查得到的數據對生物或人的生存時間進行分析和推斷,研究生存時間和結局與眾多影響因素間關系及其程度大小的方法 ...

Tue Jul 03 19:32:00 CST 2018 0 7027
Spark2 Dataset之視圖與SQL

// 創建視圖 data.createOrReplaceTempView("Affairs") val df1 = spark.sql("SELECT * FROM Affairs WHERE age BETWEEN 20 AND 25") df1 ...

Sat Nov 26 01:01:00 CST 2016 0 2006
Spark2 探索性數據統計分析

data數據源,請參考我的博客http://www.cnblogs.com/wwxbi/p/6063613.html import org.apache.Spark.sql.DataFrameStatFunctions import ...

Fri Dec 02 21:11:00 CST 2016 0 1721
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM