原文:Spark2 生存分析Survival regression

在spark.ml中,实现了加速失效时间 AFT 模型,这是一个用于检查数据的参数生存回归模型。 它描述了生存时间对数的模型,因此它通常被称为生存分析的对数线性模型。 不同于为相同目的设计的比例风险模型,AFT模型更容易并行化,因为每个实例独立地贡献于目标函数。 当在具有常量非零列的数据集上匹配AFTSurvivalRegressionModel而没有截距时,Spark MLlib为常量非零列输 ...

2016-12-09 17:13 0 2123 推荐指数:

查看详情

生存分析(survival analysis)

一、生存分析(survival analysis)的定义  生存分析:对一个或多个非负随机变量进行统计推断,研究生存现象和响应时间数据及其统计规律的一门学科。   生存分析:既考虑结果又考虑生存时间的一种统计方法,并可充分利用截尾数据所提供的不完全信息,对生存时间的分布特征进行描述,对影响生存 ...

Tue Dec 06 17:48:00 CST 2016 0 50004
Spark2 Linear Regression线性回归

  回归正则化方法(Lasso,Ridge和ElasticNet)在高维和数据集变量之间多重共线性情况下运行良好。 数学上,ElasticNet被定义为L1和L2正则化项的凸组合: 通过 ...

Fri Nov 04 05:23:00 CST 2016 0 6299
survival analysis 生存分析与R 语言示例 入门篇

原创博客,未经允许,不得转载。 生存分析survival analysis,顾名思义是用来研究个体的存活概率与时间的关系。例如研究病人感染了病毒后,多长时间会死亡;工作的机器多长时间会发生崩溃等。 这里“个体的存活”可以推广抽象成某些关注的事件。 所以SA就成了研究某一事件与它的发生时间 ...

Thu Mar 17 06:17:00 CST 2016 0 34242
生存分析(Kaplan-Meier,Cox Regression

一、背景   在某些场景下我们要判断一个事件能存活多久,这时候我们就需要使用生存分析相关的方法。例如,一些实验中小白鼠在某个时间段的生存概率;或者在日常的打车场景中,一个乘客呼叫了订单,这个订单在等待时间段中的存活概率。 二、风险函数、生存函数与删失数据   假设一个乘客发了一个打车 ...

Mon Sep 21 23:18:00 CST 2020 0 1296
生存模型(Survival Model)介绍

https://www.cnblogs.com/BinbinChen/p/3416972.html 生存分析,维基上的解释是: 生存分析(Survival analysis)是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法 ...

Tue Jul 03 19:32:00 CST 2018 0 7027
Spark2 Dataset之视图与SQL

// 创建视图 data.createOrReplaceTempView("Affairs") val df1 = spark.sql("SELECT * FROM Affairs WHERE age BETWEEN 20 AND 25") df1 ...

Sat Nov 26 01:01:00 CST 2016 0 2006
Spark2 探索性数据统计分析

data数据源,请参考我的博客http://www.cnblogs.com/wwxbi/p/6063613.html import org.apache.Spark.sql.DataFrameStatFunctions import ...

Fri Dec 02 21:11:00 CST 2016 0 1721
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM