原文链接:http://tecdat.cn/?p=17950 在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能。数据集是 看起来所有变量都是数字变量,但实际上,大多数都是因子变量, > ...
原文链接:http: tecdat.cn p 原文出处:拓端数据部落公众号 研究大纲 介绍数据集和研究的目标 探索数据集 可视化 使用Chi Square独立检验 Cramer s V检验和GoodmanKruskal tau值对数据集进行探索 预测模型,Logisitic回归和RandomForest 两个逻辑回归的实例 使用 折交叉验证对模型实例进行评估 变量选择改进 step bestglm ...
2021-06-03 23:29 0 259 推荐指数:
原文链接:http://tecdat.cn/?p=17950 在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能。数据集是 看起来所有变量都是数字变量,但实际上,大多数都是因子变量, > ...
心脏病监测分析 数据来源:kaggle 数据获取方式: 关注公众号:YOLO的学习进阶日常 回复:心脏病 为什么想做这个分析案例? 心脏病已经成为人类健康的三大杀手之一,为找到心脏病的病因,特此参考了一些公众号推文和知乎,kaggle这些平台的文章来做一个关于心脏病 ...
原文链接:http://tecdat.cn/?p=24127 原文出处:拓端数据部落公众号 介绍 鲍鱼是一种贝类,在世界许多地方都被视为美味佳肴。铁和泛酸的极好来源,是澳大利亚、美国和东亚的营养食品资源和农业。100 克鲍鱼可提供超过 20% 的每日推荐摄入量。鲍鱼的经济价值与其年龄呈正 ...
原文链接:http://tecdat.cn/?p=22721 原文出处:拓端数据部落公众号 Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择。根据惩罚项的大小,LASSO将不太相关的预测因子 ...
原文链接:http://tecdat.cn/?p=22410 原文出处:拓端数据部落公众号 本文的目的是完成一个逻辑回归分析。使你对分析步骤和思维过程有一个基本概念。 library(tidyverse ...
原文链接:http://tecdat.cn/?p=16453 金融市场上最重要的任务之一就是分析各种投资的历史收益。要执行此分析,我们需要资产的历史数据。数据提供者很多,有些是免费的,大多数是付费的。在本文中,我们将使用Yahoo金融网站上的数据。 在这篇文章中,我们将: 下载收盘价 ...
结构化数据的预处理 前面所展示的一些示例已经很让人兴奋。但从总体看,数据类型还是比较单一的,比如图片,比如文本。 这个单一并非指数据的类型单一,而是指数据组成的每一部分,在模型中对于结果预测的影响基本是一致的。 更通俗一点说,比如在手写数字识别的案例中,图片坐标(10,10)的点 ...
数据下载:http://www.fueleconomy.gov/feg/epadata/vehicles.csv.zip 将数据导入R中, 1.首先将工作路径设定到本地保存了vehicles.csv的路径下: 2.我们可以直接从zip文件中载入数据,只要你知道zip中压缩 ...