原文:【原】机器学习几个基本的问题

从今年四月份到现在已经工作快 个月了,最开始是做推荐系统,然后做机器学习,现在是文本挖掘,每个部分研究的时间都不多,但还是遇到了很多问题,目前就把一定要总结的问题总结一下,以后有时间多看看,提醒自己看有没有解决。 推荐系统: .冷启动热启动区别和联系 各个阶段需要的算法 .每个算法的数学推导 适用情况 优缺点 改进方法 数据类型 .如何平衡热启动时的准确率和召回率,两者不可能同时高,怎么平衡 从 ...

2015-12-24 10:35 4 6178 推荐指数:

查看详情

机器学习改善Interpretability的几个技术

改善机器学习可解释性的技术和方法 尽管透明性和道德问题对于现场的数据科学家来说可能是抽象的,但实际上,可以做一些实际的事情来提高算法的可解释性 算法概括 首先是提高概括性。这听起来很简单,但并非那么简单。当您认为大多数机器学习工程都以非常特定的方式应用算法来发现所需的特定 ...

Wed Oct 23 23:54:00 CST 2019 0 324
关于机器学习二分类问题几个评估指标辨析

在完成机器学习中的二分类问题的建模阶段后,需要对模型的效果做评价,如今业内通常采用的评价指标有精确率(Precision)、准确率(Accuracy)、召回率(Recall)、F值(F-Measure)等多个方面,为了准确理解以避免混淆,本文将对这些指标做简要介绍。 1 混淆矩阵 其实,上面 ...

Sun Feb 09 20:17:00 CST 2020 0 1168
机器学习--分类问题

机器学习--分类问题 分类问题是监督学习的一个核心问题,它从数据中学习一个分类决策函数或分类模 型(分类器(classifier)),对新的输入进行输出预测,输出变量取有限个离散值。 决策树 决策树 ...

Fri Nov 15 05:31:00 CST 2019 0 375
机器学习:回归问题

回归,我第一次看到回归的时候,想的就是回归是什么意思?后来看了一个答案解释很有意思,回归这个词来自于生物学,在调查父母与子代身高问题的时候,发现父母如果过高的话,子女就会比父母矮一点,如果父母矮的话,子女又会比父母高,这使得身高不会向高矮俩个极端发展,而是趋于回到中心,后来做统计的时候引入统计学 ...

Mon Aug 10 05:35:00 CST 2020 0 1037
】Spark之机器学习(Python版)(二)——分类

  写这个系列是因为最近公司在搞技术分享,学习Spark,我的任务是讲PySpark的应用,因为我主要用Python,结合Spark,就讲PySpark了。然而我在学习的过程中发现,PySpark很鸡肋(至少现在我觉得我不会拿PySpark做开发)。为什么呢?原因 ...

Tue May 31 23:33:00 CST 2016 4 10393
】Spark之机器学习(Python版)(一)——聚类

   kmeans聚类相信大家都已经很熟悉了。在Python里我们用kmeans通常调用Sklearn包(当然自己写也很简单)。那么在Spark里能不能也直接使用sklean包呢?目前来说直接 ...

Fri May 06 22:56:00 CST 2016 8 14537
机器学习中比较重要的几个概念

一、Python1、NumpyNumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。 2、Pa ...

Thu Feb 28 20:55:00 CST 2019 0 711
机器学习几个知识点记录(转)

的复杂度。测试误差和训练误差之间差一个规则项,其公式为:      模型越复杂说明模型越不稳定,学习到 ...

Fri Aug 26 05:29:00 CST 2016 0 1468
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM