模型的迭代试错过程(迭代方法): 迭代策略可以很好地扩展到大型数据集,因此在机器学习中的应用非常 ...
降低维度的方法 选择特征 从原有的特征中挑选出对结果影响最大的特征 抽取特征 将数据从高维度空间投影到低维度空间 一 选择特征 移除低变异数的特征 假设某特征的特征值只有 和 ,并且在所有输入样本中, 的实例的该特征取值都是 ,那就可以认为这个特征作用不大。如果 都是 ,那这个特征就没意义了。当特征值都是离散型变量的时候这种方法才能用,如果是连续型变量,就需要将连续变量离散化之后才能用。而且实际当 ...
2019-01-06 18:24 0 821 推荐指数:
模型的迭代试错过程(迭代方法): 迭代策略可以很好地扩展到大型数据集,因此在机器学习中的应用非常 ...
推荐算法在互联网行业的应用非常广泛,今日头条、美团点评等都有个性化推荐,推荐算法抽象来讲,是一种对于内容满意度的拟合函数,涉及到用户特征和内容特征,作为模型训练所需维度的两大来源,而点击率,页面停留时间,评论或下单等都可以作为一个量化的 Y 值,这样就可以进行特征工程,构建出一个数据集,然后选择 ...
数据降维的目的:数据降维,直观地好处是维度降低了,便于计算和可视化,其更深层次的意义在于有效信息的提取综合及无用信息的摈弃。 数据降维的好处:降维可以方便数据可视化+数据分析+数据压缩+数据提取等。 降维方法 __ 属性选择:过滤法;包装法;嵌入法; |_ 映射方法 _线性映射 ...
1. 机器学习来龙去脉 1.1 人类智能与人工智能 人类具备智能,可以学习、思考以及创新,能够做到很多机器做不到的事情。 在计算机(Computer)被研发出来不久后,为降低人类工作负担,一些专家早在1950年提出了人工智能(Artificial Intelligent,AI ...
核方法 目录 核方法 拉格朗日乘子法 等式约束条件 不等式约束条件 最大间隔(margin maximization) 问题描述 前序 SVM 最大 ...
采样方法 目录 采样方法 Inverse CDF 接受-拒绝采样(Acceptance-Rejection Sampling) 蒙特卡洛方法 重要性采样: MCMC(Markov Chain Monte ...
1.决策树算法 决策树是一种树形分类结构,一棵决策树由内部结点和叶子结点构成,内部结点代表一个属性(或者一组属性),该结点的孩子代表这个属性的不同取值;叶子结点表示一个类标。决策树保证每一个实例 ...
大类 名称 关键词 有监督分类 决策树 信息增益 分类回归树 ...