随着Hadoop等大数据的出现和技术的发展,机器学习越来越多地进入人们的视线。 其实早Hadoop之前,机器学习和数据挖掘已经存在,作为一个单独的学科,为什么hadoop之后出现,机器学习是如此引人注目了?因是hadoop的出现使非常多人拥有了处理海量数据的技术支撑。进而发现 ...
机器学习 课程使用Kevin P. Murphy图书 Machine Learning A Probabilistic Perspective 本英语教材,本书从一个独特的数学概率论的角度解释机器学习的所有问题,要较强的数学基础。由于是英文教材。特开一个专题在此记录自己的学习过程和各种问题。以供备忘和举一反三之用。 在解说了机器学习的概述之后。第二章紧接着就開始讲述概率论的知识,通过兴许的学习会 ...
2015-09-14 16:17 0 4834 推荐指数:
随着Hadoop等大数据的出现和技术的发展,机器学习越来越多地进入人们的视线。 其实早Hadoop之前,机器学习和数据挖掘已经存在,作为一个单独的学科,为什么hadoop之后出现,机器学习是如此引人注目了?因是hadoop的出现使非常多人拥有了处理海量数据的技术支撑。进而发现 ...
常见分布 正态分布: 标准正态分布: 对数正态分布: 均匀分布: 指数分布: 伽玛分布:,其中 分布: 设是来自正态总体的一个样本,则 若是来自标准正态分布 ...
一、引言 最近写了许多关于机器学习的学习笔记,里面经常涉及概率论的知识,这里对所有概率论知识做一个总结和复习,方便自己查阅,与广大博友共享,所谓磨刀不误砍柴工,希望博友们在这篇博文的帮助下,阅读机器学习的相关文献时能够更加得心应手!这里只对本人觉得经常用到的概率论知识点做一次小结,主要是基本概念 ...
概率论的一些基础知识 条件概率 \(P(B|A) = \frac{1}{3}\) 表示的意思为当A发生的时候,B发生的概率 有公式 \[P(B|A) = \frac{P(AB)}{P(A)} \] \[P(AB) = P(B|A)*P(A)=P(A|B)*P(B ...
微积分是现代数学的基础,线性代数,矩阵论,概率论,信息论,最优化方法等数学课程都需要用到微积分的知识。单就机器学习和深度学习来说,更多用到的是微分。积分基本上只在概率论中被使用,概率密度函数、分布函数等概念和计算都要借助于积分来定义或计算。 几乎所有的机器学习算法在训练或者预测时都是 ...
1.再提逻辑回归 前面已经讲过了逻辑回归,这里不再细讲,只是简单的说一个函数,主要是方便大家更好的理解概率校准。 在逻辑回归中,用的最多的就是sigmod函数,这个函数的作用就是把无限大或者无限小的数据压缩到[0,1]之间,用来估计概率。图像大致为: 基本上是以0.5分界 ...
的技术(词汇)都没学习呢,咋突然冒出来一个pandas就要在机器学习中占了大部分精力去处理呢?其实啊,同 ...
CPD是conditional probability distribution的缩写,翻译成中文叫做 条件概率分布。在概率图中,条件概率分布是一个非常重要的概念。因为概率图研究的是随机变量之间的练习,练习就是条件,条件就要求条件概率。 对于简单的条件概率而言,我们可以用一个条件概率表 ...