本系列文章用于汇集知识点,查漏补缺,面试找工作之用。数学公式较多,解释较少。 1.假设 2.sigmoid函数: 3.假设的含义: 4.性质: 5.找一个凸损失函数 6.可由最大似然估计推导出 单个样本正确预测的概率为 只是3两个式子合并在一起的表示方法 ...
知道某个算法,和运用一个算法是两码事儿。 当你训练出数据后,发觉模型有太大误差,怎么办 获取更多的数据。也许有用吧。 减少特征维度。你可以自己手动选择,也可以利用诸如PCA等数学方法。 获取更多的特征。当然这个方法很耗时,而且不一定有用。 添加多项式特征。你在抓救命稻草么 构建属于你自己的,新的,更好的特征。有点儿冒险。 调整正则化参数lambuda。 以上方法的尝试有些碰运气,搞不好就是浪费大把 ...
2014-08-26 18:53 0 4125 推荐指数:
本系列文章用于汇集知识点,查漏补缺,面试找工作之用。数学公式较多,解释较少。 1.假设 2.sigmoid函数: 3.假设的含义: 4.性质: 5.找一个凸损失函数 6.可由最大似然估计推导出 单个样本正确预测的概率为 只是3两个式子合并在一起的表示方法 ...
1 定义 2 直观解释 信息熵用来衡量信息量的大小 若不确定性越大,则信息量越大,熵越大 若不确定性越小,则信息量越小,熵越小 比如A班对B班,胜率一个为x,另一个为1-x 则信息熵为 -(xlogx + (1-x)log(1-x)) 求导后容易证明x=1/2时取得最大,最大值 ...
机器学习算法 什么是程序(Program) 计算机程序,是指为了得到某种结果而可以由计算机(等具有信息处理能力的装置)执行的代码化指令序列(或者可以被自动转换成代码化指令序列的符号化指令序列或者符号化语句序列)。 通俗讲,计算机给人干活,但它不是人,甚至不如狗懂人的需要(《小羊肖恩 ...
转载自:http://www.cnblogs.com/tornadomeet 朴素贝叶斯: 有以下几个地方需要注意: 1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的 ...
机器学习正在迅速改变我们的世界。我们几乎每天都会读到机器学习如何改变日常的生活。 人工智能和大数据时代,解决最有挑战性问题的主流方案是分布式机器学习! 《分布式机器学习:算法、理论与实践》电子书资料全面介绍分布式机器学习的现状,深入分析其中的核心技术问题,并且讨论该领域未来 ...
)。 本文根据最近学习机器学习书籍 网络文章的情况,特将一些学习思路做了归纳整理,详情如下.如有不当之处,请各 ...
是否在人类监督下进行训练(监督,无监督和强化学习) 在机器学习中,无监督学习就是聚类,事先不知道样本的类别,通过某种办法,把相似的样本放在一起归位一类;而监督型学习就是有训练样本,带有属性标签,也可以理解成样本有输入有输出。 所有的回归算法和分类算法都属于监督学习。回归和分类的算法区别在于输出 ...
总而言之,我们可以通过问自己算法需要解决什么问题,进而发现算法的正确分类。 上面这张图包含了一些我们还没有讨论的技术术语: 分类(Classification):当数据被用来预测一个分类,监督学习也被称为分类。这是一个例子当指定一张相作为“猫”或“狗”的图片。当只有两种选择时,称为 ...