或文件进行分组和归类 文本分类:对片段、段落或文件进行分组和归类,在使用数据挖掘分类方法的基础上,经过 ...
第一章 机器学习的基础 . 编程语言与开发环境 . . Python 安装 略 . . Python安装包的安装:可以选选择安装集成包anaconda 略 . . IDE配置及安装测试 IDE选择UltraEdit高级文本编辑器,配置步骤如下: 选择 高级 gt 用户工具 命令,如图 . 所示。 图 . 配置UltraEdit步骤 在如图 . 所示输入各项参数,然后单击 应用按钮 图 . 配置Ul ...
2016-12-23 23:51 3 2630 推荐指数:
或文件进行分组和归类 文本分类:对片段、段落或文件进行分组和归类,在使用数据挖掘分类方法的基础上,经过 ...
贝叶斯统计都是以条件概率,联合概率为基础的,所以我们从概率,条件概率,联合概率开始,然后到贝叶斯定理,最后讲一个贝叶斯的应用--垃圾邮件的过滤 概率:事件发生的可能性,比如抛一枚硬币,正面向上的可能性有50%,掷色子点数为6的可能性为1/6。我们用符号表示为P(A) 条件概率:满足某些条件下 ...
第一篇博客,想给自己的学习加深记忆。看到书中第一个公式时,本来想直接看证明结果就好,然鹅。。。作者在备注上写:这里只用到一些非常基础的数学知识,只准备读第一章且有“数学恐惧”的读者可跳过。。。嘤嘤嘤,不服气,想弄明白一些。 就看到了知乎的这篇文章,算是我的启蒙文章了,感激。https ...
本章介绍了机器学习的一些基本概念,已经应用场景。这部分知识在其它地方也经常看到,不再赘述。 这里只记录一些作者提到的,有趣的知识点。 回归(regression)名字的来源:这是由Francis Galton引入的一个统计学术语,当时他在研究这一现象:个子很高的人,其子女一般会比他们低 ...
第1章 机器学习基础 机器学习 概述 机器学习就是把无序的数据转换成有用的信息。 获取海量的数据 从海量数据中获取有用的信息 我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的意义。 机器学习 场景 机器学习已应用于多个领域,远远超出大多数人的想象 ...
知道某个算法,和运用一个算法是两码事儿。 当你训练出数据后,发觉模型有太大误差,怎么办? 1)获取更多的数据。也许有用吧。 2)减少特征维度。你可以自己手动选择,也可以利用诸如PCA等数学方法。 3)获取更多的特征。当然这个方法很耗时,而且不一定有用。 4)添加多项式特征。你在抓 ...
博士) 基础:GBDT 所属:boosting迭代型、树类算法。 适用范围:分类、回归 ...
机器学习正在迅速改变我们的世界。我们几乎每天都会读到机器学习如何改变日常的生活。 人工智能和大数据时代,解决最有挑战性问题的主流方案是分布式机器学习! 《分布式机器学习:算法、理论与实践》电子书资料全面介绍分布式机器学习的现状,深入分析其中的核心技术问题,并且讨论该领域未来 ...