基础篇 矩阵背后的现实意义 概率分布 无约束最优化方法 拉格朗日乘子法和KKT条件 推荐 相关性检验 协同过滤推荐算法 分类 朴素贝叶斯 LR SVM 聚类 KMeans DBScan CHAMELEON GMM 决策树 ID3 C4.5 ...
先甩片汤话:不知怎么的,就从纯工科的学业到管理工作岗位,又进入了数据挖掘的学习。一切都是从头学起,不会写代码, 本科学的C ,也只记得课程的名字 ,数学也多年未动,离散数学从未接触,这条路步履维艰。 啥也不说了,有时间抱怨,不如迅速开干,用了一个月不到,首先明确自己哪里不足 其实就是哪里都不足 ,把自己要补足的东西先码在这,东西有点多,变身 拼了 P.S:平时上班,工作也很忙。按照这个计划,已经进 ...
2016-01-27 17:23 1 6684 推荐指数:
基础篇 矩阵背后的现实意义 概率分布 无约束最优化方法 拉格朗日乘子法和KKT条件 推荐 相关性检验 协同过滤推荐算法 分类 朴素贝叶斯 LR SVM 聚类 KMeans DBScan CHAMELEON GMM 决策树 ID3 C4.5 ...
1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题? A.关联规则发现 B.聚类 C.分类 D.自然语言处理 2.以下两种描述分别对应哪两种对分类算法的评价标准? (a)警察抓小偷,描述警察抓的人 ...
Pandas介绍(panel + data + analysis) 为什么使用Pandas 便捷的数据处理能力 读取文件方便 封装了Matplotlib、Numpy的画图和计算 Pandas的核心数据 ...
数据挖掘(Data Mining)作为一个领域,比机器学习要大,偏应用。互联网公司也大量使用数据挖掘技术,作为即将毕业进入互联网公司从事机器学习算法开发的我,最近计划系统了解一下这方面的理论和技术。作为一个习惯,学习一个东西之前总要上网找找学习资源(网站,书籍,学术期刊会议),以保证学到 ...
四种主要的数据挖掘任务: 1、预测建模任务 分类:用于预测离散的目标变量 回归:用于预测连续的目标变量 2、关联分析 3、聚类分析 4、异常检测 主要的数据质量问题:存在噪声和离群点,数据遗漏、不一致或重复,数据有偏差,或者在别的方面,数据不代表描述所设 ...
2-1数据对象与属性类型 数据集由数据对象组成。一个数据对象代表一个实体。例如,在销售数据库中,对象可以是顾客、商品或销售•,在医疗数据库中,对象可以是患者;在大学的数据库中,对象可以是学生、教授和课程。通常,数据对象用属性描述。数据对象又称样本、实例、数据点或对象。如果数据对象存放在数据库中 ...
1.用R计算数据基本统计量(均值) 学习机器学习和数据挖掘中的各种算法和模型,需要掌握统计学的基本概念。统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,并预测对象未来走势的一门综合性科学。 简单说,统计学是根据样本估计总体的科学。它的一些思想和大数据思想有些相悖,不关注数据 ...
谈谈数据挖掘和机器学习 又是好长时间没有写博客了,最近周末事情太多,明天劳动节终于可以让我们劳动人民休息一天了。首先声明的是本人并非数据挖掘和机器学习的高手,只是作为业余兴趣刚刚开始研究,据我所知好多朋友也和我一样对这方面的东西感兴趣,个人认为机器人技术是未来发展的方向。虽然我的专业是软件开发 ...