已经一年多没有做应用软件的的事情了,更别说Web方面了,最近一直在研究系统级的开发,前段时间研究编译工程,写了一门简单的编程语言,想把它实现为基于面向对象的Matlab语言,但是时间的限制太多了...今天上午花了1个小时,写了Kmeans,算是回顾曾经学过的算法,实现的方式很简答,没有采用 ...
一 背景 煤矿地磅产生了一系列数据: 我想从这些数据中,取出最能反映当前车辆重量的数据 有很多数据是车辆上磅过程中产生的数据 。我于是想到了聚类算法KMeans,该算法思想比较简单。 二 算法步骤 从样本中随机取出k个值,作为初始中心 以k个中心划分这些数据,分为k个组 重新计算出每个组的中心,作为新中心 如果初始中心和新中心不相等,则把新中心作为初始中心,重复 , 。反之,结束 注意: 我没有用 ...
2019-07-23 12:00 0 394 推荐指数:
已经一年多没有做应用软件的的事情了,更别说Web方面了,最近一直在研究系统级的开发,前段时间研究编译工程,写了一门简单的编程语言,想把它实现为基于面向对象的Matlab语言,但是时间的限制太多了...今天上午花了1个小时,写了Kmeans,算是回顾曾经学过的算法,实现的方式很简答,没有采用 ...
目录 算法分类 一、PageRank 原理 比喻说明 二、Apriori(关联分析) 原理 比喻说明 三、AdaBoost 原理 比喻说明 四、C4.5(决策树 ...
的感觉。 本文,主要想简单介绍下数据挖掘中的算法,以及它包含的类型。然后,通过现实中触手可及的、活生生 ...
数据挖掘算法与现实生活中的应用案例 如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不 ...
一、单个特征的EDA 对于 binary feature 和 categorical feature,train['feature_name'].value_counts().sort_in ...
前言 用python实现了一个没有库依赖的“纯” py-based PrefixSpan算法。 Github 仓库 https://github.com/Holy-Shine/PrefixSpan-py 首先对韩老提出的这个数据挖掘算法不清楚的可以看下这个博客,讲解非常细致 ...
数据挖掘算法总结 1.分类算法 所谓分类,简单来说,就是根据文本的特征或属性,划分到已有的类别中。常用的分类算法包括:决策树分类法,朴素的贝叶斯分类算法(native Bayesian classifier)、基于支持向量机(SVM)的分类器,神经网络法,k-最近邻法(k-nearest ...
一、概念 关联(Association) 关联就是把两个或两个以上在意义上有密切联系的项组合在一起。 关联规则(AR,Assocaition Rules) 用于从大量数据中挖掘出有价值的数据项之间的相关关系。(购物篮分析) 协同过滤(CF,Collaborative Filtering ...