花费 67 ms
数据归一化和两种常用的归一化方法

数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...

Wed Jul 31 18:52:00 CST 2013 0 290185
余弦距离、欧氏距离和杰卡德相似性度量的对比分析

1、余弦距离 余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。 向量,是多维空间中有方向的线段,如果两个向量的方向一致,即夹角接近零,那么这两个向 ...

Fri Jun 28 22:47:00 CST 2013 3 117543
常用聚类算法(一) DBSCAN算法

1、DBSCAN简介 DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种基于密 ...

Mon Jul 01 21:52:00 CST 2013 3 82191
【原】关于AdaBoost的一些再思考

一、Decision Stumps: Decision Stumps称为单层分类器,主要用作Ensemble Method的组件(弱分类器)。一般只进行一次判定,可以包含两个或者多个叶结点。对于离散 ...

Fri Oct 17 05:54:00 CST 2014 0 18860
N-Gram模型

N-Gram模型时大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM, Chinese Language Model)。汉语语言模型利用上下文中相邻词间的搭配信息,在需 ...

Sat Oct 19 01:17:00 CST 2013 0 11063
[转] 神经网络编程学习

神经网络编程入门 本文主要内容包括: 1、 介绍神经网络基本原理 2、 Matlab 实现前向神经网络的方法 3、 AForge.NET实现前向神经网络的方法 第0节 引例 本文以Fish ...

Tue Jun 11 23:29:00 CST 2013 0 10087
【转】关于Mahalanobis距离的笔记

Mahalanobis距离是用来度量一个点P和一个分布D之间的距离,它是衡量点P与分布D的均值之间存在多少个标准差的一个多维泛化版本。 如果P就位于分布D的均值处,则该距离为0;该距离随着P的偏离 ...

Tue Dec 09 22:19:00 CST 2014 2 7419
分类和预测

分类和预测 分类和数值预测是预测问题的两种主要类型。分类是预测分类(离散、无序的)标号,而预测则是建立连续值函数模型。 一、分类问题的步骤: 1、使用训练集建立描述预先定义的数据类或概念集的分类 ...

Thu May 23 21:29:00 CST 2013 0 9138
人工神经网络简论

一、 综述 神经网络领域最早是由心理学家和神经学家开创的,旨在开发和测试神经的计算机模拟。粗略地说,神经网络是一组连接的输入/输出单元,其中每个连接都与一个权重相关联。在学习阶段,通过调整这些权重, ...

Wed Jun 12 00:00:00 CST 2013 0 8378

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM