标签【数据挖掘】

什么是熵(Entropy) 简单来说，熵是表示物质系统状态的一种度量，用它老表征系统的无序程度。熵越大，系统越无序，意味着系统结构和运动的不确定和无规则；反之，，熵越小，系统越有序，意味着具有确定和 ...

pandas dataframe在指定的位置添加一列, 或者一次性添加几列，re

　　相信有很多人收这个问题的困扰，如果你想一次性在pandas.DataFrame里添加几列，或者在指定的位置添加一列，都会很苦恼找不到简便的方法；可以用到的函数有df.reindex, pd.con ...

微软新神器-Power BI横空出世，一个简单易用，还用得起的BI产品，你还在等什么？？？

　　在当前互联网，由于大数据研究热潮，以及数据挖掘，机器学习等技术的改进，各种数据可视化图表层出不穷，如何让大数据生动呈现，也成了一个具有挑战性的可能，随之也出现了大量的商业化软件。今天就给大家介绍一款逆天Power BI可视化工具。逆天的不仅仅是工具，还有其使用门槛和价格 ...

手把手教你使用ADB卸载手机内置App软件

【一、前言】不知道你们有没有那么一段黑暗时期，刚买个手机，手机上内置一堆app，还卸载不掉，然后每天各种广告，手机一共1G的运行内存，那些流氓app还要再占走一些内存，真是让人欲哭无泪啊，后来我就 ...

机器学习&数据挖掘笔记_16（常见面试之机器学习算法思想简单梳理）

　　前言：　　找工作时（IT行业），除了常见的软件开发以外，机器学习岗位也可以当作是一个选择，不少计算机方向的研究生都会接触这个，如果你的研究方向是机器学习/数据挖掘之类，且又对其非常感兴趣的话，可以考虑考虑该岗位，毕竟在机器智能没达到人类水平之前，机器学习可以作为一种重要手段 ...

Python之如何删除pandas DataFrame的某一/几列

删除pandas DataFrame的某一/几列：方法一：直接del DF['column-name'] 方法二：采用drop方法，有下面三种等价的表达式： 1. DF= DF.d ...

数据挖掘-聚类分析（Python实现K-Means算法）

概念：聚类分析（cluster analysis ）：是一组将研究对象分为相对同质的群组（clusters）的统计分析技术。聚类分析也叫分类分析，或者数值分类。聚类的输入是一组未被标记的样本，聚类 ...

使用sklearn优雅地进行数据挖掘

目录 1 使用sklearn进行数据挖掘 　　1.1 数据挖掘的步骤　　1.2 数据初貌　　1.3 关键技术2 并行处理　　2.1 整体并行处理　　2.2 部分并行处理3 流水线处理4 自动化调参5 持久化6 回顾7 总结8 参考资料 1 使用sklearn进行数据挖掘 1.1 ...

时间序列模式（ARIMA）---Python实现

时间序列分析的主要目的是根据已有的历史数据对未来进行预测。如餐饮销售预测可以看做是基于时间序列的短期数据预测，预测的对象时具体菜品的销售量。 1.时间序列算法：常见的时间序列 ...

数据标准化/归一化normalization

转自：数据标准化/归一化normalization 这里主要讲连续型特征归一化的常用方法。离散参考[数据预处理：独热编码（One-Hot Encoding）]。基础知识参考 ...

相关标签