原文:基于Hive的对BiliBili用户信息进行数据分析

用户表字段信息: .查出前 位用户的用户名,关注数和粉丝数。 .查询关注数大于 的用户的用户名和关注数。 .查询粉丝数大于 的用户的用户名,粉丝数。 .查询id为 的用户的用户名。 .查询性别为女的用户的用户名。 select name,sex from bilibili user where sex 女 .查询性别为男的用户的用户名。 select name,sex from bilibili ...

2019-06-21 00:13 0 822 推荐指数:

查看详情

Python分布式爬虫抓取知乎用户信息进行数据分析

在以前的文章中,我写过一篇使用selenium来模拟登录知乎的文章,然后在很长一段时间里都没有然后了。。。 不过在最近,我突然觉得,既然已经模拟登录到了知乎了,为什么不继续玩玩呢?所以就创了一个项目,用来采集知乎的用户公开信息,打算用这些数据试着分析一下月入上万遍地走、清华北大不如狗的贵乎用户 ...

Sat Mar 09 06:54:00 CST 2019 3 1664
用Python进行数据分析-1

第一章 准备工作 1.3 重要的python数据库 Numpy:是python科学计算的基础包,本书大部分内容都基于numpy以及构建于其上的库功能如下: -快速高效的多维数组对象ndarray。 -用于对数组执行元素级计算以及直接对数组执行数学运算的函数 -用于读写硬盘上基于数组的数据 ...

Wed Mar 14 03:35:00 CST 2018 0 1009
爬虫:python采集豆瓣影评信息进行数据分析

前言:最近比较有时间,替一个同学完成了一个简单的爬虫和数据分析任务,具体的要求是爬取复仇者联盟4 的豆瓣影评信息进行简单的数据分析,这里的数据分析指的是提取关键词并进行词云分析以及按照时间进行热度分析分析比较简单,后续可以继续完善。 首先,献上数据采集和分析的结果。 短评数据 ...

Mon Jul 06 05:20:00 CST 2020 0 971
用python进行数据分析(二:数据处理)

四、数据处理 (1)缺失值 查看缺失情况: 删除缺失值: 利用sklearn替换缺失值。当缺失值为数值型数据时,可用利用均值来替换 利用pandas替换缺失值(常用) 一个实例(https://blog.csdn.net ...

Tue May 28 22:48:00 CST 2019 0 1736
像Excel一样使用python进行数据分析

Excel是数据分析中最常用的工具,本篇文章通过python与excel的功能对比介绍如何使用python通过函数式编程完成excel中的数据处理及分析工作。在Python中pandas库用于数据处理 ,我们从1787页的pandas官网文档中总结出最常用的36个函数,通过这些函数介绍 ...

Fri Mar 01 18:52:00 CST 2019 0 3796
如何用python进行数据分析

、Python数据分析流程及学习路径 数据分析的流程概括起来主要是:读写、处理计算、分析建模和可视化四个部分。在不同的步骤中会用到不同的Python工具。每一步的主题也包含众多内容。 根据每个部分需要用到的工具,Python数据分析的学习路径如下: 相关推荐:《Python入门教程 ...

Fri Dec 18 22:12:00 CST 2020 0 890
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM