原文:(数据科学学习手札71)利用Python绘制词云图

本文对应脚本及数据已上传至我的Github仓库https: github.com CNFeffery DataScienceStudyNotes 简介 词云图是文本挖掘中用来表征词频的数据可视化图像,通过它可以很直观地展现文本数据中地高频词: 图 词云图示例 在Python中有很多可视化框架可以用来制作词云图,如pyecharts,但这些框架并不是专门用于制作词云图的,因此并不支持更加个性化的制 ...

2019-11-17 17:57 4 912 推荐指数:

查看详情

数据科学学习手札133)利用geopandas绘制拓扑着色地图

本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   我们在绘制某些地图时,为了凸显出每个独立的区域,需要满足拓扑着色要求,即所有相邻的区域不可以用同一种颜色绘制,以前的 ...

Tue Dec 28 06:56:00 CST 2021 1 1229
数据科学学习手札65)利用Python实现Shp格式向GeoJSON的转换

一、简介   Shp格式是GIS中非常重要的数据格式,主要在Arcgis中使用,但在进行很多基于网页的空间数据可视化时,通常只接受GeoJSON格式的数据,众所周知JSON(JavaScript Object Nonation)是利用键值对+嵌套来表示数据的一种格式,以其轻量、易解析的优点 ...

Tue Jul 09 20:16:00 CST 2019 0 868
数据科学学习手札55)利用ggthemr来美化ggplot2图像

一、简介   R中的ggplot2是一个非常强大灵活的数据可视化包,熟悉其绘图规则后便可以自由地生成各种可视化图像,但其默认的色彩和样式在很多时候难免有些过于朴素,本文将要介绍的ggthemr包专门针对原生ggplot2图像进行美化,掌握它之后你就可以创作出更具特色和美感的数据可视化 ...

Mon Feb 18 08:32:00 CST 2019 0 979
数据科学学习手札92)利用query()与eval()优化pandas代码

本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   利用pandas进行数据分析的过程,不仅仅是计算出结果那么简单,很多初学者喜欢在计算过程中创建一堆命名随心所欲的中间变量,一方 ...

Fri Aug 07 23:26:00 CST 2020 2 1047
数据科学学习手札50)基于Python的网络数据采集-selenium篇(上)

一、简介   接着几个月之前的(数据科学学习手札31)基于Python的网络数据采集(初级篇),在那篇文章中,我们介绍了关于网络爬虫的基础知识(基本的请求库,基本的解析库,CSS,正则表达式等),在那篇文章中我们只介绍了如何利用urllib、requests这样的请求库来将我们的程序模拟成一个 ...

Fri Sep 07 23:24:00 CST 2018 0 882
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM