原文:(数据科学学习手札127)在Python中使用icecream实现高效debug

本文示例代码及文件已上传至我的Github仓库https: github.com CNFeffery DataScienceStudyNotes 简介 尽管有那么多花里胡哨的debug工具和方式供我们选择,但不得不承认,在大多数情况下,print 才是最方便的代码调试方式 ,通过手动在程序中的关键位置书写合适的打印语句,可以很快速地帮助我们了解到程序运行的过程,发现问题所在。 而icecream ...

2021-08-24 17:27 0 206 推荐指数:

查看详情

数据科学学习手札65)利用Python实现Shp格式向GeoJSON的转换

一、简介   Shp格式是GIS中非常重要的数据格式,主要在Arcgis中使用,但在进行很多基于网页的空间数据可视化时,通常只接受GeoJSON格式的数据,众所周知JSON(JavaScript Object Nonation)是利用键值对+嵌套来表示数据的一种格式,以其轻量、易解析的优点 ...

Tue Jul 09 20:16:00 CST 2019 0 868
数据科学学习手札29)KNN分类的原理详解&Python与R实现

一、简介   KNN(k-nearst neighbors,KNN)作为机器学习算法中的一种非常基本的算法,也正是因为其原理简单,被广泛应用于电影/音乐推荐等方面,即有些时候我们很难去建立确切的模型来描述几种类别的具体表征特点,就可以利用天然的临近关系来进行分类; 二、原理   KNN ...

Thu Apr 26 06:11:00 CST 2018 0 1109
数据科学学习手札50)基于Python的网络数据采集-selenium篇(上)

一、简介   接着几个月之前的(数据科学学习手札31)基于Python的网络数据采集(初级篇),在那篇文章中,我们介绍了关于网络爬虫的基础知识(基本的请求库,基本的解析库,CSS,正则表达式等),在那篇文章中我们只介绍了如何利用urllib、requests这样的请求库来将我们的程序模拟成一个 ...

Fri Sep 07 23:24:00 CST 2018 0 882
数据科学学习手札31)基于Python的网络数据采集(初级篇)

一、简介   在实际的业务中,我们头的数据往往难以满足需求,这时我们就需要利用互联网上的资源来获取更多的补充数据,但是很多情况下,有价值的数据往往是没有提供源文件的直接下载渠道的(即所谓的API),这时我们该如何批量获取这些嵌入网页中的信息呢?   这时网络数据采集就派上用处了,你通过浏览器 ...

Sat May 05 06:46:00 CST 2018 0 2694
数据科学学习手札71)利用Python绘制词云图

本文对应脚本及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   词云图是文本挖掘中用来表征词频的数据可视化图像,通过它可以很直观地展现文本数据中地高频词: 图1 词云图 ...

Mon Nov 18 01:57:00 CST 2019 4 912
数据科学学习手札54)Python中retry的简单用法

一、简介   retry是一个用于错误处理的模块,功能类似try-except,但更加快捷方便,本文就将简单地介绍一下retry的基本用法。 二、基本用法 retry:   作为装饰器进行使用,不传入参数时功能如下例所示:   我们编写了每次运行都会通过raise报错 ...

Sat Feb 02 07:54:00 CST 2019 0 1217
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM