原文:(数据科学学习手札95)elyra——jupyter lab平台最强插件集

本文示例文件已上传至我的Github仓库https: github.com CNFeffery DataScienceStudyNotes 简介 jupyter lab是我最喜欢的编辑器,在过往的文章中也给大家介绍过很多相关资源和实用插件,但本文要给大家介绍的jupyter lab插件elyra,绝对是我使用过的最强大的jupyter lab插件没有之一,因为它的核心功能就是帮助我们解决数据分析 ...

2020-09-19 09:40 1 1642 推荐指数:

查看详情

数据科学学习手札94)QGIS+Conda+jupyter玩转Python GIS

本文完整代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   QGIS随着近些年的发展,得益于其开源免费的特点,功能不断被世界各地的贡献者们开发完善,运算速度也非常出色,使得越来越多 ...

Thu Aug 27 03:24:00 CST 2020 2 1602
数据科学学习手札27)sklearn数据集分割方法汇总

一、简介   在现实的机器学习任务中,我们往往是利用搜集到的尽可能多的样本集来输入算法进行训练,以尽可能高的精度为目标,但这里便出现一个问题,一是很多情况下我们不能说搜集到的样本集就能代表真实的全体,其分布也不一定就与真实的全体相同,但是有一点很明确,样本集数量越大则其接近真实全体的可能性也就 ...

Sun Apr 15 03:44:00 CST 2018 0 10173
数据科学学习手札81)conda+jupyter玩转数据科学环境搭建

本文示例yaml文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   我们在使用Python进行数据分析时,很多时候都在解决环境搭建的问题,不同版本、依赖包等问题经常给数据科学工作流的搭建 ...

Wed Apr 01 06:25:00 CST 2020 0 1219
数据科学学习手札50)基于Python的网络数据采集-selenium篇(上)

一、简介   接着几个月之前的(数据科学学习手札31)基于Python的网络数据采集(初级篇),在那篇文章中,我们介绍了关于网络爬虫的基础知识(基本的请求库,基本的解析库,CSS,正则表达式等),在那篇文章中我们只介绍了如何利用urllib、requests这样的请求库来将我们的程序模拟成一个 ...

Fri Sep 07 23:24:00 CST 2018 0 882
数据科学学习手札31)基于Python的网络数据采集(初级篇)

一、简介   在实际的业务中,我们头的数据往往难以满足需求,这时我们就需要利用互联网上的资源来获取更多的补充数据,但是很多情况下,有价值的数据往往是没有提供源文件的直接下载渠道的(即所谓的API),这时我们该如何批量获取这些嵌入网页中的信息呢?   这时网络数据采集就派上用处了,你通过浏览器 ...

Sat May 05 06:46:00 CST 2018 0 2694
数据科学学习手札21)sklearn.datasets常用功能详解

作为Python中经典的机器学习模块,sklearn围绕着机器学习提供了很多可直接调用的机器学习算法以及很多经典的数据集,本文就对sklearn中专门用来得到已有或自定义数据集的datasets模块进行详细介绍; datasets中的数据集分为很多种,本文介绍几类常用的数据集生成方法,本文总结 ...

Sun Apr 01 22:51:00 CST 2018 0 7723
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM