数据分析入门


概要

  • 数据分析的概念

  • 数据分析三剑客简介

  • ipython模块

  • jupyter模块

  • Anaconda软件使用


详细

数据分析的概念

  数据分析就是从现有的数据中挖掘出需要的价值。

数据分析应用领域

  1、商品推荐:在淘宝等电商平台搜索一款产品后,会给你推荐更多相关产品。

  2、量化交易:实时关注股票、期货变动并分析投资策略。

  3、短视频推送:抖音、今日头条等短视频推荐会大量出现用户常看的内容。

  4、还有更多......

  数据分析是未来所有公司不可或缺的岗位。 目前社会上获取数据方式太多了,海量的数据,拥有数据分析的技能,就可以应付任何岗位上的工作。

  Python简单易学,是数据分析领域必备的语言。

数据分析的工作流程(常见的)

1、需求分析:搞清楚需要分析什么数据,以什么方式分析这些数据,想要获得什么样的结果。

2、数据采集:数据来源主要有以下三种。

  (1) 公司内部数据:直接调用即可,如MySQL,MongoDB等数据库。

  (2) 网络爬虫获取:编写一些代码,需要掌握一些爬虫相关技能。

  (3) 第三方服务:花钱购买第三方服务,让专业人员帮忙收集数据。

3、数据清洗:获得的数据不全是可用的有效数据,可能存在缺失或异常,需要对其进行校验并去除。

4、数据分析:选择相应的计算方法,建立对应的算法模型分析数据。

5、生成数据分析报告:撰写数据分析报告并分析出之后的规律或建议。

6、数据可视化:将复杂难懂的数据用图表等形式展现出来,便于查看规律,一般与数据分析报告相结合。

数据分析三剑客简介

1、第一剑:numpy

      数学计算相关的模块,是很多计算模型的底层模块

2、第二剑:pandas

      数据分析领域最为核心的模块之一,主要用于操作Excel表格

3、第三剑:matplotlib

      数据可视化相关模块

ipython模块

我们知道,在命令行窗口也可以编写Python代码,但是有下列缺陷

  1.代码没有提示

  2.代码不会自动缩进

  3.整个界面颜色单调

如何解决!!!

这个时候就需要安装ipython模块。

    pip3 install ipython

安装以后再打开命令行窗口输入ipython进入全新编程环境

  1.代码有提示

  2.代码自动缩进

  3.通篇颜色有区分

jupyter模块

1、首先安装该模块 pip3 install jupyter

2、然后在命令行输入 jupyter notebook

  会自动调用当前计算机默认浏览器打开一个网页

  调用非默认浏览器访问地址需要输入token值,启动服务的展示信息中有token值

  打开的界面取决于终端输入jupyer notebook命令的左侧路径

3、右上方是功能区域

  upload   用于上传任意类型的文件。

  new    下拉框

  python3      用于创建notebook文件

  Text File  用于创建文本文件

  Folder   用于创建文件夹

  Terminal     用于模拟cmd终端

notebook文件的注意点:

notebook文件的后缀名是.ipynb,该格式的文件无法正常双击直接打开。

需要使用专门的notebook环境,可以打开并查看内部的真实数据。

用jupyter notebook打开即可

其实该模块就可以进行数据分析相关的工作,有一个非常大的缺陷。 数据分析过程中需要使用到的其他模块都需要自己下载,并且跟数据分析相关的模块不下于200个。

Jupyter Notebook详细操作

主界面点击jupyter notebook之后无法打开浏览器打开界面原因在于 你的计算机名词含有中文

    单词

    • cell单元格
      • cut剪切
        • copy拷贝
          • paste粘贴
            • above 在...上面
              • below 在...下面
                • replace 替换
                  • delete删除
                    • undo撤销
                      • split切割
                        • merge 合并

命令行模式与编辑模式

蓝色—命令行模式 | 绿色—编辑模式

1.运行当前单元格
    CTRL + ENTER
2.运行当前单元格并选中下方的单元格
    SHIFT + ENTER
3.书写md格式标题
    (1)命令行模式下按M键,然后按照#个数控制标题格式
    (2)编辑模式先写标题文本,然后切换命令行模式按数字选择标题格式
4.在当前单元格下方新建单元格
    命令行模式下按B键
5.在当前单元格上方新建单元格
    命令行模式下按A键
6.删除单元格
    命令行模式下连续按两下D键
7.撤销删除
    命令行模式下按Z键

Anaconda软件

1、这软件内部集成了很多数据分析相关软件及功能,自动下载接近300个数据分析相关模块

2、去官网下载安装完成之后并不会在界面上生成图标 第一次需要自己搜索打开,点击电脑左下方放大镜搜索anaconda navigator点击启动即可。

3、左侧菜单栏

  Home: 是一些已经准备好的软件 有直接可以使用和下载即可使用

  Environments: 主要包含数据分析相关的模块

  Learning: 含有大量的技术教程

  Community: 含有大量技术交流平台

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM