一、前言 虽然一直算IT男,但是基本没有接触过最前沿的IT知识,一直在做生产方面的IT,突发奇想,开始学习算法,学习算法有半年多了,从最初的Python,到线性回归、逻辑回归、SVM,聚类,NL ...
一.材料准备 https: www.kaggle.com c titanic gettingStarted 二.提出问题 生存率和哪些因素有关 性别,年龄,是否有伴侣,票价,舱位等级,包间,出发地点 .乘客的年龄和票价的分布 .样本生存的几率是多少 .乘客的性别比例 .乘客的舱位分布 .性别和生还有没有关系 .舱位等级和生还有没有关系 .年龄和生还有没有关系 .出发地点和生存率有没有关系 .票价和 ...
2017-10-17 16:53 0 1394 推荐指数:
一、前言 虽然一直算IT男,但是基本没有接触过最前沿的IT知识,一直在做生产方面的IT,突发奇想,开始学习算法,学习算法有半年多了,从最初的Python,到线性回归、逻辑回归、SVM,聚类,NL ...
1. 引入所有需要的包 2. 读入数据源 3. 分析数据 总结:所有的数据中一共包括12个变量,其中7个是数值变量,5个是属性变量 PassengerId(忽略):这是乘客的编号,显然对乘客是否幸存完全没有任何作用 ...
Titanic是kaggle上的一道just for fun的题,没有奖金,但是数据整洁,拿来练手最好不过啦。 这道题给的数据是泰坦尼克号上的乘客的信息,预测乘客是否幸存。这是个二元分类的机器学习问题,但是由于数据样本相对较少,在当时慌乱的情况下幸存者有一定的随机性,还是有一定挑战的。https ...
数据分析的概念 什么是数据分析 就是从现有的数据中挖掘出价值 数据分析应用领域 商品推荐 eg:在淘宝上搜索了一款产品之后,接下来就会疯狂给你推荐相关产品 量化交易 股票,期货等数据分析 短视频推送 抖音,今日头条等短视频 (数据分析 ...
百度搜索大数据,就会发现这是一个日均搜索达到4000K的热词,在头条上也是如此,只增不降。  第三章:Numpy 01 Numpy → B站视频链接(p4-p9) 第四章:Pandas 01 Pandas → B站视频链接 ...
概要 数据分析的概念 数据分析三剑客简介 ipython模块 jupyter模块 Anaconda软件使用 详细 数据分析的概念 数据分析就是从现有的数据中挖掘出需要的价值。 数据分析应用领域 1、商品推荐:在淘宝等电商平台 ...