19-1-15更新,后面改了做法所以随笔烂尾了,具体内容不用看,想参考的可以看下面的参考链接 另外提供数据集在百度云,希望能帮到大家 链接: https://pan.baidu.com/s/1ojjVqjXS0cP2KAAyC-tsxg 提取码: semp 一、前言 ...
年前做的,也是学习别人的作品作为记录 一 赛题 表 :sku基本信息表 jdata sku basic info 表 :用户基本信息表 jdata user basic info 表 :用户行为表 jdata user action 表 :用户订单表 jdata user order 表 :评论分数数据表 jdata user comment score 数据说明: 任务: 根据提供的数据,预测未 ...
2019-02-15 21:04 0 616 推荐指数:
19-1-15更新,后面改了做法所以随笔烂尾了,具体内容不用看,想参考的可以看下面的参考链接 另外提供数据集在百度云,希望能帮到大家 链接: https://pan.baidu.com/s/1ojjVqjXS0cP2KAAyC-tsxg 提取码: semp 一、前言 ...
1 了解赛题 - 赛题概况 - 数据概况 - 预测指标 - 分析赛题 1.1 赛题概况 本次比赛任务是利用历史数据并结合地图信息,预测五和张衡交叉路口未来一周周一(2019年2月11日)和周四(2019年2月14日)两天的5:00-21:00通 ...
1. 股市就是个复杂系统,复杂系统是不可精细预估的。 2. 数据的作用不是让每个人都能赚钱吧,而是让使用数据的人在博弈中更容易战胜不使用数据的人。例如彭博社,它的数据工具年费数万美元,但很多人都在购买使用 3. 高频交易更多不是大数据,而是优先于别人先一步得到信息;好多自动交易系统,是基于事件 ...
Reference: http://blog.csdn.net/witnessai1/article/details/52612012 Kaggle是一个数据分析的竞赛平台,网址:https://www.kaggle.com/ 企业或者研究者可以将数据、问题描述、期望的指标发布 ...
Kaggle大数据竞赛平台入门 大数据竞赛平台,国内主要是天池大数据竞赛和DataCastle,国外主要就是Kaggle.Kaggle是一个数据挖掘的竞赛平台,网站为:https://www.kaggle.com/.很多的机构,企业将问题,描述,期望发布在Kaggle上,以竞赛的方式向广大的数据 ...
分类:海量数据处理面试题 1.海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到ip是32位的,最多有个2^32个ip。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,在找出每个 ...
http://mp.weixin.qq.com/s?__biz=MzA3MDg0MjgxNQ==&mid=208451006&idx=1&sn=532e41cf020a06737ef7fc7f570d3b7a&scene=0#rd 资金流入流出预测 赛题简介蚂蚁 ...
一、赛题理解 本次比赛任务是利用历史数据并结合地图信息 预测五和张衡交叉路口 未来一周 周一(2019年2月11日)和周四(2019年2月14日)两天 的5:00-21:00通过wuhe_zhangheng路口4个方向的车流量总和。 要求模型输出 ...