19-1-15更新,后面改了做法所以隨筆爛尾了,具體內容不用看,想參考的可以看下面的參考鏈接 另外提供數據集在百度雲,希望能幫到大家 鏈接: https://pan.baidu.com/s/1ojjVqjXS0cP2KAAyC-tsxg 提取碼: semp 一、前言 ...
年前做的,也是學習別人的作品作為記錄 一 賽題 表 :sku基本信息表 jdata sku basic info 表 :用戶基本信息表 jdata user basic info 表 :用戶行為表 jdata user action 表 :用戶訂單表 jdata user order 表 :評論分數數據表 jdata user comment score 數據說明: 任務: 根據提供的數據,預測未 ...
2019-02-15 21:04 0 616 推薦指數:
19-1-15更新,后面改了做法所以隨筆爛尾了,具體內容不用看,想參考的可以看下面的參考鏈接 另外提供數據集在百度雲,希望能幫到大家 鏈接: https://pan.baidu.com/s/1ojjVqjXS0cP2KAAyC-tsxg 提取碼: semp 一、前言 ...
1 了解賽題 - 賽題概況 - 數據概況 - 預測指標 - 分析賽題 1.1 賽題概況 本次比賽任務是利用歷史數據並結合地圖信息,預測五和張衡交叉路口未來一周周一(2019年2月11日)和周四(2019年2月14日)兩天的5:00-21:00通 ...
1. 股市就是個復雜系統,復雜系統是不可精細預估的。 2. 數據的作用不是讓每個人都能賺錢吧,而是讓使用數據的人在博弈中更容易戰勝不使用數據的人。例如彭博社,它的數據工具年費數萬美元,但很多人都在購買使用 3. 高頻交易更多不是大數據,而是優先於別人先一步得到信息;好多自動交易系統,是基於事件 ...
Reference: http://blog.csdn.net/witnessai1/article/details/52612012 Kaggle是一個數據分析的競賽平台,網址:https://www.kaggle.com/ 企業或者研究者可以將數據、問題描述、期望的指標發布 ...
Kaggle大數據競賽平台入門 大數據競賽平台,國內主要是天池大數據競賽和DataCastle,國外主要就是Kaggle.Kaggle是一個數據挖掘的競賽平台,網站為:https://www.kaggle.com/.很多的機構,企業將問題,描述,期望發布在Kaggle上,以競賽的方式向廣大的數據 ...
分類:海量數據處理面試題 1.海量日志數據,提取出某日訪問百度次數最多的那個IP。 首先是這一天,並且是訪問百度的日志中的IP取出來,逐個寫入到一個大文件中。注意到ip是32位的,最多有個2^32個ip。同樣可以采用映射的方法,比如模1000,把整個大文件映射為1000個小文件,在找出每個 ...
http://mp.weixin.qq.com/s?__biz=MzA3MDg0MjgxNQ==&mid=208451006&idx=1&sn=532e41cf020a06737ef7fc7f570d3b7a&scene=0#rd 資金流入流出預測 賽題簡介螞蟻 ...
一、賽題理解 本次比賽任務是利用歷史數據並結合地圖信息 預測五和張衡交叉路口 未來一周 周一(2019年2月11日)和周四(2019年2月14日)兩天 的5:00-21:00通過wuhe_zhangheng路口4個方向的車流量總和。 要求模型輸出 ...