做完 Kaggle 比賽已經快五個月了,今天來總結一下,為秋招做個准備。 題目要求:根據主辦方提供的超過 4 天約 2 億次的點擊數據,建立預測模型預測用戶是否會在點擊移動應用廣告后下載應用程序。 數據集特點: 數據量很大,有 2 億條之多 數據是不平衡的,點擊下載的數量 ...
參賽歷程 比賽時間: . . 歷時一個多月,無論是知識眼界還是心態方面,都有了較大的改變。剛開始選這個賽題,沒有什么特別的地方,順眼就是了。直到着手准備這個比賽的時候,才發現,事情並不簡單,雖然數據集只有訓練集和測試集以及一個提交結果的樣本, 但是數據沒有任何的說明, 數據應該都是從客戶那里收集的,所以主辦方為了保護客戶的隱私,做了脫敏處理 除了ID code都是數值型的數據,可是它們代表的是什么 ...
2019-04-12 15:48 0 575 推薦指數:
做完 Kaggle 比賽已經快五個月了,今天來總結一下,為秋招做個准備。 題目要求:根據主辦方提供的超過 4 天約 2 億次的點擊數據,建立預測模型預測用戶是否會在點擊移動應用廣告后下載應用程序。 數據集特點: 數據量很大,有 2 億條之多 數據是不平衡的,點擊下載的數量 ...
Kaggle比賽心得 轉 最近參加了兩場Kaggle比賽,收獲頗多,一直想寫篇文章總結一下。接觸Kaggle到現在不到一年,比賽成績一個銀牌 ...
先看這個 kaggle數據集下載 -------------------------------- 有時發現下載不了kaggle數據 關於kaggle沒有辦法下載數據集dataset問題 安裝kaggle庫時又出現time out的情況? pip 下載報"connection ...
比賽介紹 這是M5預測挑戰賽的兩個互補比賽之一。你能盡可能准確地估計沃爾瑪在美國銷售的各種產品的單位銷售額嗎?如果你對估計同一系列已實現值的不確定性分布感興趣,一定要查看它的競爭對手 一家商店一年內每月能賣多少露營用具?對於外行來說,在這個水平上計算銷售額似乎和預測天氣一樣困難。這兩種預測 ...
from: 七月在線 電商推薦與銷量預測相關案例 一、預測用戶對哪個事件感興趣(感興趣不一定去參加) 用戶歷史參加事件、社交信息、瀏覽信息(app)、要預測的事件 recall:召回率 准確 ...
Titanic是kaggle上一個練手的比賽,kaggle平台提供一部分人的特征,以及是否遇難,目的是預測另一部分人是否遇難。目前抽工作之余,斷斷續續弄了點,成績為0.79426。在這個比賽過程中,接觸並了解了一些數據挖掘比賽的基本流程,現記錄一下。 1. 分析數據 ...
現如今,深度學習方法成了解決nlp任務的首選方案,比如textCNN、LSTM、GRU、BiLSTM、Attention、BERT等等。當然,有的nlp任務也可以用機器學習方法去解決,至於哪種任務用哪 ...
Kaggle 比賽技巧 多種的模型融合 公開訓練集交叉驗證的結果CV SCORE作為模型性能指標 TTA (Test Time Augmentation) 對測試集進行數據增強(Image)或微小修改(Raw Data),然后進行多次預測,得到多個測試集預測 ...